期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何军黄永勤朱英《计算机科学》2013,40(8):28-33

针对传统浮点融合乘加器会增加独立浮点加减法、乘法等运算延迟的缺点,首先设计并实现了一种分离通路浮点乘加器SPFMA,通过分离乘法和加法通路,在保持融合乘加运算延迟6拍延迟不变的情况下,将独立乘法和加法等运算延迟由6拍减为4拍,克服了传统融合乘加器的缺点。然后经专用工艺单元库逻辑综合评估,SPFMA可工作在1.2GHz以上,面积60779.44um²。最后在硬件仿真加速器平台上运行SPEC CPU2000浮点测试课题对其进行性能评估,结果表明所有浮点课题性能均有所提高,最大提高5.25％,平均提高1.61％,证明SPFMA可进一步提高浮点性能。相似文献

2.

一种改进的浮点乘加器结构的延时分析*

靳战鹏沈绪榜田芳芳《计算机应用研究》2006,23(6):85-87

针对一种改进的浮点乘加器结构,对关键路径的延时进行定量的估算,并将其与传统乘加器结构的延时进行比较。相似文献

3.

一种改进的浮点乘加器结构的延时分析

下载免费PDF全文

靳战鹏沈绪榜田芳芳《计算机应用研究》2006,23(6):85-87,120

针对一种改进的浮点乘加器结构，对关键路径的延时进行定量的估算，并将其与传统乘加器结构的延时进行比较。相似文献

4.

基于SIMD部件的四倍精度浮点乘加器设计

何军黄永勤朱英《计算机科学》2013,40(12):15-18,51

如何减少四倍精度浮点运算的硬件开销和延迟是需要解决的重要问题。为减少四倍精度乘加器的硬件开销,基于支持64位×4的双精度浮点SIMD FMA部件,设计并实现了一种新的四倍精度浮点乘加器(QPFMA),来支持4种浮点乘加运算和乘法、加减法、比较运算,运算延迟为7拍。通过将四倍精度113位×113位尾数乘法器分解为4个57位×57位乘法器来共享双精度浮点SIMD FMA部件的53位×53位乘法器,显著减少了实现QPFMA的硬件开销。基于65nm工艺的逻辑综合结果表明,该QPFMA频率可达1.1GHz,面积是常规QPFMA设计的42.71％,仅与一个双精度浮点乘加器相当。与现有的QPFMA设计相比,相当工艺和频率下,其运算延迟减少了3拍,门数减少了65.96％。相似文献

5.

可重构浮点混合/连续乘-加器的设计与实现

《计算机工程》2014,(7)

浮点连续乘-加、混合乘-加和三操作数加等浮点算术运算在科学计算领域中应用越来越频繁,为设计一款支持浮点连续乘-加、混合乘-加和三操作数加的多功能浮点运算单元,提出一种可重构浮点混合/连续乘-加器,通过对控制位的配置可以实现多种浮点数据操作。该乘-加器采用8级流水线,可以实现单周期的浮点乘累加,大幅提高数据处理吞吐量,同时支持三操作数加和两操作数和的累加。在Modelsim SE6.6f中对该设计进行仿真验证,结果表明其能够在Xilinx Virtex-6 FPGA上实现,资源消耗2 631个LUT,频率可达250 MHz,结果证明该浮点混合/连续乘-加器具有较大的使用价值。相似文献

6.

一种高性能四倍精度浮点乘加器的设计与实现

何军黄永勤朱英《计算机工程》2014,(2):294-299

高精度、高性能浮点运算部件是高性能微处理器设计的重要部分。通过对传统双精度浮点乘加运算算法的研究,结合四倍精度浮点数据格式特点,设计并实现一种高性能的四倍精度浮点乘加器(QPFMA),该乘加器支持多种浮点运算,运算延迟为7拍,全流水结构。采用双路加法器改进算法结构,优化头零预测和规格化移位逻辑,减小运算延迟和硬件开销。通过参数化设计验证方法,实现高效的正确性验证。逻辑综合结果表明,基于65 nm工艺,该QPFMA频率可达1.2 GHz,比现有的QPFMA设计运算延迟减少3拍,频率提高约11.63%。相似文献

7.

M-DSP中高性能浮点乘加器的设计与实现

车文博刘衡竹田甜《计算机应用》2016,36(8):2213-2218

针对高性能M型数字信号处理器（M-DSP）对浮点运算的性能、面积和功耗要求,研究分析了M-DSP总体结构和浮点运算的指令特点,设计和实现了一种高性能低功耗的浮点乘累加器（FMAC）。该乘加器采用单、双精度通路分离的主体结构,分为六级流水站执行,对乘法器、对阶移位等关键模块进行了复用设计,支持双精度和单精度浮点乘法、乘累加、乘累减、单精度点积和复数运算。对所设计的乘加器进行了全面的验证,基于45nm工艺采用Synopsys公司的Design Compiler工具综合所设计的代码,综合结果表明运行频率可达1GHz,单元面积36856μm²;与FT-XDSP中的乘加器相比,面积节省了12.95%,关键路径长度减少了2.17%。相似文献

8.

浮点乘加部件延迟对浮点性能影响的研究

何军田增郭勇陈诚《计算机工程》2013,39(7)

浮点融合乘加部件会增加独立浮点加减法、乘法等运算延迟.为克服该缺陷,研究将乘加部件独立乘法、加减法等运算延迟由6拍减为4拍时对浮点性能的影响.以某支持乘加运算的国产处理器为基础,修改相关的RTL级设计代码,利用硬件仿真加速器平台,对SPEC CPU2000浮点测试课题进行评估.实验结果表明,该延迟优化有利于提高浮点性能,最大提高5.25％,平均提高1.61％. 相似文献

9.

基于VHDL的浮点算法研究

夏阳邹莹《计算机仿真》2007,24(4):87-90

浮点运算是数字信号处理中最基本的运算,但因为现行EDA软件没有提供浮点运算功能,使其在FPGA中的实现却是个棘手问题.文中提出了一种基于VHDL的高精度浮点算法,并以9位实序列为例,通过浮点数表示、对阶操作、尾数运算以及规格化处理等步骤高效并准确地实现浮点加/减法、乘法、除法以及平方根等运算,最后在FPGA中下载并实现了上述浮点运算,并给出测试结果.测试数据表明:所设计的浮点算法在其浮点数位宽所对应的精度范围内,可以在FPGA上成功地实现包含加、减、乘、除及求平方根等各种浮点运算. 相似文献

10.

基于AltiVec技术的浮点乘加单元的设计

赵明亮樊晓桠黄小平姚涛《计算机测量与控制》2010,18(1)

Alti Vec技术是为提高PowerPC的向量处理能力而对PowerPC指令集体系结构的扩展;浮点乘加单元是向量处理单元的主要构成部分,设计一种基于Alti Vec技术的向量浮点乘加单元;在基本浮点乘加器的基础上,提出了java模式下对非规格化数的预规格化处理;设计采用了一种半并行的结构,与传统的全并行结构相比可以节省一半的硬件面积;时钟频率为266 MHz时,java模式下5拍可以完成,非java模式下4拍可以完成。相似文献

11.

一种实时的外场多径信道测量方法

陈迅轶蒋玲鸽王萍杨维君《微计算机信息》2006,22(22):95-97

讨论了外场移动条件下多径信道的一种实时测试方法,并通过搭建的系统测试了实际外场的信道分布情况。该方法抗干扰性强,具有低功耗、精度高、实时性强的优点。实测结果表明基于该方法搭建的测试系统能够有效地测试外场多径信道的分布情况,并能够持续反映多径信道的变化情况。相似文献

12.

一种64位浮点乘加器的设计与实现 总被引：2，自引：0，他引：2

靳战鹏白永强沈绪榜《计算机工程与应用》2006,42(18):95-98

乘加操作是许多科学与工程应用中的基本操作,特别是在图形加速器和DSP等应用领域,浮点乘加器有着广泛的应用。论文针对PowerPC603e微处理器系统,基于SMIC0.25μm1P5MCMOS工艺,采用正向全定制的电路及版图设计方法,设计实现了一个综合使用改进Booth算法、平衡的4-2压缩器构成的Wallace树形结构、先行进位加法器的支持IEEE-754标准的64bit浮点乘加器。相似文献

13.

Constructive generation of the medial axis for solid models

《Computer aided design》2015

The medial axis (MA) is a simplified representation of complicated models which is widely used in current research. However, the efficient generation of the MA for complicated solid models continues to pose a challenge. In this study, a constructive approach for the generation of the MA is proposed for solid models after they are voxelized. With this method, the MA of the model constructed from two operand models via a Boolean operation is efficiently generated by merging the MAs of the operand models in a certain way, instead of regenerating them from scratch. To support the proposed method, the affected region of the resultant model is computed first using a Boolean operation. Second, only the MA in the affected region is regenerated by distance dilation. Third, the complete MA of the resultant model is constructed by combining the newly generated MA with the unchanged MAs of the operand models. In this study, the accuracy and complexity are analyzed for the final MA and some examples are given to illustrate the performance of the proposed method. 相似文献

14.

HISC: A computer architecture using operand descriptor

Yijun LiuAuthor Vitae Anthony S. FongAuthor VitaeFangyang ShenAuthor Vitae 《Computers & Electrical Engineering》2012,38(3):746-755

相似文献

15.

基于上位机的混合流程顺序控制系统

翁元《计算机系统应用》2014,23(6):42-47

以计算机为基础的生产过程控制与调度自动化系统,常会遇到包含并发控制流程、多条件多路径的复杂控制过程等等．基于当前计算机和通信技术的发展水平,该文提供了一种通过在调度中心上位机运用全组态配置和后台程序搭配的设计方法,实现混合流程的顺序控制,可以有效缩短控制时间、减少误操作从而能使下位机运行的可靠性明显提高,具有可观的经济效益和社会效益．相似文献

16.

排序合并Join算法的新结果 总被引：4，自引：0，他引：4

孙文隽李建中《软件学报》1999,10(3):264-269

Join操作是数据库中最昂贵和最常用的操作.排序合并Join算法是实现Join操作的重要算法,得到了普遍接受并广为应用.在重新研究了排序合并Join算法后发现,同时对两个Join关系进行外排序是不必要的,会带来很大的额外开销.针对这个问题,提出了一种基于单关系外排序的分治Join算法,并在该算法的基础上提出了基于单关系外排序的并行分治Join算法.理论和实验结果证明,基于单关系排序的分治Join算法高于排序合并Join算法.特别是在并行计算环境下,基于单关系排序的并行分治Join算法的效率远远高于排序合并相似文献

17.

一种128位高精度浮点乘加部件的研究与实现 总被引：2，自引：0，他引：2

张峰黎铁军徐炜遐《计算机工程与科学》2009,31(2)

高性能高精度的浮点数值处理一直是科学计算追求的目标。为此,本文研究并实现了一种128位浮点乘加融合计算单元。在乘法模块中,使用分块乘法,复用57位乘法模块,减小了数据宽度。采用三输入前导1预期技术,简化了预编码,缩短了预测电路的延时并减小面积。该模块单元使用Verilog语言实现,用Design Compiler进行逻辑综合,在simc0.13μm工艺下频率达202MHz,关键路径延时为4.93μs,面积约为191000门。相似文献

18.

基于广义加权的AMDF时延估计方法研究

徐耀松付华王丹丹《传感技术学报》2013,26(3)

时延估计是声源定位常用的方法。多途效应严重影响声源信号时延估计性能,传统方法难以克服。提出一种基于广义加权的平均幅度差函数（Average Magnitude Difference Function,AMDF）时延估计方法,利用改进的AMDF方法提高对多途效应的抑制,通过广义加权方法降低算法的噪声敏感性。仿真及实验表明,对于窄带信号,该方法能够获得比传统广义互相关方法更高的时延估计性能,估计结果的误差减小,稳定性能提高。相似文献