共查询到19条相似文献,搜索用时 296 毫秒
1.
2.
3.
为实现一种多浮点操作数乘法运算的自主运算控制器,提出了一种基于FPGA并行操作的硬连接电路的多浮点数乘法运算控制器及其时序控制的方法,该控制器对一条多浮点操作数乘法运算指令的命令字和多浮点操作数连续写入并存储,在内部时序脉冲作用下,可以自主完成读出浮点操作数执行乘法运算,写入存储多浮点操作数过程与执行乘法运算命令的过程能够并行进行;在控制器执行乘法运算命令过程中,系统可以读出执行命令过程中的中间结果和最终运算结果;论述了该控制器的电路构成和基本原理,分析命令字与多操作数在内部时序脉冲作用下的执行过程,应用Verilog HDL语言实现相关硬件的构建和连接;设计完成后通过仿真测试可知,该控制器运行的最高频率为250MHz,从输入到输出端口最小延时是3.185ns,最大延时是15.336ns,且能够自主完成浮点数乘法运算。 相似文献
4.
为避免离散余弦变换(DCT)中的乘法操作以及运算过程中的累积误差,提出一种基于多项式运算的Loeffler DCT算法。将传统Loeffler DCT算法的流程分成3个模块:常规数值运算模块、多项式运算模块和结果再生模块;通过多项式运算,DCT算法中涉及到的无理数乘法操作被分解成简单的整数加减及移位运算。分析和实验结果表明,该算法能完全避免乘法操作,且由于无计算累积误差,在图像处理过程中能保证较高的图像质量。 相似文献
5.
6.
大整数运算广泛地应用于公钥加密算法、大规模科学计算中高精度浮点数运算类以及构建大特征值等领域,然而其大部分算法空间和时间开销都很大,尤其对于核心运算之一的大整数乘法,当数据达到一定规模时,超长的串行计算时间已成为制约算法应用的巨大瓶颈.近几年来,伴随着多核、众核芯片的迅猛发展,通过充分挖掘算法本身的并行度以利用并行处理器的强大计算能力,进而高效地提升算法性能,成为一种研究趋势.本文基于通用多核并行计算平台,研究了大整数乘法Comba及Karatsuba快速算法的并行化,提出了高效的多核并行算法.在算法实现及性能优化上,采用了OpenMP+SIMD的多级并行技术,使性能获得巨大提升.在性能测试上,我们使用优化的并行算法与原始串行算法进行对比试验,结果显示,8线程并行Comba算法和Karatsuba算法相比串行对应算法分别实现了5.85倍以及6.14倍的性能加速比提升. 相似文献
7.
《计算机应用与软件》2014,(6)
模运算是公钥密码学的一种基本运算。做模运算前提需要做除法运算,因此除法运算也是密码学的基本运算。大整数除法的运算速度是影响公钥密码体系中效率的关键因素。针对大数相除问题,提出大数相除的快速改进算法,其基本思想是,以空间换取时间。首先,通过建立预处理表,减少试除法中大数乘法的次数,从而高效快速得出商值;然后,运用窗口滑动方法来提高大数减法的速度。实验结果表明,该算法可以提高密码学算法的运算效率。算法时间复杂度为O(n),空间复杂度为O(n)。 相似文献
8.
多精度整数乘法运算的效率对公钥密码系统中的模乘、模幂的运算效率起着决定性的作用.Toom-Cook算法是一类应用广泛的多精度整数的快速乘法算法,目前主要的研究方法是插值理论.本文利用实对称双线性函数和二次型的方法研究多精度整数的乘法和平方的快速计算,给出了Toom-Cook算法参数的所有代数表现形式和搜索快速算法的基本方法,提出了一些在实际应用中与目前已知结果相同或优于目前已知结果的快速乘法和平方算法.研究结果表明,利用实对称双线性函数和二次型表示Toom-Cook算法,更有利于判断算法的优劣程度和得到最优算法. 相似文献
9.
基于FPGA自主控制浮点加减控制器设计 总被引:1,自引:0,他引:1
为实现一种能够自主完成浮点数加/减运算功能的浮点数加/减运算执行控制器,提出了一种基于采用FPGA并行操作电路硬连接的浮点数加/减运算控制电路及其时序控制方法;该控制器在接收到操作数类型与参与运算的操作数后,在内部时序脉冲作用下.可以自主完成操作数的配置以及浮点数加/减法运算的功能,运算结果传输到系统数据总线;论述了该控制器的电路构成和基本原理,分析操作数类型与操作数在内部时序脉冲作用下的执行过程,应用Verilog HDL语言实现相关硬件的构建和连接;设计完成后通过仿真测试可知,该控制器运行的最高频率可达178.317 M,从输入端口到输出端口的延时数据为:最小延时是3.185 ns,最大延时是15.336 ns,耗用的IO输入输出端口占总资源的27.92%,数据表明该控制器提高了运算器的运算速度,且能够自主完成浮点数加/减运算。 相似文献
10.
Ⅰ.前言为了提高浮点计算系统中的运算速度,特别是乘法的运算速度,我们设计了三种特别的高速线路,即检测器、移位器和加法器。在乘法运算时检测器能指出被乘数应移多少位,移位器在一次操作中能把一个字的信息移几位, 相似文献
11.
人脸表情识别已成为人工智能领域的重要研究课题,但传统的卷积神经网络需要庞大的计算资源使得其应用受限,而二值化卷积神经网络可通过快速与或运算代替原本的浮点乘法运算,大大降低了算法对计算资源的需求。论文提出了一种基于数据增强和二值化卷积神经网络的人脸表情识别算法,通过均值估计,在FER2013数据集上达到了66.15%的识别率,超越了部分基于浮点乘积运算的卷积网络,为表情识别算法移植到小型设备中提供了可能。 相似文献
12.
在椭圆曲线密码系统中,其核心操作是点乘运算κP,P是椭圆曲线上的点,忌是整数。怎样提高点乘计算速度,已成为热点研究领域。本文提出了一种新的基于整数拆分与预计算相结合的快速点乘算法。 相似文献
13.
周志方 《数字社区&智能家居》2007,2(8):486-487
本文提出一种可对任意分布的浮点数进行排序的快速排序方法,它基于浮点数的机内编码,具有速度快、实现简单、实用的特点。其时间复杂度为O(n),在对不同分布的随机浮点数进行的排序实验中,其速度是快速排序的数倍。同时,本算法思想还可用于双精度数、整数、字符串等类型数据的排序。 相似文献
14.
一种基于定点DSP的YCbCr到HSV的快速转换算法* 总被引:1,自引:0,他引:1
通过分析YCbCr到RGB以及RGB到HSV之间转换的算法,提出一种YCbCr空间转换到HSV空间的快速算法。在该算法中分别使用了移位运算和查表法代替了浮点乘法运算,从而显著提高了算法在DSP上的运行速度。另外,转换时Y分量不再参与计算,从而进一步降低了运算复杂度。最后实验证明,在DSP平台上,该算法比传统算法能节省80%的计算时间,在PC平台上能节省46%的计算时间。因此,提出的算法在车牌识别、火焰检测等实时视频分析应用中有广泛的应用性。 相似文献
15.
研究Android平台中密码运算加速方法,采用运算并行化的思想,利用Android平台的RenderScript并行运算机制实现大整数乘法运算,为椭圆曲线密码等密码运算提供高效快速的基本操作。设计并实现了适合并行处理的大整数乘法运算存储结构和运算执行逻辑,以矩阵的方式分割并处理大整数对象,可以一次同步完成所需的乘法和加法运算,进而得到最终运算结果。实验结果表明,与Android平台原生的Java大整数运算库相比,该方法在执行时间上具有明显优势。 相似文献
16.
针对过程工业中中小型快速系统的过程控制问题,以ARM与浮点DSP双核控制器OMAP—L137为核心,通过硬件系统和软件系统配合,设计并实现了面向先进控制的嵌入式通用平台。以实时性为目标,将预测控制算法分块,分别对预测模型、约束处理和在线求解算法各块进行研究。提出了针对嵌入式计算速度和存储量有限等问题的解决方案,并将改进后的算法在嵌入式平台中实现。通过对相关模型的测试,结果表明:系统具有高速、高控制精度等优良性能。 相似文献
17.
椭圆曲线密码体制上的一种快速算法 总被引:3,自引:0,他引:3
本文分析了已有的一些计算椭圆曲线上点乘运算的快速算法,定义了整数阶乘展开式,并提出一种新的基于阶乘展开式的计算椭圆曲线上点乘的快速算法。对于200位的大整数点乘,与二进制算法相比,本文算法的倍点数减少了11%,点加数也有较大的减少。 相似文献
18.
19.
RSA算法依赖于大数的运算,实现起来较为困难,并且对计算机速度、容量等要求较高。针对上述问题,提出一种有效的解决方案,即将大整数分解成小整数进行相乘以提高幂乘运算速度,并给出改进的负载均衡并行算法,进一步提高计算速度。实验结果表明,与传统的RSA算法相比,该算法在计算速度上有明显的提高,具有较好的可扩展性。 相似文献