首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于 L S MPP的 K元 2 -立方体网络结构 ,设计了一种新颖快速的计算 FFT的 SIMD算法 .文中首先在本文的姊妹篇“基于 L S MPP的图像并行傅立叶分析技术 (1)”的分析与设计的基础上 ,讨论了输入图像像素矩阵及变换结果图像矩阵中元素的排序问题 ,并给出了算法实现中的有关处理策略 .接着较完整详细地给出了在 L S MPP SIMD计算机上实现的一种新颖快速的二维 FFT并行算法和实验结果 .最后对算法的性能进行了分析  相似文献   

2.
利用对称性加速实序列FFT的方法及其FPGA实现*   总被引:1,自引:1,他引:0  
针对工程实践中傅里叶变换的输入序列一般为实序列的情况,充分利用FFT(快速傅里叶变换)奇偶虚实的对称性质,提出了一种实序列FFT的加速算法。将2N点的实序列DFT转换为N点的复序列DFT,并行计算使运算量明显减少;并给出了基于FPGA的硬件实现方法。  相似文献   

3.
通过对正弦信号失真度计算公式的描述,提出了一种利用FFT来计算信号失真度的方法,并重点对DFT的定义、如何用DFT来计算模拟信号的傅立叶变换、FFT的有关原理,以及信号的倍频电路进行了论述,并给出FFT算法的源程序。  相似文献   

4.
快速小波变换是数字信号处理面临的一个重要问题,针对并行小波算法展开研究,缩减小波变换中卷积运算的规模,提高小波变换过程中的并行效能,以实现小波变换的快速并行计算。通过FFT矩阵代入计算,消去了并行计算过程中的同步通信,降低了乘法运算次数。对算法思想进行了理论分析,说明新算法在短小数据分段情况下能够减少50%~75%的乘法操作;通过搭建两种不同平台进行了对比测试,证明了算法的先进性与有效性。基于FFT矩阵的并行小波变换算法是一种稳定有效的经典小波并行算法。  相似文献   

5.
SIMD-BF模型上的并行FWHT算法研究   总被引:1,自引:0,他引:1  
蝶形网络是并行计算中的一种重要的网络拓扑结构.并行计算模型是并行算法设计和分析的基础.文章以并行FFT算法的基本思想为基础,根据快速Walsh-Hadamard变换的两种蝶式计算流图,提出SIMD-BF模型上的两种并行FWHT算法.算法分析的结果表明:离散Walsh-Hadamard变换算法的复杂度为O(n2);快速W...  相似文献   

6.
采用傅里叶变换算法计算菲涅尔衍射相位时,在相位未解包裹的情况下,接收面上提取的相位分布曲线会出现跳变,如果进行解包裹,必然会导致错误的结果。研究发现用傅里叶变换算法进行衍射计算导致接收面上相位跳变的原因,是因为快速傅里叶变换(FFT)对矩阵标注索引的方式与离散傅里叶变换(DFT)有所区别,从而导致计算结果的相位与真实相位有差异。本文提出在FFT运算前后分别进行一次倒谱的方法矫正这种相位跳变,并仿真利用单次FFT进行二维矩孔的菲涅尔衍射,用2次倒谱矫正接收面上的相位跳变,结果证明了该矫正方法的可行性。  相似文献   

7.
基于Intel SIMD指令的二维FFT优化算法   总被引:1,自引:0,他引:1  
在基于频域的大数据量图像处理算法中,最为耗时的步骤就是对图像数据进行二维FFT变换的过程。论文针对这一问题,提出一种基于Intel SIMD指令的二维FFT优化算法。通过将数据按照便于SIMD指令计算的方式进行组织,利用SSE3指令加速复数乘法,在二维处理中针对处理器缓存进行优化等方法,实现了很高的性能。实验结果表明:描述的算法比目前使用最广泛的公共域FFT程序包FFTW快30%左右。达到了对大数据量图像进行快速处理的要求,具有较大的工程实用价值。  相似文献   

8.
近几年,由于快速Hartley变换(PHT)算法的提出,使DFT的计算面目一新,而且用FHT计算褶积比用FFT优越得多。利用两种变换间的简单关系,借助于FHT不用复数运算和计算结果是实数存储的优点,可以使实数据DFT或褶积节省一半的内存,且速度与实数据FFT算法的速度相同。但是,目前对多维DHT尚无成熟算法(只有二维和三维的算法),本文首次提出适于多维DHT的快速算法。它直观且易于在计算机上实现,从而使得用多维快速DHT计算多维DFT及褶积成为可能,同时也为实谱分析方法提供了一种新的工具。  相似文献   

9.
FFT(快速傅里叶变换)是基于提高DFT(离散傅里叶变换)计算的高效算法,它在众多科学和工程领域都得到了广泛的应用。自FFT算法出现以后,从早期的以降低复杂度到近年以来的大规模并行FFT计算,各种优化算法得到广泛的研究。在并行运算领域中,随着可编程的、并行化GPU的不断推广,特别是通用并行统一计算架构CUDA的出现,极大增强了GPU的计算能力,在编程和优化等方面都有显著地提升。鉴于此,本文在分析FFT算法实现的基础上,研究了一种适合GPU运算的FFT并行计算方法,并通过CUDA架构实现了FFT算法在GPU上的运算。该方法的引入在理论不计算数据传输的情况下,使一维FFT运算时间的复杂度由O(N logN2)可以降到O(N/rlogN2)。通过验证,本文提出的CUDA的并行FFT方法得到较好的加速效果,在精度计算上也符合实际的要求,从而证明了该方法的正确性和有效性。  相似文献   

10.
本文提出一种计算长度为2~m的离散傅里叶变换(DFT)的新算法。算法所需的实数乘法和实数加法运算量均低于常规FFT算法,同时具有和常规FFT类似的蝶形运算结构,易于计算机软件和硬件实现。  相似文献   

11.
快速傅里叶变换(fast Fourier transform,FFT)是用于计算离散傅里叶变换(discrete Fourier transform,DFT)或其逆运算的快速算法,在工程、科学和数学领域的应用非常广泛,例如信号分解、数字滤波、图像处理等。因此,在实际应用中对FFT算法进行细粒度优化是非常重要的。研究了FFT算法常用的分解策略以及FFT算法在大规模集群系统上的并行实现,并提出了相关的优化策略。在此基础上,对多种FFT算法在不同平台上进行了性能评估,并分析了各算法的实现、优缺点及其在大规模计算时的可扩展性。实验结果表明,相关研究有助于对现有的FFT算法进行进一步的优化,以及指导如何在大规模CPU+GPU的异构系统上根据不同需求选择实现性能更优的FFT算法。  相似文献   

12.
FFT(快速傅里叶变换)是离散傅里叶变换或其逆变换的一种常见快速算法,是高性能计算领域最重要的基础核心算法之一,在科学、工程和数学等领域的应用十分广泛.实数FFT算法,即输入或者输出为实数的FFT算法,其中包括R2C(Real-to-Complex)、C2R(Complex-to-Real)等变换类型.相比复数FFT算法,实数FFT算法在图形图像处理、数据压缩等领域有着不可替代的作用.传统实数FFT实现针对的是输入规模为偶数,一般转变为复数FFT进行运算.然而当前鲜有针对输入规模为奇数的实数FFT高效实现.对此,本文提出了一种实数FFT高效算法(DRFFT),并采用蝶形网络优化、蝶形计算优化、访存优化、SIMD优化以及数据转置等方法进行优化,大幅提升了实数FFT算法性能,最终构建了一种针对实数FFT的高性能算法库.实验结果表明,本文实现的DRFFT R2C变换在单双精度浮点数处理方面较FFTW库性能分别平均提升了37.6%和4.6%,较ARMPL库性能分别平均提升了67.6%和28.1%.DRFFT C2R变换在单双精度浮点数处理方面则较FFTW库性能分别平均提升了58.6%和10.8...  相似文献   

13.
基4FFT算法     
FFT(快速富里叶变换)算法与DFT(离散富里叶变换)算法比较,其运算量显著减少,用计算机实现时速度大为提高。但FFT过程所需的运算量仍较可观,常给数字信号的实时处理带来困难。理论和实践表明,若要加快FFT算法在计算机上的实现,关键是得设  相似文献   

14.
本文先从理论上讨论了一种新的低成本、高效率的离散富里叶变换数据处理机(FFT)的设计。然后用孙子定理和WFTA算法,设计了一种实用的混合基的FFT数据处理机,它与基2FFT数据处理机比较,省用了四个专用乘法器,不需存储三角函数表格的存储器。控制器微程序设计简化了控制器线路。补码运算、存储和传送避免了原码与补码的转换。乘法用Booth算法的“移位跨零法”。16位字长的乘法用四个加法实现。一个840点的DFT运算时间约需36毫秒。本机具有较高的性能/价格比值,满足了一般实时处理的要求,适合生产和推广使用。  相似文献   

15.
Agarwal—Cooley短卷积嵌套算法(ACCNA)   总被引:1,自引:0,他引:1  
离散富里叶变换(DFT)和卷积计算在图象、数字信号处理中起着重要的作用,因此对快速算法的研究早就引起人们足够的重视。自从1965年Cooley、Tukey提出基-2快速富里叶变换(FFT)算法以来,各种新算法、改进算法不断涌现,其中Winograd在1976年提出的短DFT嵌套算法(WFTA)是一种计算DFT的有效方法。1977年后,H.Silverman、J.H.McClellan、L.R.Morris等曾先后详细讨论过WFTA  相似文献   

16.
快速傅里叶变换(FFT)在科学和工程领域有着广泛的应用。在网格环境下进行并行FFT计算可以提高运算速度,促进FFT的应用。在介绍了网格计算发展状况的基础上,详细阐述了基于网格的分布式并行计算。实验以FFT算法为背景,在Globus Toolkit 4平台下实现了并行FFT计算,并对实验数据作了分析,说明了基于网格的并行FFT计算的可行性。最后指出网格资源调度对并行计算的重要性。  相似文献   

17.
基于网格的并行FFT计算研究   总被引:1,自引:0,他引:1  
快速傅里叶变换(FFT)在科学和工程领域有着广泛的应用.在网格环境下进行并行FFT计算可以提高运算速度,促进FFT的应用.在介绍了网格计算发展状况的基础上,详细阐述了基于网格的分布式并行计算.实验以FFT算法为背景,在Globus Toolkit 4平台下实现了并行FFT计算,并对实验数据作了分析,说明了基于网格的并行FFT计算的可行性.最后指出网格资源调度对并行计算的重要性.  相似文献   

18.
自从1965年Cooley-Tukey提出快速富氏变换(FFT)算法以后,离散富氏变换(DFT)在许多领域得到广泛的应用。但是,在处理大型数据时,FFT算法的计算量仍然很大。因此,人们对DFT不断提出一些新的快速算法,其中以R.D.Preuss在[5]中提出的算法的计算量较小,仅为其它新算法计算量的三分之二。但是,Preuss算法需要将  相似文献   

19.
周庆  黄党志 《计算机应用》2013,33(10):2861-2864
快速反应码(QR)二维条形码在通信时存在安全隐患,为此提出了一种加密算法。伊辛(Ising)模型具有矩阵形式,在形式上与QR码相同,且其状态变换过程支持并行计算。基于Ising模型的变换规则生成加密矩阵,然后结合QR码的编码原理计算出QR码的密文。实验结果证实该算法具有良好的随机性和密钥敏感性。该算法简单、安全、高效,可用于QR码的安全保密通信  相似文献   

20.
基于SIMD—PRAM模型的分块图像匹配算法设计   总被引:1,自引:0,他引:1  
该文研究了基于SIMD—PRAM计算模型的有限处理元阵列规模的并行计算算法设计,分析了求阵列和的并行算法性能,运用求阵列和、图像分块映射与四邻平移等方法提出了一种根据处理元局部可用资源进行分块计算的图像匹配算法。计算机模拟实验结果表明,该算法完整、高效地执行了图像匹配,具有良好的并行计算性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号