共查询到20条相似文献,搜索用时 93 毫秒
1.
数据全并行FFT处理器的设计 总被引:5,自引:0,他引:5
讨论了基4和混和基算法的FFT处理器设计问题,提出的操作数地址映射方法充分利用了FFT算法本身的同址性质,能同时提供蝶形运算所需的4个操作数,具有最大的数据并行性,按照旋转因子存放规则,蝶形运算所需的3个旋转因子地址相同,且寻址方式简单,运算部件采用3个乘法的复数运算算法,有效减少了运算部件的大小,它既可以作基4蝶形运算,也可以同时进行2个基2蝶形运算.采用Altera公司的EP200K400E,工作频率达到89MHz,1024点16位复数FFT需要14.1μs,4096点需要67μs。 相似文献
2.
3.
4.
本文主要研究基于FPGA的数据处理系统,内部包含一个1024点的FFT处理单元.FFT部分采用基四算法,五级级联处理,并通过CORDIC流水线结构使硬件实现较慢的复乘运算转化为移位和加减运算.双端口RAM、只读ROM全部内置在FPGA芯片内部,使整个系统的数据交换和处理速度得以很大提高,合理地协调了资源和速度之间相互制约问题. 相似文献
5.
基于FPGA的高速FFT算法实现 总被引:2,自引:0,他引:2
在EW型接收机的高速数字处理中,运算速度是影响系统性能的重要环节之一。结合系统的研制,利用FPGA资源丰富、易于实现并行流水的特点,设计实现了满足系统要求的专用FFT处理单元;对定点运算的精度做了比较详细的分析,并给出了一个切实可行的FPGA实现方案。 相似文献
6.
提出了Radix-4 FFT的优化算法,采用该优化算法设计了64点流水线IFFT/FFT处理器,该处理器可以在64个时钟周期内仅采用3个复数乘法器获得64点处理结果,提高了运算速度,节约了硬件资源。通过Xilinx XC2S300E Spartan2E系列的xc2s300e器件进行下载验证,仿真结果与MATLAB计算结果误差小于0.5%,该处理器已经成功应用于某OFDM通信系统中。 相似文献
7.
8.
9.
基于DSP的实数FFT算法研究与实现 总被引:6,自引:0,他引:6
介绍了一种实数快速傅里叶变换(FFT)的设计原理及实现方法,利用输入序列的对称性,将2N点的实数FFT计算转化为N点复数FFT计算,然后将FFT的N点复数输出序列进行适当的运算组合,获得原实数输入的2N点FFT复数输出序列,使FFT的运算量减少了近一半,很大程度上减少了系统的运算时间,解决了信号处理系统要求实时处理与傅里叶变换运算量大之间的矛盾.同时,给出了在TMS320VC5402 DSP上实现实数FFT的软件设计,并比较了执行16,32,64,128,256,512,1024点实数FFT程序代码与相同点数复数FFT的程序代码运行时间.经过实验验证,各项指标均达到了设计要求. 相似文献
10.
科氏流量计通过计算一次仪表输出的两路同频正弦信号的时间差来测量质量流量.实时精确估计两路信号的频率和相位差是科氏流量计数字信号处理的关键.针对科氏流量计实测信号,提出一种基于插值FFT和滑动DTFT的信号处理方法.利用插值FFT估计信号频率,通过计及负频率的改进滑动DTFT估计相位差,进而计算出时间差.方法兼顾了参数的估计精度和算法的计算效率,对比实验表明了该方法的有效性和优越性. 相似文献
11.
FFT(快速傅立叶变换)是一种广泛应用于科学和工程领域的算法,现实应用中数据规模较大,需要高效实现才能满足实际应用需求。为了研究使用异构编程模型高效实现FFT算法,以华为鲲鹏处理器和昇腾AI加速芯片为实验平台,以SYCL语言为异构编程语言,实现了Cooley-Tukey基-2时域抽取FFT算法的方法和优化策略,并且提出了一种数据对切重组优化算法,大幅提高了对硬件并行能力的利用率。使用异构编程模型实现快速傅立叶变换算法可以更好地发挥异构计算设备的性能优势,易于编程且具有更高的兼容性。测试表明,在一定规模下,优化后的算法性能相比于优化前快了220.39倍。 相似文献
12.
System Generator for DSP是Xilinx公司开发的基于Simulink图形环境的DSP开发工具。利用System Generator工具,即使是没有多少FPGA设计经验的设计人员也能够快速开发出高性能的FPGA来实现DSP算法。本文介绍了一种采用XILINX公司的Virtex-2 Pro系列的FPGA芯片实现FFT算法的设计流程,并利用System Generator把FFT算法映射到FPGA资源中。实验表明:该方法具有操作简单、设计灵活、效率高等优点。 相似文献
13.
快速傅立叶变换作为20世纪公认的最重要的基础算法之一,在大规模科学计算处理、数字信号处理、图形图像仿真等众多领域有着广泛的应用。OpenCL是首个面向异构系统通用的并行编程标准,为软件开发人员提供了统一的面向异构系统的并行编程环境。首先,在异构平台Cell和GPU上使用OpcnCL实现了基于2的幂一维FFT,并
对其进行了测试和分析,在Cell平台上当数据规模适中时它能够达到SDK性能的65%,当数据规模继续增大时,相对性能有所降低。此外,针对Nvidia Fermi平台,手工调优了小因子的FFT,使其性能接近于CUFFT的140%。 相似文献
14.
15.
16.
针对传统大规模优化算法维数过高、过度稀疏、难以平衡等问题,文中提出基于动态自适应的双档案大规模稀疏优化算法,平衡维数和稀疏性对算法的影响,提高算法在解决大规模优化问题上的多样性和收敛性.首先,改变种群分数生成策略,加入自适应参数和惯性权重,增加分数的动态性,改善种群的多样性,使搜索不易陷入局部最优.然后,改变算法的环境... 相似文献
17.
许多多维索引结构随着维度的增加会遇到“维度灾难”问题,而金字塔技术是基于一种依赖特殊优化数据维度的非平均分割策略,能够克服“维度灾难”问题。本文提出了基于金字塔技术的完整算法集,并针对完备高维索引算法,对金字塔索引技术的性能特性进行了深入分析。 相似文献
18.
目前大规模场景模型生成的需求量日益增加,现提出了一种基于区域的自动LOD (Levels Of Details)构建算法.该算法基于动态网格简化算法,在游戏设计制作的过程中,游戏开发人员会经常需要对美工部门人员提供的模型进行优化.为了可以使模型的面数得到简化,并且不改变模型的外观.当今流行的LOD技术非常擅于处理这种情况,判断模型与摄像机的距离如果超过一定范围之后,自动调取不同层次的模型,当模型距离摄像机很远的情况下使用面数低的模型替换高模,这样可以提高帧率并且降低摄像机前的三角面以及顶点数从而减少渲染压力.一般模型的简化分为静态和动态模型的简化.大部分情况下,程序员会让美工部门提供几套不同面数的模型或者通过模型简化工具对高模进行减面并存成多个Mesh,并在程序运行的时候,根据模型与摄像机的距离远近动态的替换Mesh.这是一种静态的方法.这里将尝试使用一种动态的网格简化和LOD技术相结合的方法.这种新型算法的大大的简化了操作流程,美术人员只需要提供一个模型,程序员可以使用这种方法生成量级不同的低模,根据摄像机与模型的远近自动的调取不同精度的模型. 相似文献
19.
在分析模式匹配算法的基础上,提出了一种改进的模式匹配算法,并将该算法应用于大规模数据分析软件设计之中。在数据分析的初始阶段,通过该模式匹配算法建立一张数据索引表,随后分析软件借助于索引表和帧结构分布表,对原始数据进行分析和处理。该算法的应用,有效的解决了大规模数据处理过程中的难题,提高了大规模数据处理软件的效率。 相似文献
20.
基于本体的案例检索系统中,由于数据库中的案例数量随着时间的推移而成倍增加,案例检索的效率不断降低。提出了一种多维案例检索算法—DRR,该算法通过将多维空间案例点降维成二维空间点,利用一个二维空间点来代表类案例点组成的集合,并对此二维空间点建立R树空间索引,通过两级检索的方法,加速了检索效率和准确率。实验证明,该方法不仅提高了案例检索的准确率,还极大地提高了案例检索的效率。 相似文献