首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于GPU的图形电磁计算加速算法   总被引:2,自引:0,他引:2       下载免费PDF全文
杨正龙  金林  李蔚清 《电子学报》2007,35(6):1056-1060
本文利用现代图形加速卡中GPU(Graphics Process Unit)的可编程管线,实现了图形电磁计算(GRECO)方法.与原有的方法相比,在利用物理光学和物理绕射理论的基础上,计算速度提高了20倍左右.并且利用GPU实现了射线追踪算法,用于目标上多次散射的计算,使得GRECO方法可以快速计算具有凹腔结构目标的电磁散射.本方法对于目标识别和逆合成孔径成像等方面的研究具有重要的应用价值.  相似文献   

2.
在GPU通用计算平台上实现了一个钢琴独奏乐曲的乐谱识别系统,它读取WAV格式音频文件,利用GPU通用计算技术加速自相关函数算法来实现音高的识别,并综合考虑短时能量和基音周期的变化进行节拍划分。通过实际测试,验证了该乐谱识别系统的准确性,并证明了GPU并行计算对系统计算效率提升的效果:将计算时间减少到传统CPU计算时间的16%左右。  相似文献   

3.
时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一.然而,时域有限元在大型机上运行时都是相当缓慢的.对时域有限元计算的硬件加速的研究已经开始进行.与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的加速可以达到CPU的近4倍左右.以OpenGL作为应用编程接口(API),使用一个标准的商业图形卡编程解决二维时域有限元的辐射问题.  相似文献   

4.
随着信息技术的发展,数字信号处理已成为当今重要的学科和技术领域之一,滤波得到了广泛应用.而图形处理单元(GPU)强大的浮点计算能力和数据并行处理能力,在数字信号处理等方面得到了越来越多的应用.介绍了有限冲激响应(FIR)滤波的原理,基于统一计算设备架构(CUDA)实现了并行FIR滤波,并比较了这种方法与其他方法的计算结果,结果表明选用CUDA并行FIR滤波后数据处理速度提高了.  相似文献   

5.
分析了将GPU并行计算技术用于通用计算的可行性,简要介绍CUDA架构编程,并以一个应用实例对GPU并行计算的性能进行了验证,测试表明GPU加速通用计算的优良性能,最后总结了GPU并行计算技术的运用模式。  相似文献   

6.
依据GPU计算特点和任务划分的特点,提出一种类似主从模型的GPU-CPU协作计算的处理模式,通过把问题或算法划分成多子任务,并对划分的子任务给出合理的调度算法,使GPU和CPU各自发挥特点,从而发挥较高效率的GPU通用计算能力,通过测试验证该协作模式是有效的.  相似文献   

7.
文章通过研究一种P2P通用计算平台(TIPMAN),发现该平台在安全信任方面的不足,提出了在TIPMAN平台的应用层和P2P网络层之间增加新的P2P服务安全层。通过该层的对等组成员资格认证使一个对等点经认证后加入到一个对等组,安全通信机制实现了对等点之间数据的安全传输,确保了P2P应用的安全性。  相似文献   

8.
谈继魁  方勇  霍迎秋 《电视技术》2015,39(15):42-45
重建算法在压缩感知理论中有着重要的作用,经典的正交匹配追踪(OMP)重建算法在每次迭代中对已选择的原子进行正交化处理以加速算法的收敛速度,但同时增加了算法的计算复杂度。针对这一问题,提出了一种基于图形处理单元(GPU)并行计算的OMP算法,重点对算法中复杂度高的投影和矩阵求逆部分在GPU平台上进行并行设计。实验结果表明基于GPU的并行OMP算法相对于其串行算法加速比可以达到30~44倍,有效地提高了算法的计算效率,拓宽了该算法的应用范围。  相似文献   

9.
《电子设计应用》2008,(1):18-21
图形芯片生产商Nvidia公司的总裁兼CEO Jen—Hsun Huang指出:“目前,图形芯片具有的浮点运算性能已经大大超越了处理器。如果能够灵活运用,随着图形芯片的发展,将会涌现出各种各样新的应用。”在占据PC及服务器主流地位的x86处理器中,围绕GPU(图形处理单元)展开的相关研发工作突然活跃起来。  相似文献   

10.
基于GPU的数字全息实时再现系统设计及实验研究   总被引:1,自引:1,他引:0  
设计了基于图形处理单元(GPU,graphic processing unit)的数字全息实时再现(DHRTR,digital holography real-time reconstruction)系统,并以旋转骰子为研究对象,实验验证了DHRTR系统的有效性。相对CPU,GPU本身含有许多流处理器,通过并行运算可大大缩短数字全息图再现运算时间。利用统一计算设备架构(CUDA)的运算平台,编写了基于GPU处理器的实时再现软件,在对动态全息图进行连续采集的同时,即时对全息图进行再现,并实时显示再现结果。实验结果表明,本文系统可以实现平均帧速为20 frame/s、大小为512 pixels×512 pixels的数字全息图的实时再现。  相似文献   

11.
GPU Computing   总被引:9,自引:0,他引:9  
The graphics processing unit (GPU) has become an integral part of today's mainstream computing systems. Over the past six years, there has been a marked increase in the performance and capabilities of GPUs. The modern GPU is not only a powerful graphics engine but also a highly parallel programmable processor featuring peak arithmetic and memory bandwidth that substantially outpaces its CPU counterpart. The GPU's rapid increase in both programmability and capability has spawned a research community that has successfully mapped a broad range of computationally demanding, complex problems to the GPU. This effort in general-purpose computing on the GPU, also known as GPU computing, has positioned the GPU as a compelling alternative to traditional microprocessors in high-performance computer systems of the future. We describe the background, hardware, and programming model for GPU computing, summarize the state of the art in tools and techniques, and present four GPU computing successes in game physics and computational biophysics that deliver order-of-magnitude performance gains over optimized CPU applications.  相似文献   

12.
为了提高蒙特卡罗模拟分析的效率,设计了一种以Platform Symphony为基础的云计算平台,并对平台进行了扩展和集成,详细论述了实现的过程以及关键技术。通过实验表明,该平台能够进行高性能计算,输出的结果精确,是实现蒙特卡罗模拟分析的实用工具。  相似文献   

13.
冯颖  袁庆华  沈健炜 《通信技术》2011,44(2):141-143
基于CPU+GPU的异构计算系统是在传统计算机系统中加入GPU作为加速部件并配合CPU共同承担计算任务的新型系统,相比于传统的单纯以CPU作为计算部件的同构计算系统,异构系统优势明显。分析了基于CPU+GPU异构计算模式程序开发面临的主要困难,重点研究了当前可用的主要解决途径和研究方向,并总结了当前各种编程方法的适用场合和各自的优缺点。  相似文献   

14.
采用基于CUDA(compute unified device architecture,统一计算设备架构)的GPU(graphic pro-cessing unit,图形处理器)与CPU协作处理方法,实现了基于时差最小测量误差的任意站定位算法的实时处理。本方法的处理速度相较于单CPU平台可以提高一至两个数量级,相较于同等处理速度的多CPU平台则体现了开发周期短、费用低、工作量小和可靠性高等众多优势。  相似文献   

15.
文中研究了GPU计算及其在密码分析中的应用,详细分析了各自的特点和发展现状。GPU计算发展很快,具有运算密集型和高度并行的特点。密码分析的方法非常丰富,大多数方法都需要大规模的运算,而且密码运算本身也比较简单。通过理论分析并结合实例研究,发现GPU计算非常适合用于密码分析,可以大大提高密码分析特别是穷举攻击的效率。同时,也应拓宽GPU计算在密码分析中的应用,以用于更多的密码分析手段。  相似文献   

16.
交织编码在3G系统中已经大量使用,数据通过卷积编码后进行分组交织,在接收端完成反交织,将连续误码分散成非连续误码,从而使得误码在纠错允许的范围内得到纠正;CPLD(复杂可编程逻辑器件)具有方便的在线编程功能,可以用来实现交织编码;考虑到矩阵交织器的多样性而设计的通用矩阵交织器,只须通过修改一些参数值即可实现不同的交织器,大大节省了设计时间。  相似文献   

17.
18.
General purpose packet satellite networks   总被引:1,自引:0,他引:1  
The use of satellite communication techniques to provide integrated data network and point-to-point and conference speech services is discussed. The concept of a General Purpose Packet Satellite Network (GPSN) is introduced in terms of its requirements, and consideration is given to techniques that satisfy these requirements. The class of Priority Oriented Demand Assignment (PODA) algorithms is defined and compared with other packet-oriented demand assignment algorithms. PODA is shown to be well suited to the GPSN application. Networking and access protocol issues are considered in the context of a GPSN. The Atlantic Packet Satellite Experiment, an ongoing experimental program which is developing packet satellite technology, is described in some detail.  相似文献   

19.
文中实现了GPU平台加速的BWA-MEM算法,将BWA-MEM算法中的两个热点模块:SMEM查找和chain生成模块利用GPU平台进行加速,通过重构算法流程、精简需要向CUDA设备传输的数据结构,采用合理的任务划分方式来提升BWA-MEM在GPU平台的性能。论文对BWA-MEM算法的特点进行了深入分析,总结了BWA-MEM算法在GPU平台加速效果受到限制的原因。  相似文献   

20.
随着微处理器技术的发展,GPU/CPU的混合计算已经成为是科学计算的主流趋势.本文从编程的层面,介绍了如何利用已有的并行编程语言来,调度GPU的计算功能,主要以MPI(一种消息传递编程模型)与基于GPU的CUDA(统一计算设备架构)编程模型相结合的方式进行GPU集群程序的测试,并分析了CPU/GPU集群并行环境下的运行特点.从分析的特点中总结出GPU集群较优策略,从而为提高CPU/GPU并行程序性能提供科学依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号