首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 156 毫秒
1.
针对连续波雷达中事后分析系统的运算数据量大,运算时间长的特点,提出了一种利用CUDA平台的GPU进行加速运算的方法,它利用GPU的并行运算功能来完成FFT算法。实验结果表明,相比以往用CPU进行事后分析,利用CUDA平台进行事后分析的速度有明显提升。  相似文献   

2.
董亚清 《电子科技》2013,26(12):12-16
利用NVIDA公司开发的CUDA技术对线性调频信号脉冲压缩算法进行了研究。用CUDA C和C语言分别在GPU、CPU平台对该算法进行仿真,并对程序执行时间做出了比较。实验结果表明,在GPU平台上实现脉冲压缩算法的运算效率明显优于在CPU上。  相似文献   

3.
为了提高光照不均图像的增强速率,提出了基于GPU平台的同态滤波并行算法.根据同态滤波算法的并行性,利用CUDA软硬件体系架构,实现了同态滤波算法向GPU上的移植.利用多幅不同分辨率图像作为测试数据,对比CPU和GPU方案的计算效率.实验结果表明,GPU实现方案大幅度提升了计算效率.  相似文献   

4.
针对基于群智能优化的点云配准算法计算时间长的问题,提出一种基于CUDA的并行粒子群配准算法.以点对点距离最短为适应度函数,利用粒子群算法各粒子天然的并行性,将运算过程分配到GPU的各个线程中计算变换参数.由于GPU多个线程运算同时执行互不干扰,极大地提高了粒子群的运算速度,从而可以实现点云的快速、精确配准.实验结果表明,该算法既克服了ICP算法对点云初始位置要求高的缺点,又有效解决了基于群智能优化的点云配准算法计算时间长的问题.  相似文献   

5.
随着通信仿真平台运算规模和复杂度的提升,以CUDA为代表的GPU加速技术成为缩短仿真时间、降低仿真设备购置及运行开销的有效手段。本文梳理了支持CUDA技术的GPU设备核心演进脉络,介绍了不同系列GPU产品的技术特点及应用领域,并以此为基础提出了一种研究CUDA加速仿真技术的试验环境。该环境以低端计算机、消费级GPU和千兆网络设备组建开发环境,以高端服务器、专业GPU运算卡和光纤路由器组建运行环境。这种试验环境搭建方案有利于实现性能与价格的平衡,并能较好跟进未来GPU软硬件技术的持续演进。  相似文献   

6.
红外弱小目标的探测与跟踪对运算硬件和算法的性能提出较高的要求。针对传统背景预测算法串行运算耗时较长的问题,以及经典的通用GPU(Graphic Processing Unit)体积与功耗过大难于整合到红外设备中的问题,提出在嵌入式GPU平台NVIDIA Jetson TK1中实现并行分离卷积的方法,利用CUDA(Compute Unified Device Architecture)实时执行背景预测算法,实现了在嵌入式GPU平台上高效的红外背景预测算法。实验结果表明,在保证正确预测背景的前提下,利用小体积、低功耗的嵌入式GPU平台可以将运算性能提高到串行运算的15倍以上。  相似文献   

7.
张聪  邢同举  罗颖  张静  孙强 《电子设计工程》2011,19(19):141-143,146
数学形态学运算是一种高度并行的运算,其计算量大而又如此广泛地应用于对实时性要求较高的诸多重要领域。为了提高数学形态学运算的速度,提出了一种基于CUDA架构的GPU并行数学形态学运算。文章详细描述了GPU硬件架构和CUDA编程模型,并给出了GPU腐蚀并行运算的详细实现过程以及编程过程中为充分利用GPU资源所需要注意的具体问题。实验结果表明,GPU并行数学形态学运算速度可达到几个数量级的提高。  相似文献   

8.
在JPEG2000中有损压缩算法即Daubechies9/7离散小波变换算法的基础上,提出在GPU上并行运算的实现方案。NVIDIA新发布的CUDA软硬件体系架构结合GeForce8800GTX硬件平台,利用GPU并行运算优势,特别是密集型运算应用,可以大幅提升运算速度。实验结果表明,在当前实验平台,在运算数据量相同和结果正确的前提下,GPU(GeForce8800GTX)运算速度是CPU(Intel Core2 Duo E6320,主频1866MHz)的6~12倍,并且运算量越大、运算资源分配越合理,运算效率提升越显著。  相似文献   

9.
基于GPU的数字全息实时再现系统设计及实验研究   总被引:1,自引:1,他引:0  
设计了基于图形处理单元(GPU,graphic processing unit)的数字全息实时再现(DHRTR,digital holography real-time reconstruction)系统,并以旋转骰子为研究对象,实验验证了DHRTR系统的有效性。相对CPU,GPU本身含有许多流处理器,通过并行运算可大大缩短数字全息图再现运算时间。利用统一计算设备架构(CUDA)的运算平台,编写了基于GPU处理器的实时再现软件,在对动态全息图进行连续采集的同时,即时对全息图进行再现,并实时显示再现结果。实验结果表明,本文系统可以实现平均帧速为20 frame/s、大小为512 pixels×512 pixels的数字全息图的实时再现。  相似文献   

10.
GPU(Graphics Processing Unit)较适合解决海量数据的并行计算问题,是当前除云计算平台之外的另一项重要的高性能并行运算技术。文章分析了GPU并行运算、CUDA技术和SMO(Sequential Minimal Optimization)算法的基本原理,并将上述技术相结合提出了一种基于CUDA+SMO的大数据并行学习方案(CUDA-SMO),并与传统基于CPU的SMO学习方案(CPU-SMO)进行对比。实验结果表明,CUDA-SMO方案与传统CPU-SMO方案相比具有相近的学习精度,但CUDA-SMO却大大提高了学习速度。CUDA-SMO方案大大提高了大数据挖掘的效率,是未来机器学习和大数据分析技术发展的重要方向。  相似文献   

11.
针对目前地层层析成像算法中正演算法存在计算量大、计算速度慢的问题,以图像处理器(GPU)为核心,研究并实现了一种基于GPU平台的时域有限差分(FDTD)正演算法。CUDA是一种由NVIDIA推出的GPU通用并行计算架构,也是目前较为成熟的GPU并行运算架构。而FDTD正演算法本身在算法特性上满足并行的要求,二者的结合将极大地加速程序的计算速度。在基于标准Marmousi速度模型的正演模拟中,程序速度提升30倍,而GPU正演图像与CPU正演结果误差小于千分之一。算例表明CUDA可以大大加速目前的FDTD正演算法,并且随着GPU硬件自身的发展和计算架构的不断改进,加速效果还将进一步提升,这将有利于后续波形反演工作的进展。  相似文献   

12.
黄兴  宋建新 《电视技术》2012,36(1):26-29
视频转码是个复杂的过程,它需要对已经压缩过的码流进行解析,然后经过处理转换成满足解码终端要求的目标格式码流。为了提高视频转码的效率并降低视频转码的计算复杂度,根据视频转码的要求和图形处理器的并行结构,提出了一种利用GPU强大的并行计算能力来加速视频转码的算法。该算法将视频转码过程中耗时最多、最复杂的运动估计和模式选择过程转移到GPU上并行执行。在开发GPU通用计算能力的时候,采用NVIDIA公司的CUDA(统一计算设备架构)计算平台。实验结果证明,该算法可以有效提高视频转码的速度和效率。  相似文献   

13.
统一计算设备架构(CUDA,ComputeUnifiedDeviceArchitecture)是并行计算中重要的研究与应用领域,如何将串行程序重构为并行程序以及如何将并行程序的速度最大化都成为研究的重点。前期搭建了单机单卡和单机多卡的实验环境,并在此平台上重构了一系列的密码算法。为了进一步提高破解平台的破解速度和稳定性,设计并实现了一种基于GPU集群(多机多卡)的暴力破解通用平台,并且在此平台上验证了MD5暴力破解的高速性和鲁棒性,为未来设计密码分析算法和提升算法性能提供了研究基础。  相似文献   

14.
The Rectilinear Steiner Minimum Tree (RSMT) problem is a fundamental one in VLSI physical design. In this paper, we present a maze routing based heuristics to solve the obstacle-avoiding RSMT (OARSMT) problem. Our approach can handle multi-pin nets in good quality and reasonable running time. We also present an implementation of the heuristics in parallel approach with the aid of graphic processing units (GPU). The parallel algorithm is implemented by using CUDA and has been tested on a NVIDIA graphic card. Our experimental results show that our parallel algorithm has promising speedups over our sequential approach. This work demonstrates that we can apply a parallel algorithm to solve the OARSMT problem with the aid of GPU.  相似文献   

15.
星图配准是星图处理应用中的一个重要步骤,因此星图配准的速度直接影响了星图处理的整体速度.近几年来,图形处理器(GPU)在通用计算领域得到快速的发展.结合GPU在通用计算领域的优势与星图配准面临的处理速度的问题,研究了基于GPU加速处理星图配准的算法.在已有配准算法的基础上,根据算法特点提出了相应的GPU并行设计模型,利用CUDA编程语言进行仿真实验.实验结果表明:相较于传统基于CPU的配准算法,基于GPU的并行设计模型同样达到了配准要求,且配准速度的加速比达到29.043倍.  相似文献   

16.
韩秉君  黄诗铭  杜滢 《电信科学》2015,31(10):82-88
提出了一种在 Kepler 架构 GPU(graphics processing unit,图形处理器)上利用 CUDA(compute unified device architecture,统一计算设备架构)技术加速通信仿真中DFT(discrete Fourier transform,离散傅里叶变换)处理过程的方法。该方法的核心思想是利用线程级并行技术实现单条收发链路内部DFT运算的并行加速,并利用动态并行和Hyper-Q技术实现不同收发用户对之间链路处理过程的并行加速,从而最终达到加速仿真中DFT处理过程的目的。实验结果表明,相对单核单线程CPU程序和上一代Fermi架构GPU程序,该方法分别能够将DFT处理速度提升300倍和3倍,具有较好的加速效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号