首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 812 毫秒
1.
董蕾  黄方  卜栓栓  冯杰  周纪 《信息技术》2016,(4):32-36,40
压缩感知重构算法存在计算量大、运行时间过长的问题,无法满足人们对算法处理实时/准实时性要求。最近几年,GPU计算能力得到很大的提升,已成为提高算法处理速度最有效的方式之一。根据GPU的硬件特性,文中提出了基于CUDA的压缩感知重构算法的并行设计。实验结果表明:在NVIDIA K20Xm平台上运行,并行算法取得的加速比可达到100X。  相似文献   

2.
谈继魁  方勇  霍迎秋 《电视技术》2015,39(15):42-45
重建算法在压缩感知理论中有着重要的作用,经典的正交匹配追踪(OMP)重建算法在每次迭代中对已选择的原子进行正交化处理以加速算法的收敛速度,但同时增加了算法的计算复杂度。针对这一问题,提出了一种基于图形处理单元(GPU)并行计算的OMP算法,重点对算法中复杂度高的投影和矩阵求逆部分在GPU平台上进行并行设计。实验结果表明基于GPU的并行OMP算法相对于其串行算法加速比可以达到30~44倍,有效地提高了算法的计算效率,拓宽了该算法的应用范围。  相似文献   

3.
为了对星图中空间目标进行检测识别,对基于 SURF(Speed-Up Robust Featrues)算法的星图精确配准技术和美国 SBV(Space-Based Visual)计划采用的 MTI(Moving Target Indicati-or)在轨目标检测算法进行了深入研究,提出一种针对16 Bits 星图的多目标检测算法,具体包括:首先利用 SURF 算法提取序列星图的特征点,根据最小二乘法计算得到的全局运动参数对星图进行精确配准;然后利用一种改进的 MTI 算法对序列星图进行时序多帧投影以抑制背景,得到仅含有疑似目标的序列图像;最后经过目标初始运动状态的建立,速度滤波以及坐标插值得到目标的运动轨迹。利用实拍的20帧序列星图验证算法性能,经本文算法配准后,星像质心的均方误差(RMSE,Root Mean Square Error)最小达到0.3269 pixel,平均值为0.5441 pixel;序列图像中的3个运动目标均被检出,且无虚警。实验结果表明,本文配准算法的精度能够满足时序多帧投影的要求,且目标检测算法符合恒虚警原理。  相似文献   

4.
随着GPU技术的快速发展,GPU的浮点运算能力飞速提升。将GPU浮点处理能力用于非图形计算领域正成为高性能计算领域的热点研究问题。Jacobi迭代法是科学计算中常用的计算方法。在分析了GPU和Jacobi迭代法特征的基础上,基于Nvidia的CUDA平台设计并实现了Jacobi迭代算法,并通过实验表明,相对于CPU取得了较好的加速效果。  相似文献   

5.
快速互信息匹配及GPU实现   总被引:1,自引:1,他引:0  
针对模板匹配中速度和精度不能兼顾的问题,提出了一种基于GPU的互信息配准方法。为了算法不至于太复杂而不能在GPU下运行,首先将图像二值化,使得GPU每个线程用到的临时变量减少到4个,然后利用GPU逐像素计算模板和焊缝图像的互信息。将所提算法应用到焊缝定位系统中,通过GPU来执行简化后的互信息计算,基于CUDA的实验表明,所提出的算法可以完成每秒约30帧的图像焊缝定位。  相似文献   

6.
《无线电工程》2016,(3):26-29
通用计算机的遥测信号处理系统通用性、灵活性强,不受硬件平台限制,便于开发、升级和维护,能够有效克服传统硬件平台的不足。多符号检测(MSD)算法性能优良,具有计算量大、并行度高的特点,适合在通用计算机上进行处理。针对如何提高处理速度,在通用计算机平台上研究基于图形处理器(GPU)的并行MSD算法,通过使用GPU对MSD算法并行加速,提高算法运算效率。实验结果表明,在同样条件下,基于GPU的并行MSD算法较串行算法最大可提速约134倍,能够有效提高处理速度。  相似文献   

7.
针对目前地层层析成像算法中正演算法存在计算量大、计算速度慢的问题,以图像处理器(GPU)为核心,研究并实现了一种基于GPU平台的时域有限差分(FDTD)正演算法。CUDA是一种由NVIDIA推出的GPU通用并行计算架构,也是目前较为成熟的GPU并行运算架构。而FDTD正演算法本身在算法特性上满足并行的要求,二者的结合将极大地加速程序的计算速度。在基于标准Marmousi速度模型的正演模拟中,程序速度提升30倍,而GPU正演图像与CPU正演结果误差小于千分之一。算例表明CUDA可以大大加速目前的FDTD正演算法,并且随着GPU硬件自身的发展和计算架构的不断改进,加速效果还将进一步提升,这将有利于后续波形反演工作的进展。  相似文献   

8.
针对基于群智能优化的点云配准算法计算时间长的问题,提出一种基于CUDA的并行粒子群配准算法.以点对点距离最短为适应度函数,利用粒子群算法各粒子天然的并行性,将运算过程分配到GPU的各个线程中计算变换参数.由于GPU多个线程运算同时执行互不干扰,极大地提高了粒子群的运算速度,从而可以实现点云的快速、精确配准.实验结果表明,该算法既克服了ICP算法对点云初始位置要求高的缺点,又有效解决了基于群智能优化的点云配准算法计算时间长的问题.  相似文献   

9.
针对多光源光照计算复杂,运算速度慢这一问题,提出了一种基于延迟光照的局部光照模型算法.首先介绍了现有的实时多光源光照模型算法,阐述了延迟光照处理的基本思想,提出了基于延迟光照的局部光照计算模型,并对纹理存储进行优化设计,基于GPU实现了加速绘制.实验证明,在取得较好的光照效果的同时,该算法计算速度也有明显提高.  相似文献   

10.
张凌洁  赵英 《电子设计工程》2012,20(17):15-18,22
Floyd-Warshall算法是图论中APSP(All-Pair Shortest Paths)问题的经典算法,为了加快计算速度,提出使用GPU通用计算来实现。文章先从算法的原理入手,层层深入,提出了可以在GPU上运行的并行F-W算法。之后,又根据矩阵分块的原理和GPU共享存储器的使用,实现了改进的GPU并行F-W算法。通过大量测试实验,得到了该GPU并行程序相对于传统CPU并行程序产生超过百倍的加速比的结论。  相似文献   

11.
针对红外图像边缘模糊,对比度低的问题,文中研究了改进的中值滤波和改进的Sobel边缘检测对红外图像进行处理。在对处理后图像的特征进行分析的基础上,研究了改进的Laplace金字塔分解的图像融合算法,并基于CUDA并行处理技术,在可编程GPU上实现了红外图像快速增强的目的。该算法结合GPU的内存特点,应用纹理映射、多点访问、并行触发技术,优化数据的存储结构,提高数据处理速度,适用于对红外图像增强的实时性要求较高的领域。实验结果表明,该算法有较好的并行特性,能充分利用CUDA的并行计算能力,提高了红外图像增强的实时性,处理分辨率为3 096×3 096的红外图像时加速比达32.189。  相似文献   

12.
随着计算机硬件技术的高速发展,图形处理器(Graphic processing unit,GPU)通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率,将CUDA技术应用于智能视频监控人体检测系统中,实验验证其高效性及可行性。最后对CUDA的发展方向进行了展望。  相似文献   

13.
刘昊 《电子质量》2010,(12):1-4
随着GPU的发展,其计算能力和访存带宽都超过了CPU,在GPU上进行通用计算具有成本低、性能高的特点。细胞神经网络由于其特有的性质,非常适合利用GPU进行并行计算,因此,该文提出了利用CU-DA实现的基于GPU的细胞神经网络异构算法,并应用在图像边缘检测上。实验结果证明,与传统的利用CPU实现的边缘检测方法相比,在速度上,基于GPU实现的图像边缘检测方法提高了数十倍,为细胞神经网络在实时图像、视频处理上的应用提供了新的方法。  相似文献   

14.
GPU计算液晶自适应光学波前重构的并行性研究   总被引:1,自引:2,他引:1  
研究了图形处理器(GPU)计算液晶自适应波前重构的并行性。介绍了液晶自适应光学的Zernike模式波前重构算法,论述了GPU的通用架构和GPU实现波前重构的方法。在此基础上提出了利用GPU拥有的RGBA4个颜色通道进行并行计算,进一步加快计算速度,最后给出了实验结果。结果表明:在GPU计算波前重构时,利用RGBA颜色通道的并行计算,将计算速度提高了3倍多。  相似文献   

15.
图像融合是图像理解和计算机视觉领域中的一项重要课题。随着图像规模的增大,图像融合面临着处理速度的挑战。最近几年,GPU面向通用计算应用得到了快速发展。本文基于GPU编程模型和硬件特性,深入研究了基于边缘强度的图像融合算法,提出了该算法的并行模型。实验结果表明,该方法有效地综合了源图像中的重要信息,融合图像边界清晰,得到较好视觉效果和较优的评价指标,执行速度与CPU上相比提高了3个数量级。  相似文献   

16.
合成孔径雷达(SAR)成像算法能够通过图形处理器(GPU)加速来实现处理速度的显著提升。针对后向投影(BP)成像算法的GPU加速,分析了BP算法的并行化和并行处理方法,提出了一种适合GPU加速的BP成像方案;通过研究GPU设计中的多流异步执行技术、数据传输模式和计算速度与精度,进一步提出一种针对BP成像的GPU优化成像方案。通过仿真数据和实测数据在Tesla C2075上的测试结果表明,与GPU非优化方案的实现相比,该方案有了近一倍的速度提升。  相似文献   

17.
王瑞  梁华  蔡宣平 《现代电子技术》2010,33(15):41-43,46
传统SIFT算法的优化和实现都是针对常用处理器(CPU)提出的,处理速度慢,实时性很难得到保证。通过实现基于NVIDIA公司CUDA架构图形处理器(GPU)的SIFT特征提取算法,优化了数据存储结构,提高了数据访问效率。实验结果表明,基于GPU的SIFT特征提取算法充分利用GPU的并行处理能力,计算速度提高幅度明显,图像越大越复杂,提高的幅度越大,处理1600×1200图像时甚至可达近15倍的加速比,极大地提高了SIFT算法在实际应用中的实时性。  相似文献   

18.
如何提高时域有限差分算法(FDTD)的运算效率一直是FDTD数值运算研究的核心问题之一.针对近年来图形处理器(GPU)运算能力的高速增长及GPU通用运算概念提出的背景,对GPU加速FDTD运算的潜力与研究现状进行了总结,并对GPU加速FDTD运算的并行实现原理进行了阐述,通过将其与其他典型硬件加速方式进行比较,指出了G...  相似文献   

19.
合成孔径雷达(SAR)成像处理是一项需要进行大量计算的处理任务。图形处理器(GPU)具有数十倍于CPU的浮点计算能力以及传输带宽,而CUDA 技术的发展使得GPU 能够方便地进行通用计算。该文提出了一种在GPU上进行SAR 成像的高效方法。与一般GPU 处理方法相比,该方法使得处理过程中的CPU-GPU 往返数据传输由4 次减少到1 次,而且同时利用了工作站上的CPU 与GPU 计算资源。实验结果表明,该方法能够带来相对一般GPU 处理方法2.3 倍的处理效率提升,从而验证了该方法的有效性。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号