期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李龙飞贺占庄徐丹妮《微电子学与计算机》2014,(3)

以CUDA架构为例,对传统的CPU+单GPU架构进行了分析,提出了一种CPU+多GPU异构协同计算的系统方案,对关键的CPU对多GPU的管理及多GPU间数据通信等问题做了重点讨论,从理论上进行了可行性分析,并提出了相应的优化方法. 相似文献

2.

基于CUDA编程接口的GPU Trace模块设计

刘士谦《无线互联科技》2022,(2):63-64

面对互联时代海量的信息数据,图形处理器凭借极强的并行计算处理能力,通过GPU+CPU的架构为现代无线接入网设备的信号处理,提供了一种理想的技术手段.文章设计了一款基于CUDA编程接口的GPU Trace模块,用于在GPU+CPU平台架构中跟踪记录GPU的运行信息. 相似文献

3.

基于GPU的AES算法实现

商凯胡艳《电子技术》2011,38(5):9-11

近几年图形处理器GPU的通用计算能力发展迅速,现在已经发展成为具有巨大并行运算能力的多核处理器,而CUDA架构的推出突破了传统GPU开发方式的束缚,把GPU巨大的通用计算能力解放了出来.本文利用GPU来加速AES算法,即利用GPU作为CPU的协处理器,将AES算法在GPU上实现,以提高计算的吞吐量.最后在GPU和CPU... 相似文献

4.

基于GPU的软件化雷达恒虚警概率算法实现

下载免费PDF全文

贾可李世丹郭燕王德生《太赫兹科学与电子信息学报》2012,10(5):525-527

高效实现恒虚警概率检测(CFAR)是新型雷达终端信号处理系统研制的重要部分。在基于图形处理器(GPU)的软件化雷达终端架构下,采用统一计算设备架构(CUDA)技术,并根据GPU的特点对算法实现进行优化,实现了高效的软件化CFAR算法,相比CPU软件实现大大缩短了数据处理时间,能够满足雷达信号处理对实时性的需求,同时验证了研发基于GPU的软件化雷达终端具有较高的可行性。相似文献

5.

CUDA并行计算的应用研究 总被引：3，自引：0，他引：3

董荦葛万成陈康力《信息技术》2010,(4):11-15

统一设备架构(CUDA)是NVIDIA公司提出的一个基于GPU通用计算的开发环境,它针对GPU多处理单元的特性,通过并行计算提高大规模运算的速度.根据CUDA技术的特点,提出了基于CUDA的并行图像锐化、中值滤波和字符搜索算法,并论述其关键技术和基本执行流程.试验结果表明,提出的方法相对于CPU方法在运算速度上有不同程度的提高和下降.这同时体现了CUDA的优势和局限性,为其更复杂的应用提供了参考和依据. 相似文献

6.

基于CPU/GPU集群的编程的研究

刘钢锋《微电子学与计算机》2013,30(2)

随着微处理器技术的发展,GPU/CPU的混合计算已经成为是科学计算的主流趋势.本文从编程的层面,介绍了如何利用已有的并行编程语言来,调度GPU的计算功能,主要以MPI(一种消息传递编程模型)与基于GPU的CUDA(统一计算设备架构)编程模型相结合的方式进行GPU集群程序的测试,并分析了CPU/GPU集群并行环境下的运行特点.从分析的特点中总结出GPU集群较优策略,从而为提高CPU/GPU并行程序性能提供科学依据. 相似文献

7.

GPU并行计算技术分析与应用

张朝晖刘俊起徐勤建《信息技术》2009,(11):86-89

分析了将GPU并行计算技术用于通用计算的可行性,简要介绍CUDA架构编程,并以一个应用实例对GPU并行计算的性能进行了验证,测试表明GPU加速通用计算的优良性能,最后总结了GPU并行计算技术的运用模式。相似文献

8.

基于GPU的线性调频信号脉冲压缩算法实现

董亚清《电子科技》2013,26(12):12-16

利用NVIDA公司开发的CUDA技术对线性调频信号脉冲压缩算法进行了研究。用CUDA C和C语言分别在GPU、CPU平台对该算法进行仿真,并对程序执行时间做出了比较。实验结果表明,在GPU平台上实现脉冲压缩算法的运算效率明显优于在CPU上。相似文献

9.

利用CUDA实现上位机的实时目标跟踪

下载免费PDF全文

邓浩杨菲潘旭东游安清《太赫兹科学与电子信息学报》2010,8(3):368-371

在上位机进行实时目标跟踪,使用传统的CPU进行计算往往由于数据处理量大而消耗很多计算时间,影响实时性和跟踪效果。近年来,nVidia公司提出的CUDA架构利用GPU进行并行计算,极大提高了运算速度。本文在介绍CUDA架构的特性及软硬件实现原理的基础上,利用CUDA来实现上位机的实时目标跟踪,并与传统方法的计算速度进行了比较。结果表明,CUDA的应用使上位机目标跟踪的实时性得到了很大提升,可以将其应用于其它众多领域。相似文献

10.

基于GPU加速的地震图像重建技术

许盼兮张东孙尽尧《半导体光电》2013,34(5):852-857

针对目前地层层析成像算法中正演算法存在计算量大、计算速度慢的问题,以图像处理器(GPU)为核心,研究并实现了一种基于GPU平台的时域有限差分(FDTD)正演算法。CUDA是一种由NVIDIA推出的GPU通用并行计算架构,也是目前较为成熟的GPU并行运算架构。而FDTD正演算法本身在算法特性上满足并行的要求,二者的结合将极大地加速程序的计算速度。在基于标准Marmousi速度模型的正演模拟中,程序速度提升30倍,而GPU正演图像与CPU正演结果误差小于千分之一。算例表明CUDA可以大大加速目前的FDTD正演算法,并且随着GPU硬件自身的发展和计算架构的不断改进,加速效果还将进一步提升,这将有利于后续波形反演工作的进展。相似文献

11.

基于异构平台的细胞神经网络算法研究

刘昊《电子质量》2010,(12):1-4

随着GPU的发展,其计算能力和访存带宽都超过了CPU,在GPU上进行通用计算具有成本低、性能高的特点。细胞神经网络由于其特有的性质,非常适合利用GPU进行并行计算,因此,该文提出了利用CU-DA实现的基于GPU的细胞神经网络异构算法,并应用在图像边缘检测上。实验结果证明,与传统的利用CPU实现的边缘检测方法相比,在速度上,基于GPU实现的图像边缘检测方法提高了数十倍,为细胞神经网络在实时图像、视频处理上的应用提供了新的方法。相似文献

12.

在GPU上实现Jacobi迭代法的分析与设计

吴玫华《电子设计工程》2012,20(10):28-30

随着GPU技术的快速发展,GPU的浮点运算能力飞速提升。将GPU浮点处理能力用于非图形计算领域正成为高性能计算领域的热点研究问题。Jacobi迭代法是科学计算中常用的计算方法。在分析了GPU和Jacobi迭代法特征的基础上,基于Nvidia的CUDA平台设计并实现了Jacobi迭代算法,并通过实验表明,相对于CPU取得了较好的加速效果。相似文献

13.

基于GPU的星图配准算法并行程序设计

下载免费PDF全文

陈茜邱跃洪易红伟《红外与激光工程》2014,43(11):3756-3761

星图配准是星图处理应用中的一个重要步骤,因此星图配准的速度直接影响了星图处理的整体速度.近几年来,图形处理器(GPU)在通用计算领域得到快速的发展.结合GPU在通用计算领域的优势与星图配准面临的处理速度的问题,研究了基于GPU加速处理星图配准的算法.在已有配准算法的基础上,根据算法特点提出了相应的GPU并行设计模型,利用CUDA编程语言进行仿真实验.实验结果表明:相较于传统基于CPU的配准算法,基于GPU的并行设计模型同样达到了配准要求,且配准速度的加速比达到29.043倍. 相似文献

14.

一种基于GPU 的SAR 高效成像处理算法

下载免费PDF全文

孟大地胡玉新丁赤飚《雷达学报》2013,2(2):210-217

合成孔径雷达(SAR)成像处理是一项需要进行大量计算的处理任务。图形处理器(GPU)具有数十倍于CPU的浮点计算能力以及传输带宽,而CUDA 技术的发展使得GPU 能够方便地进行通用计算。该文提出了一种在GPU上进行SAR 成像的高效方法。与一般GPU 处理方法相比,该方法使得处理过程中的CPU-GPU 往返数据传输由4 次减少到1 次,而且同时利用了工作站上的CPU 与GPU 计算资源。实验结果表明,该方法能够带来相对一般GPU 处理方法2.3 倍的处理效率提升,从而验证了该方法的有效性。相似文献

15.

基于GPU的MTD性能优化

杨千禾袁子乔扈月松《火控雷达技术》2021,50(1):86-93

为了解决传统雷达信号处理机在研发阶段面临的调试困难,计算能力受硬件限制及程序复用性差等问题,本文提出了使用GPU作为雷达计算核心的方案。在使用GPU实现雷达信号处理算法的过程中,动目标检测(MTD)部分的优化效果远低于脉冲压缩和恒虚警检测。经过分析,MTD过程中的矩阵转置与向量点乘占据了算法的大量时间。本文从GPU的数据读取方式和CUDA函数特性入手,优化快速傅里叶变换实现MTD的过程,并在GPU上使用CUBLAS矩阵运算实现有限脉冲响应滤波器组对脉冲压缩之后数据的滤波,实现了更具灵活性的MTD。最终得到的GPU计算结果与CPU平台实现的结果相比,误差不超过0.05%,同时实现了相比CPU平台优化实现最多200余倍的性能提升。相似文献

16.

基于GPU的视频转码技术研究

黄兴宋建新《电视技术》2012,36(1):26-29

视频转码是个复杂的过程,它需要对已经压缩过的码流进行解析,然后经过处理转换成满足解码终端要求的目标格式码流。为了提高视频转码的效率并降低视频转码的计算复杂度,根据视频转码的要求和图形处理器的并行结构,提出了一种利用GPU强大的并行计算能力来加速视频转码的算法。该算法将视频转码过程中耗时最多、最复杂的运动估计和模式选择过程转移到GPU上并行执行。在开发GPU通用计算能力的时候,采用NVIDIA公司的CUDA(统一计算设备架构)计算平台。实验结果证明,该算法可以有效提高视频转码的速度和效率。相似文献

17.

基于GPU的高性能并行计算应用

孙成刚李峥唐冬冬李翔滕红《电子信息对抗技术》2012,(2):69-73

采用基于CUDA（compute unified device architecture,统一计算设备架构）的GPU（graphic pro-cessing unit,图形处理器）与CPU协作处理方法,实现了基于时差最小测量误差的任意站定位算法的实时处理。本方法的处理速度相较于单CPU平台可以提高一至两个数量级,相较于同等处理速度的多CPU平台则体现了开发周期短、费用低、工作量小和可靠性高等众多优势。相似文献