期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

姜晓龙王建宋千周智敏《雷达科学与技术》2014,12(4):350-357

后向投影(BP)是一种精确的时域合成孔径雷达(SAR)成像算法,但是其巨大的运算量很难满足实时成像的要求,图形处理器(GPU)具有强大的浮点运算和高度的并行处理能力,为BP算法的实时成像提供了一个很好的平台。提出基于GPU的并行化BP算法,利用了四种优化方法对并行化BP算法进行加速,并且针对共享存储器的bank冲突问题提出了相应的解决方法,减少了共享存储器访问时间。最后给出仿真数据的成像结果,结果表明,与传统的基于CPU单线程的BP算法相比,成像速度可达到70倍以上的提升。相似文献

2.

一种子孔径ωK聚束SAR成像算法的GPU实现

司军陈家瑞《舰船电子对抗》2021,44(1)

合成孔径雷达(SAR)的数据运算量不断增加,图形处理器(GPU)为其处理提供了新的运算平台。但是GPU显存小,不足以容纳大场景SAR数据。通过研究聚束SAR成像模式特点,提出了一种适合GPU加速的子孔径成像方案,降低了该算法对GPU显存的要求。在Tesla C2075上的实验结果表明,该方案能够取得良好的成像效果,与CPU上的处理效率相比,有数10倍的速度提升。相似文献

3.

复杂轨迹合成孔径雷达后向投影算法图像流GPU成像 总被引：1，自引：0，他引：1

韦顺军蒲羚张晓玲师君《电讯技术》2016,56(8):879-886

相对于基于傅里叶变换的频域成像算法,后向投影( BP)算法因采用时域逐点相干积累,更适合于复杂轨迹合成孔径雷达( SAR)高精度成像。但BP算法计算量巨大,限制了其应用于SAR大场景大数据量快速成像。图形处理器( GPU)具有强大浮点运算和并行处理能力,为大场景BP算法快速成像实现提供了途径。结合GPU并行处理,提出了一种基于图像流的复杂运动SAR大场景BP快速成像处理方法。该方法借助BP算法中图像像素点相互独立处理的特性,采用图像像素点并行及图像流程处理,设计了孔径与图像缓存调度方案,提高SAR大场景大数据BP算法成像效率。仿真和机载实测数据结果验证了方法的有效性,在有限GPU显存条件下实现了8192×8192大场景快速成像,并且成像加速比相对于传统CPU单线程处理可达300倍以上。相似文献

4.

基于GPU的多模式SAR成像加速研究

下载免费PDF全文

白澜魏仁乐郭拯危赵建辉李宁《太赫兹科学与电子信息学报》2023,21(8):1037-1042

针对多模式合成孔径雷达(SAR)成像处理中存在的计算效率不足问题,提出了一种基于GPU的多模式SAR统一成像并行加速方法。为充分利用GPU的显存资源,提高算法的运算效率,利用共享内存对矩阵转置、矩阵相乘等部分进行大规模数据并行计算。实验结果表明,该算法大幅度提升了多模式SAR成像的计算效率,最高加速比达到55.62,解决了GPU显存空间利用率较低的问题。相似文献

5.

基于NVIDIA GPU 的机载SAR 实时成像处理算法CUDA 设计与实现

下载免费PDF全文

孟大地胡玉新石涛孙蕊李晓波《雷达学报》2013,2(4):481-491

合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit, CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR 成像处理算法实现方案。该方案解决了GPU 显存不足以容纳一景SAR 数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU 设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C 和INTEL E5645 上的测试表明,与传统基于GPU 的SAR 成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。相似文献

6.

基于GPU加速的地震图像重建技术

许盼兮张东孙尽尧《半导体光电》2013,34(5):852-857

针对目前地层层析成像算法中正演算法存在计算量大、计算速度慢的问题,以图像处理器(GPU)为核心,研究并实现了一种基于GPU平台的时域有限差分(FDTD)正演算法。CUDA是一种由NVIDIA推出的GPU通用并行计算架构,也是目前较为成熟的GPU并行运算架构。而FDTD正演算法本身在算法特性上满足并行的要求,二者的结合将极大地加速程序的计算速度。在基于标准Marmousi速度模型的正演模拟中,程序速度提升30倍,而GPU正演图像与CPU正演结果误差小于千分之一。算例表明CUDA可以大大加速目前的FDTD正演算法,并且随着GPU硬件自身的发展和计算架构的不断改进,加速效果还将进一步提升,这将有利于后续波形反演工作的进展。相似文献

7.

基于GPU的遥感图像前期处理算法研究与应用

《现代电子技术》2016,(3)

针对传统的遥感图像前期处理算法在面对海量地面数据时计算时间很难满足需求的问题,基于RPC模型的遥感成像几何校正算法的并行加速和基于SIFT特征提取的图像匹配技术的并行加速研究。针对几何校正的主要步骤及其速度瓶颈问题,提出了可采用的并行加速方法,同时结合SIFT的特点提出了并行优化加速的方案。采用基于数据划分的并行方法对遥感图像的几何校正和SIFT特征提取算法进行加速。最后利用CUDA环境,在CPU+GPU异构系统下,设计试验对两个算法优化并行提速,试验结果表明,提出的加速方案和优化算法能大幅提高遥感图像的前期处理效率。相似文献

8.

基于GPU的圆迹视频SAR实时成像算法

苟立婷李勇朱岱寅魏煜宁《雷达科学与技术》2019,17(5):550-556

视频SAR要求高分辨率实时成像,很多成像算法在高分辨率成像时,算法复杂度较高,使用中央处理器（CPU）处理无法实时成像。为解决这一问题,该文提出了一种基于图形处理器（GPU）的圆迹视频SAR实时成像算法。该算法首先根据帧率与重叠率的关系截取回波数据,然后将极坐标格式算法（PFA）中传统的两维插值用效率更高的Chirp Scaling操作代替,并且利用3种优化技术对PFA的GPU实现进行加速。实验结果表明,该文所用成像算法帧率能达到5Hz,满足视频SAR实时成像的速度要求。相似文献

9.

基于图形处理器的合成孔径声呐实时距离多普勒成像算法

钟何平唐劲松张森张学波田振《电子与信息学报》2014,36(8):1899-1904

该文提出一种基于图形处理器(GPU)的距离多普勒成像算法(RDA),为合成孔径声呐(SAS)的实时成像提供了新的途径。通过GPU平台上的并行方法进行距离向脉冲压缩、固定相位补偿和方位向脉冲压缩,显著提升了距离多普勒成像算法效率。仿真和实验结果表明:在满足成像分辨率的前提下,该文设计的基于GPU的并行RDA和CPU串行算法相比,加速比可达到22,满足实时SAS成像需求。相似文献

10.

利用GPU实现SAR图像的并行处理

张晓东孔祥辉张欢阳《电子科技》2011,24(11):94-95

利用GPU计算处理能力,实现并行RD成像算法。提出了一种具有高并行度机载SAR实时并行成像算法实现方案。对实测数据进行成像处理结果表明,文中所提方案能够满足实时成像处理要求,同时与传统实时成像处理系统相比较,能够大幅降低硬件、软件开发成本和周期。相似文献

11.

基于GPU的SIFT特征提取算法研究

王瑞梁华蔡宣平《现代电子技术》2010,33(15):41-43,46

传统SIFT算法的优化和实现都是针对常用处理器（CPU）提出的,处理速度慢,实时性很难得到保证。通过实现基于NVIDIA公司CUDA架构图形处理器（GPU）的SIFT特征提取算法,优化了数据存储结构,提高了数据访问效率。实验结果表明,基于GPU的SIFT特征提取算法充分利用GPU的并行处理能力,计算速度提高幅度明显,图像越大越复杂,提高的幅度越大,处理1600×1200图像时甚至可达近15倍的加速比,极大地提高了SIFT算法在实际应用中的实时性。相似文献

12.

自适应光学数值仿真成像在GPU上的实现

吴振华唐秋艳王中杰马文静龙国平李玉成《大气与环境光学学报》2014,9(3):237-243

在自适应光学(AO)系统中,成像是不可或缺的一部分。AO仿真系统中的探测器和哈特曼-夏克波前传感器的成像过程一般用二维的离散卷积来计算,而通常它的数值算法用快速傅立叶变换(FFT)实现。但是随着矩阵维数的增加,卷积的运算量会急剧增大,成为制约整个AO仿真效率的一个瓶颈。利用图形处理器(GPU)的强大计算能力,可以使成像系统运行速度大幅提高。在NVIDIA Tesla C2050 GPU上,针对不同分辨率的图像,获得了相对于串行程序5-24倍的加速比。相似文献

13.

一种基于Kepler架构GPU的通信仿真加速方法

下载免费PDF全文

韩秉君黄诗铭杜滢《电信科学》2015,31(10):82-88

提出了一种在 Kepler 架构 GPU（graphics processing unit,图形处理器）上利用 CUDA（compute unified device architecture,统一计算设备架构）技术加速通信仿真中DFT（discrete Fourier transform,离散傅里叶变换）处理过程的方法。该方法的核心思想是利用线程级并行技术实现单条收发链路内部DFT运算的并行加速,并利用动态并行和Hyper-Q技术实现不同收发用户对之间链路处理过程的并行加速,从而最终达到加速仿真中DFT处理过程的目的。实验结果表明,相对单核单线程CPU程序和上一代Fermi架构GPU程序,该方法分别能够将DFT处理速度提升300倍和3倍,具有较好的加速效果。相似文献

14.

一种基于GPU的高效合成孔径雷达信号处理器 总被引：1，自引：1，他引：0

下载免费PDF全文

俞惊雷柳彬王开志刘兴钊郁文贤《太赫兹科学与电子信息学报》2010,8(4):415-419

随着合成孔径雷达（SAR）应用的不断扩展,其所需要处理的数据量也在不断增加,传统的SAR信号处理器的处理速度成为其应用扩展的瓶颈。为了应对这些挑战,需要高效的SAR信号处理器来加快计算速度。文章利用图形处理器（GPU）这一新颖高效的的计算平台进行SAR信号处理,利用GPU通用并行计算,使用CUDA实现SAR成像算法,充分发挥其计算能力。实验结果表明,其处理速度是基于CPU的传统SAR信号处理器的10倍以上。它为解决在未来SAR信号处理中可能出现的问题提供了一种可靠的方法。相似文献

15.

利用GPU实现SAR图像的并行处理

张晓东孔祥辉张欢阳《火控雷达技术》2011,(4):32-34

利用GPU的计算处理能力来实现并行的RD成像算法,提出了一种具有高并行度的机载SAR实时并行成像算法实现方案。对实测数据进行成像处理的结果表明,本文提出的方案能够满足实时成像处理的要求,同时与传统实时成像处理系统相比较,能够大幅度的降低硬件成本和软件开发成本和周期。相似文献

16.

基于GPU通用计算CUDA架构的人体检测技术

周晓阳《电子工程师》2012,(2):41-43

随着计算机硬件技术的高速发展,图形处理器（Graphic processing unit,GPU）通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率,将CUDA技术应用于智能视频监控人体检测系统中,实验验证其高效性及可行性。最后对CUDA的发展方向进行了展望。相似文献

17.

基于压缩感知的多发多收高分辨SAR成像算法研究

常俊飞张顺生《火控雷达技术》2011,(4):25-31

压缩感知理论指出,稀疏信号可以通过以低于奈奎斯特采样的测量数据重建出原始信号。针对高分辨率SAR成像在奈奎斯特理论下所面临的高速A／D采样、大数据量存储、传输等问题挑战。本文提出了一种基于压缩感知理论的多发多收高分辨率SAR二维成像算法。该算法减轻了高分辨率SAR成像的压力,采用压缩感知处理降低了A／D采样速率、数据量... 相似文献