期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

司军陈家瑞《舰船电子对抗》2021,(1)

合成孔径雷达(SAR)的数据运算量不断增加,图形处理器(GPU)为其处理提供了新的运算平台。但是GPU显存小,不足以容纳大场景SAR数据。通过研究聚束SAR成像模式特点,提出了一种适合GPU加速的子孔径成像方案,降低了该算法对GPU显存的要求。在Tesla C2075上的实验结果表明,该方案能够取得良好的成像效果,与CPU上的处理效率相比,有数10倍的速度提升。相似文献

2.

复杂轨迹合成孔径雷达后向投影算法图像流GPU成像 总被引：1，自引：0，他引：1

韦顺军蒲羚张晓玲师君《电讯技术》2016,56(8):879-886

相对于基于傅里叶变换的频域成像算法,后向投影( BP)算法因采用时域逐点相干积累,更适合于复杂轨迹合成孔径雷达( SAR)高精度成像。但BP算法计算量巨大,限制了其应用于SAR大场景大数据量快速成像。图形处理器( GPU)具有强大浮点运算和并行处理能力,为大场景BP算法快速成像实现提供了途径。结合GPU并行处理,提出了一种基于图像流的复杂运动SAR大场景BP快速成像处理方法。该方法借助BP算法中图像像素点相互独立处理的特性,采用图像像素点并行及图像流程处理,设计了孔径与图像缓存调度方案,提高SAR大场景大数据BP算法成像效率。仿真和机载实测数据结果验证了方法的有效性,在有限GPU显存条件下实现了8192×8192大场景快速成像,并且成像加速比相对于传统CPU单线程处理可达300倍以上。相似文献

3.

基于NVIDIA GPU 的机载SAR 实时成像处理算法CUDA 设计与实现

下载免费PDF全文

孟大地胡玉新石涛孙蕊李晓波《雷达学报》2013,2(4):481-491

合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit, CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR 成像处理算法实现方案。该方案解决了GPU 显存不足以容纳一景SAR 数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU 设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C 和INTEL E5645 上的测试表明,与传统基于GPU 的SAR 成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。相似文献

4.

后向投影成像算法的GPU优化方法研究

下载免费PDF全文

班阳阳张劲东陈家瑞邱晓燕《雷达科学与技术》2014,12(6):659-665

合成孔径雷达(SAR)成像算法能够通过图形处理器(GPU)加速来实现处理速度的显著提升。针对后向投影(BP)成像算法的GPU加速,分析了BP算法的并行化和并行处理方法,提出了一种适合GPU加速的BP成像方案;通过研究GPU设计中的多流异步执行技术、数据传输模式和计算速度与精度,进一步提出一种针对BP成像的GPU优化成像方案。通过仿真数据和实测数据在Tesla C2075上的测试结果表明,与GPU非优化方案的实现相比,该方案有了近一倍的速度提升。相似文献

5.

基于GPU的高分辨率星载SAR成像处理研究

侯明辉《电子科技》2013,26(10):29-32,35

由于在传统的CPU 平台上进行计算耗时量大,一方面由于SAR回波数据量大,另一方面成像算法复杂。而处理核心众多则是GPU一大优势,适合独立并行结构算法的加速。文中借助GPU 强大的浮点运算和高度的并行处理能力,将SAR成像中ECSA算法在GPU上进行了验证,并得出较好的效果,综合(计算时间+IO时间)加速比有了一定提高。在高分辨率星载SAR成像领域中,CUDA-GPU的运用将是未来发展方向,文中给出了利用GPU处理星载SAR数据可行的初步结论,为进一步优化程序奠定了基础。相似文献

6.

基于GPU的圆迹视频SAR实时成像算法

下载免费PDF全文

苟立婷李勇朱岱寅魏煜宁《雷达科学与技术》2019,17(5):550-556

视频SAR要求高分辨率实时成像,很多成像算法在高分辨率成像时,算法复杂度较高,使用中央处理器（CPU）处理无法实时成像。为解决这一问题,该文提出了一种基于图形处理器（GPU）的圆迹视频SAR实时成像算法。该算法首先根据帧率与重叠率的关系截取回波数据,然后将极坐标格式算法（PFA）中传统的两维插值用效率更高的Chirp Scaling操作代替,并且利用3种优化技术对PFA的GPU实现进行加速。实验结果表明,该文所用成像算法帧率能达到5Hz,满足视频SAR实时成像的速度要求。相似文献

7.

利用CUDA实现的基于GPU的SAR成像算法 总被引：2，自引：0，他引：2

柳彬王开志刘兴钊郁文贤《信息技术》2009,(11):62-65

高速发展的图形处理器（Graphics Processing Unit,GPU）为高效合成孔径雷达（Synthetic Aperture Radar,SAR）成像算法提供了具有发展前景的新型运算平台。与CPU相比,利用GPU进行通用计算具有成本低、性能高的特点。提出利用CUDA实现的基于GPU的SAR成像算法,与传统的基于CPU的成像算法相比,有两位数以上的效率提升,为应对SAR信号处理领域新的挑战提供具有前景的研究方向。相似文献

8.

基于冗余计算约简的环扫SAR回波多GPU快速模拟

胡辰张帆李国君李伟崔忠马《雷达学报》2016,5(4):434-443

环扫SAR作为一种特殊工作模式雷达,在对地观测方面有着广泛应用。随着分辨率提高及测绘带宽增大,对环扫SAR成像精度提出了更高的要求。而快速的海量回波模拟方法能够对高精度成像算法设计、研究提供有力的支撑。本文给出一种基于多GPU(Graphics Processing Unit,图形处理器)的环扫SAR回波模拟方法,并在此基础上进行冗余计算优化,通过MPI(Message Passing Interface,消息传递接口)在多GPU上进行了实现,实验结果表明在使用4块GPU的条件下,经过冗余计算约简,并行效率提高2倍以上,硬件成本降低50%,相对传统CPU串行仿真提高350倍左右。相似文献

9.

SAR实时成像高效矩阵转置研究和实现 总被引：1，自引：0，他引：1

鲍胜荣周海斌《现代雷达》2013,35(3):24-27

矩阵转置是SAR成像处理中的重要运算,SAR成像的实时巨量数据处理对基于片外存储的矩阵转置算法效率提出了很高的要求,而目前的实时转置算法实现的效率都偏低.文中通过分析片外存储特性,研究和提出适用于SAR实时成像的矩阵转置算法,占有片内资源少,读写平衡且效率高,配置灵活可组合成较复杂的矩阵转置形式,目前已成功应用于多种模式的SAR成像处理. 相似文献

10.

基于GPU加速和RCS演算的SAR回波生成系统

《信息技术》2017,(4)

提出了一种基于GPU加速的合成孔径雷达(SAR)回波生成系统。为了使生成的回波更加精确,该系统考虑了SAR照射场景中散射中心的雷达散射截面积(RCS)在合成孔径时间内的变化。这种现象在雷达入射角度变化较大时是不可忽略的。通过RCS的高频近似,给出了后向散射系数关于入射角和瞬时斜距的表达式。由此,在给定数字高程信息(DEM)和雷达入射角度范围后,照射场景中每个散射中心在不同方位时刻的后向散射系数就可以精确的计算得到。然后,详细介绍了基于GPU和CPU混合的SAR回波生成系统的实现过程。该系统根据SAR回波矩阵的对称特性降低了回波生成的运算复杂度,并运用了GPU矩阵运算的能力,大大提升了SAR回波矩阵的运算效率。文中的实验结果证明,该系统有很高的计算效率和输出精度。相似文献

11.

基于GPU的后向投影SAR成像算法 总被引：1，自引：0，他引：1

下载免费PDF全文

姜晓龙王建宋千周智敏《雷达科学与技术》2014,12(4):350-357

后向投影(BP)是一种精确的时域合成孔径雷达(SAR)成像算法,但是其巨大的运算量很难满足实时成像的要求,图形处理器(GPU)具有强大的浮点运算和高度的并行处理能力,为BP算法的实时成像提供了一个很好的平台。提出基于GPU的并行化BP算法,利用了四种优化方法对并行化BP算法进行加速,并且针对共享存储器的bank冲突问题提出了相应的解决方法,减少了共享存储器访问时间。最后给出仿真数据的成像结果,结果表明,与传统的基于CPU单线程的BP算法相比,成像速度可达到70倍以上的提升。相似文献

12.

简化球谐近似模型的图形处理器加速求解

下载免费PDF全文

贺小伟陈政侯榆青郭红波《红外与激光工程》2016,45(6):624002-0624002(7)

作为辐射传输方程的高阶近似,简化球谐近似模型成为近年光学分子成像研究的重点,但计算效率低限制了它的广泛应用,为此提出一种基于图形处理器的并行加速策略,采用NVIDIA公司推出的统一计算设备架构,对求解过程中耗时最多的两个模块有限元刚度矩阵的生成和线性方程组的求解进行基于图形处理器的并行加速;根据统一计算设备架构的特点,进行计算任务的分配、存储器的合理使用以及数据的预处理三方面的优化;仿体及数字鼠仿真实验对比刚度矩阵生成时间以及平均迭代时间,以评价所提出方法的加速效果。实验结果表明,该方法可使求解速度提高30倍左右,展示了该方法在光学分子成像中的优势及潜力。相似文献

13.

基于GPU的并行APSP问题的研究

张凌洁赵英《电子设计工程》2012,20(17):15-18,22

Floyd-Warshall算法是图论中APSP(All-Pair Shortest Paths)问题的经典算法,为了加快计算速度,提出使用GPU通用计算来实现。文章先从算法的原理入手,层层深入,提出了可以在GPU上运行的并行F-W算法。之后,又根据矩阵分块的原理和GPU共享存储器的使用,实现了改进的GPU并行F-W算法。通过大量测试实验,得到了该GPU并行程序相对于传统CPU并行程序产生超过百倍的加速比的结论。相似文献

14.

基于开放运算语言加速的数字全息卷积重建算法实现

罗洪艳周珞一赵震郭洪冯晓波《电子与信息学报》2022,44(9):3258-3265

针对数字全息重建算法计算速度慢、实时应用能力弱以及现有GPU加速策略跨平台移植性差等问题，该文提出一种利用开放运算语言(OpenCL)架构提高数字全息重建算法执行效率的方案。该方案充分利用OpenCL架构的异构协同计算能力，对数字全息卷积重建算法进行CPU+GPU的异构运行设计，并采用数据并行模式编程实现。针对不同分辨率数字全息图、不同GPU加速平台的测试结果表明，该加速策略的平均执行时间均比CPU低1个数量级，最高总加速比达到54.2，并行运算加速比甚至高达94.7，且具有规模增长性及良好的跨平台特性，加速效率显著，更加适用于数字全息技术的工程化实现及实时性应用场合。相似文献

15.

一种基于GPU 的SAR 高效成像处理算法

下载免费PDF全文

孟大地胡玉新丁赤飚《雷达学报》2013,2(2):210-217

合成孔径雷达(SAR)成像处理是一项需要进行大量计算的处理任务。图形处理器(GPU)具有数十倍于CPU的浮点计算能力以及传输带宽,而CUDA 技术的发展使得GPU 能够方便地进行通用计算。该文提出了一种在GPU上进行SAR 成像的高效方法。与一般GPU 处理方法相比,该方法使得处理过程中的CPU-GPU 往返数据传输由4 次减少到1 次,而且同时利用了工作站上的CPU 与GPU 计算资源。实验结果表明,该方法能够带来相对一般GPU 处理方法2.3 倍的处理效率提升,从而验证了该方法的有效性。相似文献