首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
面对互联时代海量的信息数据,图形处理器凭借极强的并行计算处理能力,通过GPU+CPU的架构为现代无线接入网设备的信号处理,提供了一种理想的技术手段.文章设计了一款基于CUDA编程接口的GPU Trace模块,用于在GPU+CPU平台架构中跟踪记录GPU的运行信息.  相似文献   

2.
近年来,图形处理器(Graphic Process Unit,GPU)的快速发展使得其逐步用于通用计算。在性能各异的并行计算平台中,英伟达(NVIDIA)公司推出的计算统一设备架构(Compute Unified Device Architecture,CUDA)因为充分利用GPU(Graphic Processing Unit)强大的计算能力实现了通用并行计算而受到研究者们的青睐。  相似文献   

3.
GPU会取代CPU?     
早在2002年,GPU供应商就将32位浮点技术搭载在GPU中,期待研究人员和开发人员会将GPU超强的计算能力用于应用程序而不是图形。但早期的GPU是用类似OpenGL或Cg的图形API编程的,这些API很难且大多数开发人员也不熟悉,另外,由于GPU内部缓存远远小于CPU,它只能执行预定好的任务,并不能像CPU那样去执行自定义的任务,所以尽管GPU浮点运算速度要远远高于CPU,但它还不能染指CPU的领域。  相似文献   

4.
如何提高时域有限差分算法(FDTD)的运算效率一直是FDTD数值运算研究的核心问题之一.针对近年来图形处理器(GPU)运算能力的高速增长及GPU通用运算概念提出的背景,对GPU加速FDTD运算的潜力与研究现状进行了总结,并对GPU加速FDTD运算的并行实现原理进行了阐述,通过将其与其他典型硬件加速方式进行比较,指出了G...  相似文献   

5.
CT数据的获取过程和CT图像的重建过程与图形学的渲染过程极其相似,因此利用图形处理器(GPU)来加速CT重建算法成为了近年来CT研究的热点之一.本文根据单层螺旋CT数据的特点,构造了"平行-扇束"投影模式,实现了基于GPU的单层螺旋CT的三维图像重建算法.数值实验表明,与CPU上的分层重建相比重建速度提高10倍以上.  相似文献   

6.
目前,GPU(图形处理器)的应用领域正在迅速地从游戏向用户界面扩展。多数面向下一代数字消费类设备的SoC中都集成了GPU,如瑞萨科技公司和NTF DoCoMo公司等合作开发的用于手机的SH- Mobile G3、NEC电子公司用于车载  相似文献   

7.
随着GPU技术的快速发展,GPU的浮点运算能力飞速提升。将GPU浮点处理能力用于非图形计算领域正成为高性能计算领域的热点研究问题。Jacobi迭代法是科学计算中常用的计算方法。在分析了GPU和Jacobi迭代法特征的基础上,基于Nvidia的CUDA平台设计并实现了Jacobi迭代算法,并通过实验表明,相对于CPU取得了较好的加速效果。  相似文献   

8.
GIS栅格数据分析方法是在GIS数据处理有十分重要的地位。但是,利用CPU计算密集型栅格数据会让计算机显得力不从心。在过去的几年中,GPU处理数据的速度远远超过了CPU,由于这个原因,许多学者提出了,利用图形显示芯片(GPU)来为地理学,几何图形以及数据库运算服务。本文提出了一种基于GPU的通用框架来实现GIS栅格数据操作,并且进行了一个比较基于CPU算法和基于GPU算法运算速度的实验。实验结果表明,利用GPU操作空间栅格数据可以显著的提高运算速度,这意味着,在相同硬件条件下利用GPU来处理空间栅格数据可以大大降低成本。  相似文献   

9.
合成孔径雷达(SAR)的数据运算量不断增加,图形处理器(GPU)为其处理提供了新的运算平台.但是GPU显存小,不足以容纳大场景SAR数据.通过研究聚束SAR成像模式特点,提出了一种适合GPU加速的子孔径成像方案,降低了该算法对GPU显存的要求.在Tesla C2075上的实验结果表明,该方案能够取得良好的成像效果,与C...  相似文献   

10.
陆楠 《电子设计技术》2012,19(10):18+22
GPU计算已经成为一种趋势,它可利用GPU原本用于图形处理的计算性能来协助增强CPU处理一些在GPU架构下更为高效的特定应用,不仅能让整体系统提升性能与能效,并且提高运作效率,进而实现计算摄影、计算机视觉、先进成像、兴趣点提取和实景增强等功能。要实现这些功能需要图形处理单元具有更好的图形处理能力和更高的计算性能。ARM不久前推出了第二代Mali 600图形处理器MaliT624、T628以及T678,较之  相似文献   

11.
合成孔径雷达(SAR)成像算法能够通过图形处理器(GPU)加速来实现处理速度的显著提升。针对后向投影(BP)成像算法的GPU加速,分析了BP算法的并行化和并行处理方法,提出了一种适合GPU加速的BP成像方案;通过研究GPU设计中的多流异步执行技术、数据传输模式和计算速度与精度,进一步提出一种针对BP成像的GPU优化成像方案。通过仿真数据和实测数据在Tesla C2075上的测试结果表明,与GPU非优化方案的实现相比,该方案有了近一倍的速度提升。  相似文献   

12.
《无线电工程》2016,(4):35-38
调频信号具有优良的航天器飞行尾焰抗干扰能力,被广泛地应用于火箭和导弹遥测信号传输。传统硬件逻辑电路结构复杂、修改时间长,而软解调具有修改简单等特点,但是软解调运算时间长无法进行实时解调。随着集成电路的发展,原先仅用于加速图形计算的GPU逐步应用于数字信号处理。设计了利用GPU的软解调,可以完成实时解调的要求。  相似文献   

13.
ARM与联发科技(MediaTek)近日宣布扩大双方长期合作关系,联发科技取得大量市场领先的高性能ARM知识产权(IP)授权,包括可用于智能手机、智能电视与蓝光播放器的ARMMaliTM系列图形处理器(GPU)、CodexTM系列处理器及系统IP。另外,对于目前已广泛运用于主流智能手机及智能电视的ARMMali-400多核图形处理器,联发科技也获得了更广泛的相关授权。  相似文献   

14.
可编程图形处理技术领袖NVIDIA 公司宣布,最新推出的NVIDtA GeForce 7系列图形芯片(GPU)将带给玩家真正的极致高清(HD)游戏体验。这些全新GPU包括: GeForce 7900 GTX GPU—— NVIDIA最新旗舰GPU,以超炫核心时钟频率实现超高图形性能,进一步巩固了NVIDIA的性能领袖地位。  相似文献   

15.
现代GPU通常采用超长图形流水线设计,功能单元众多、结构多样复杂,导致GPU在设计过程中故障定位难度大、耗时长、精度低.在深入研究图形流水线工作原理的基础上,提出了一种面向GPU设计的图形流水线故障检测方法.通过对图形流水线分级处理,逐级收集并分析运行状态信息,来达到故障定位的目的.在某款航空军用嵌入式GPU芯片设计过程中采用本方法,大幅提高了故障定位的精确度和速度,使平均定位时间缩短60%以上.  相似文献   

16.
基于GPU的图形电磁计算加速算法   总被引:2,自引:0,他引:2       下载免费PDF全文
杨正龙  金林  李蔚清 《电子学报》2007,35(6):1056-1060
本文利用现代图形加速卡中GPU(Graphics Process Unit)的可编程管线,实现了图形电磁计算(GRECO)方法.与原有的方法相比,在利用物理光学和物理绕射理论的基础上,计算速度提高了20倍左右.并且利用GPU实现了射线追踪算法,用于目标上多次散射的计算,使得GRECO方法可以快速计算具有凹腔结构目标的电磁散射.本方法对于目标识别和逆合成孔径成像等方面的研究具有重要的应用价值.  相似文献   

17.
基于SOPC的机载显示器图形实时生成技术   总被引:2,自引:2,他引:0  
目前以DSP或GPU为核心、FPGA为协处理器的机载显示器图形生成技术无法满足低成本、低功耗的应用场合。针对此现状,文章提出了一种基于SOPC的图形生成技术。该技术以SOPC为核心,搭建图形生成的硬件平台,使用SOPC内部集成的NiosⅡ软核处理器执行图形生成算法运算,并协同可编程逻辑资源完成对帧存的乒乓操作,实现图形数据的实时生成。与传统方法相比,该技术无需DSP或GPU芯片,可以明显降低产品的成本和功耗。实验结果表明,采用该技术后机载显示器可以生成640×480分辨率的图形,帧频为26fps,能够满足机载显示器实时显示的需求。  相似文献   

18.
该文提出一种基于图形处理器(GPU)的距离多普勒成像算法(RDA),为合成孔径声呐(SAS)的实时成像提供了新的途径。通过GPU平台上的并行方法进行距离向脉冲压缩、固定相位补偿和方位向脉冲压缩,显著提升了距离多普勒成像算法效率。仿真和实验结果表明:在满足成像分辨率的前提下,该文设计的基于GPU的并行RDA和CPU串行算法相比,加速比可达到22,满足实时SAS成像需求。  相似文献   

19.
王瑞  梁华  蔡宣平 《现代电子技术》2010,33(15):41-43,46
传统SIFT算法的优化和实现都是针对常用处理器(CPU)提出的,处理速度慢,实时性很难得到保证。通过实现基于NVIDIA公司CUDA架构图形处理器(GPU)的SIFT特征提取算法,优化了数据存储结构,提高了数据访问效率。实验结果表明,基于GPU的SIFT特征提取算法充分利用GPU的并行处理能力,计算速度提高幅度明显,图像越大越复杂,提高的幅度越大,处理1600×1200图像时甚至可达近15倍的加速比,极大地提高了SIFT算法在实际应用中的实时性。  相似文献   

20.
区域动态     
芯原获得多项用于先进消费和嵌入式应用的ARM技术授权芯原股份有限公司日前宣布已获得多项ARM IP授权,其中包括高性能、高功效ARM Cortex处理器和ARMMali图形处理器(GPU)系列,以及ARM Artisan物理IP。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号