期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

GPU 上计算流体力学的加速 总被引：1，自引：0，他引：1

董廷星李新亮李森迟学斌《计算机系统应用》2011,20(1):104-109

本文将计算流体力学中的可压缩的纳维叶-斯托克斯(Navier-Stokes),不可压缩的Navier-Stokes和欧拉(Euler)方程移植到NVIDIA GPU上.模拟了3个测试例子,2维的黎曼问题,方腔流问题和RAE2822型的机翼绕流.相比于CPU,我们在GPU平台上最高得到了33.2倍的加速比.为了最大程度提... 相似文献

2.

使用GPU加速分子动力学模拟中的非绑定力计算 总被引：1，自引：0，他引：1

吴强杨灿群葛振陈娟《计算机工程与科学》2009,31(Z1)

在分子动力学模拟(MD)中,对非绑定力的计算需要花费大量的时间。本文提出了基于CUDA和Brook+的两种双精度算法,分别在NVIDIA和AMD两款主流GPU上实现了非绑定力的计算,借助GPU的计算能力加速了整个MD程序。算法对MD进行了任务分割,采用区域分解的方法将非绑定力的计算映射到GPU的计算核心上,同时针对两款GPU的各自特点提出了线程块内共享存储、最小化数据集两种优化方法。性能测试结果表明,与Intel Xeon 2.6GHzCPU的单核相比,43.2万粒子的高速粒子碰撞模拟,在配置NVIDIA Tesla C1060的系统上性能提高了6.5倍,在配置AMD HD4870的系统上性能提高了4.8倍。相似文献

3.

基于GPU加速的脉冲多普勒雷达信号处理

龚昊刘莹冯建周赵仁良冷佳旭《计算机工程与科学》2021,43(7):1141-1149

雷达信号处理算法的高性能实现是雷达系统中的关键技术。传统雷达信号处理算法的高性能加速主要依赖DSP和FPGA等专用设备,而它们具有开发周期长、调试难度大、成本高等缺点。GPU作为通用设备,特别适合处理雷达信号这种大规模数据。目前,GPU加速雷达信号处理的成果大多集中在SAR成像等应用领域,针对脉冲多普勒雷达相关研究还比较少。为了满足雷达回波数据对吞吐量和处理实时性的高要求,提出了基于网格跨步并行的细粒度并行化、基于多CUDA流的粗粒度并行化和基于并行扫描的数据预处理等优化技术。从性能测试和误差分析等多角度评估了算法的实时性和准确性,在所使用的硬件平台上相比于传统CPU实现达到了300倍以上的加速比,并优于其它已有的CUDA加速的脉冲多普勒雷达信号处理算法。相似文献

4.

基于GPU加速的图像双向相似性计算

傅贤超《现代计算机》2013,(11)

针对双向相似性计算在CPU下串行计算效率低下,无法满足实际需求的问题,利用该计算中数据独立性的特点,应用CUDA编程模型实现基于GPU加速的图像双向相似性计算。与CPU相比,在392x300的分辨率实验下,该算法在GPU上可获得超过1200倍的加速比。相似文献

5.

GPU加速逆时偏移技术的应用和分析

张向阳冯超敏文玲《计算机应用与软件》2012,29(8):223-225

在地震资料的处理应用中,逆时偏移等处理技术由于计算资源的需求量巨大,而不能在实际生产中被广泛采用。GPU及CUDA编程架构的引入大幅提高其运算性能,是解决类似技术应用的有效途径。同时,GPU独特的物理特性使得一些应用不仅不能提高性能,甚至使性能急剧下降。通过逆时偏移技术应用实例来说明GPU的加速效果,同时将其和常规流程进行对比和分析给出应用软件的GPU适用性评价方法。相似文献

6.

基于CUDA技术模拟雷达余辉的方法

谢永亮汤晓迪刘尚富曾海兵《微型机与应用》2011,30(8):61-63,66

分析了目前基于光栅显示器模拟雷达余辉的方法。针对实现逼真余辉效果存在的主要瓶颈,通过采用CUDA技术可以解决模拟余辉时庞大的计算量的问题。主要采用CPU+GPU的编程模式模拟余辉,在GPU中为每一个像素点创建一个并行执行的线程来完成整个屏幕像素的数据处理,使得余辉效果逼真、画面流畅、扫描速度大幅提高。相似文献

7.

神经网络前向传播在GPU上的实现

刘进锋郭雷《微型机与应用》2011,30(18):69-71,75

基于CUDA架构在GPU上实现了神经网络前向传播算法,该算法利用神经网络各层内神经元计算的并行性,每层使用一个Kernel函数来并行计算该层神经元的值,每个Kernel函数都根据神经网络的特性和CUDA架构的特点进行优化。实验表明,该算法比普通的CPU上的算法快了约7倍。研究结果对于提高神经网络的运算速度以及CUDA的适用场合都有参考价值。相似文献

8.

基于GPU加速的三维水面模拟

钟林海王小铭《现代计算机》2009,(6):32-34

提出一种基于水面物理特征和GPU实时加速的水面效果三维模拟方法．根据水面运动的物理特征和水面纹理变化特征,采用4个周期函数叠加产生几何波和2个周期函数叠加产生纹理渡,使用凹凸纹理表现水面的细节．通过环境映射实时模拟出水面的反射等现象,通过GPU实时加速渲染,最终生成实时并且生动逼真的水面。相似文献

9.

GPU 上的矩阵乘法的设计与实现 总被引：1，自引：0，他引：1

下载免费PDF全文

梁娟娟任开新郭利财刘燕君《计算机系统应用》2011,20(1):178-181,149

矩阵乘法是科学计算中最基本的操作,高效实现矩阵乘法可以加速许多应用。本文使用NVIDIA的CUDA在GPU上实现了一个高效的矩阵乘法。测试结果表明,在Geforce GTX260上,本文提出的矩阵乘法的速度是理论峰值的97％,跟CUBLAS库中的矩阵乘法相当。相似文献

10.

二维扩散方程的GPU加速 总被引：1，自引：0，他引：1

董廷星王龙迟学斌《计算机工程与科学》2009,31(11)

近几年来,GPU因拥有比CPU更强大的浮点性能备受瞩目。NVIDIA推出的CUDA架构,使得GPU上的通用计算成为现实。本文将计算流体力学中Benchmark问题的二维扩散方程移植到GPU,并采用了全局存储和纹理存储两种方法。结果显示,当网格达到百万量级的时候,得到了34倍的加速。相似文献

11.

基于多线程技术的雷达训练仿真系统 总被引：1，自引：0，他引：1

殷堂春沈戈婷刘兆辉白桦《计算机与现代化》2009,(8):116-118

论述Windows环境下多线程的应用,介绍Visual C + +6.0中多线程的编程方法,举出多线程机制在雷达训练仿真的应用实例.系统运行稳定、软件结构简明,满足在微机系统中网络传输、故障分析以及屏显仿真等多任务对实时性的要求. 相似文献

12.

基于CUDA和电子海图模拟雷达岸线回波的方法

王金波薛文虎刘峰《计算机与数字工程》2015,43(5)

雷达回波信号的仿真是雷达模拟器模拟显示逼真与否的基础,在此背景下提出利用电子海图和CUDA并行处理技术,模拟导航雷达海岸线回波的新方法.通过对电子海图的并行处理实现对导航雷达海岸线回波的模拟,仿真了雷达岸线回波的遮挡效果,解决了雷达模拟器回波生成实时性要求的难题.通过计算机仿真验证了该方法的有效性,已实际运用于某型雷达模拟器的回波信号仿真. 相似文献

13.

雷达系统嵌入式中频模拟器的分析与实现

仇小光陶建锋孙青黄学宇《微计算机应用》2008,29(5):83-87

为提高部队训练水平和武器系统的生命周期,将仿真设备嵌入武器系统中就显得尤为重要。本文从嵌入式仿真的概念、体系结构入手,以雷达接收机中频模拟器为例,结合嵌入式系统的工作原理和过程进行了深入分析、设计,实现了雷达系统基于嵌入式的仿真训练功能,同时为后续武器系统实现嵌入式仿真研究提供了积极的参考价值。相似文献

14.

基于GPU的碳纳米管分子动力学并行仿真

孟小华覃大胜郑冬琴周玉宇《计算机工程》2015,(4)

基于计算机的分子动力学仿真具有理论分析方法和实验方法无法比拟的优点,但分子动力学仿真算法计算量非常大,特别是在对碳纳米管的大规模粒子数进行仿真处理时,普通的基于CPU的串行算法执行效率低且耗时多。为此,提出基于统一计算设备架构的碳纳米管分子动力学的图形处理单元( GPU)并行算法,设计并实现仿真算法中适合GPU并行运算的分裂算法,将具有竞争资源的运算以非竞争方式运行。实验结果表明,与CPU串行仿真算法相比,分裂算法的运算速度较快,且在只有16个GPU流处理器显卡上可获得十多倍的加速比。相似文献

15.

基于GPU和均匀栅格法的光线追踪算法研究

童星袁道华《计算机工程与设计》2011,32(10):3499-3502

由于GPU(图形处理器)性能的大幅提高和可编程性的发展,基于GPU的光线追踪算法逐渐成为研究热点。光线追踪算法需要的计算量大,基于此,分析了光线追踪算法的基本原理,在NVIDIA公司的CUDA(计算统一设备体系结构)环境下采用均匀栅格法作为加速结构实现了光线追踪算法。实验结果表明,该计算模式相对于传统基于CPU的光线追踪算法具有更快的整体运算速度,GPU适合处理高密度数据计算。相似文献

16.

GPU适用的并行纹理合成算法

沈哲王莉莉《计算机辅助设计与图形学学报》2015,(2):330-336

基于样图的纹理合成是一个大计算量过程,为了利用GPU的并行计算能力进行大规模纹理合成,我们提出一种并行纹理合成算法.该算法综合块查找和全局纹理优化算法分多遍进行纹理的合成和优化,其中每一遍分为串行纹理块定位和并行最优块匹配2个阶段.纹理块定位阶段在CPU端按照扫描线顺序确定待合成的邻域,并将邻域位置传入GPU;最优块匹配阶段在GPU端并行计算待合成邻域与对应样本邻域的全局距离,并查找出最优解得到匹配块.最后根据匹配过程统计数据自适应调整优化规模,在全局范围内对纹理进行迭代优化.实验结果表明,文中算法在保证大规模纹理合成效果的基础上减少了计算时间,能够满足交互式纹理合成的应用. 相似文献

17.

基于GPU的高效图像协方差矩阵算法与实现

陈彬陈和平李晓卉《计算机工程与设计》2014,(12):4238-4242

为提高图像处理领域协方差矩阵的计算效率,满足其在实时要求下的应用,借助GPU通用计算技术,结合CUDA编程模型,对协方差矩阵的计算进行有针对性的并行化优化,设计并实现一种高效的并行图像协方差矩阵算法。为在通用PC平台上使用协方差矩阵并满足实时性需求的各种图像处理应用提供了一个可行的解决方法,对其它领域涉及到协方差矩阵的实时计算也有良好的借鉴作用。与原有的CPU实现方法相比,GPU的效率有了平均数千倍的提升。相似文献

18.

Accelerating ant colony optimisation for the travelling salesman problem on the GPU

Akihiro Uchida Yasuaki Ito 《International Journal of Parallel, Emergent and Distributed Systems》2014,29(4):401-420

Recent graphics processing units (GPUs) can be used for general purpose parallel computation. Ant colony optimisation (ACO) approaches have been introduced as nature-inspired heuristics to find good solutions of the travelling salesman problem (TSP). In ACO approaches, a number of ants traverse the cities of the TSP to find better solutions of the TSP. The ants randomly select next visiting cities based on the probabilities determined by total amounts of their pheromone spread on routes. The main contribution of this paper is to present sophisticated and efficient implementation of one of the ACO approaches on the GPU. In our implementation, we have considered many programming issues of the GPU architecture including coalesced access of global memory and shared memory bank conflicts. In particular, we present a very efficient method for random selection of next cities by a number of ants. Our new method uses iterative random trial which can find next cities in few computational costs with high probability. This idea can be applied in not only GPU implementation but also CPU implementation. The experimental results on NVIDIA GeForce GTX 580 show that our implementation for 1002 cities runs in 8.71 s, while the CPU implementation runs in 190.05 s. Thus, our GPU implementation attains a speed-up factor of 22.11. 相似文献

19.

基于Vega的雷达扫描视景仿真方法研究

郭健李勇宋发兴乐义《计算机与现代化》2010,(1):92-94

根据雷达基本方程和Vega程序设计的特点,分析使用Vega视景仿真雷达扫描效果的可行性,指出仿真关键点;提出一种应用Vega雷达仿真应用程序接口（Vega Radar Application Interface）进行视景仿真的方法,最后给出程序框图。相似文献