期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李大禹胡立发穆全全曹召良夏明亮李抄刘肇楠宣丽《光学精密工程》2010,18(4):848-854

在GPU通用计算架构下,首次提出了CUDA架构下的液晶自适应光学波面数值解析方法。针对高分辨率液晶自适应光学系统,介绍了液晶自适应光学的波面数值解析算法,论述了CUDA的通用架构;然后,建立了CUDA实现波面数值解析的编程模型,在此模型中引入了并行线程的有效利用,全局存储器的高效访问和数据直接回写3种优化方案;最后,给出了GPU与CPU的实验对比结果。结果表明:CUDA计算分辨率为512×512,对35项Zernike多项式的波面数值解析需时不到1ms,计算速度是传统CPU波面数值解析的几十倍。提出的方法减小了系统延时,提高了校正速度,建立波面数值解析CUDA编程模型采用的优化手段可为其它数学计算模型提供参考。相似文献

2.

基于CUDA的图像预处理并行化研究

占正锋李戈张学贺尹旭悦《机械与电子》2014,(7)

为加快图像预处理算法的执行速度,提出了基于计算统一设备架构(CUDA)的预处理算法来实现高速并行处理。分析了图像灰度化、高斯滤波以及直方图均衡化等预处理方法的原理,并对它们进行并行化分析,从而将CUDA并行计算技术引入到图像预处理算法。实验结果表明,此算法充分利用GPU的并行处理能力,与CPU串行处理方法相比,速度提高明显,有效提高数据处理能力。相似文献

3.

基于GPU的并行非结构网格生成技术研究 总被引：1，自引：0，他引：1

齐龙肖素梅刘云楚廖玲玲蔡云龙《机械设计与制造》2013,(2):184-186

为了解决非结构网格生成在时间和内存上的问题,研究了非结构网格的并行生成方法,提出了一种基于CUDA架构的GPU并行非结构网格生成技术。该技术结合了GPU的高速并行性和并行Delaunay网格生成技术的优点,在CUDA编程框架下,将非结构网格生成的技术应用到GPU并行环境中。通过分析此方法的加速比和效率,对其性能进行了评估。实验结果表明,所提出的方法具备有高效性,与传统方法相比,在保证网格质量的同时,大幅度减少了其时间消耗。相似文献

4.

基于CUDA的体绘制GPU加速算法

吴磊王彬《生命科学仪器》2009,7(12):26-29

本文主要是针对传统意义上的体绘制的经典算法——投射算法,在已有的GPU加速的基础上,提出了利用CUDA实现对算法的优化和加速。具体来讲,首先需要将体数据以三维纹理的形式储存在GPU的显存中,之后利用CUDA的并行处理能力对显存中的数据进行相应的处理,主要包括：生成存储顶点灰度值和颜色的纹理数组,计算顶点梯度,实现坐标系的转换,确定有效光线,利用Phong光照模型来求得光线上各等距采样点的反射分量,最后利用累加函数求得屏幕上每一点的像素值。实验结果表明：我们利用CUDA对光线投射算法的实现比传统的GPU加速算法大大提高了速度和成像质量。相似文献

5.

运动模糊视频图像在图形处理器平台上的实时恢复 总被引：1，自引：0，他引：1

王晶李仕《光学精密工程》2010,18(10):2262-2268

提出了一种图形处理器优化编程方法,用于实现运动模糊视频图像的实时恢复处理。根据计算统一设备架构(CUDA)的硬件框架特征对GPU的线程块及线程数量进行优化配置,并引入了一种自动内存接合访问的方法,使得GPU的硬件资源得到充分利用。根据图像频谱的对称性去除冗余信息,减少了图像算法在频谱滤波时的数据量,使得GPU对内存的访问次数下降,从而提升了算法效率。实验表明,本文提出的GPU方案的计算性能比传统的CPU平台方案提升了一个数量级,半频谱滤波设计使总时间开销减少20%以上,实验结果证明了本文方案的可行性及有效性。相似文献

6.

基于边光滑三角形壳元和统一计算架构的板料成形仿真并行计算方法 总被引：2，自引：1，他引：1

蔡勇王琥李光耀崔向阳郑刚《机械工程学报》2012,48(6):32-38

针对板料成形过程仿真中计算效率低以及四边形单元几何逼近性差的问题,提出一种基于边光滑三角形壳元(Edge-based smoothed triangular shell element,EST)和图形处理器(Graphics processing unit,GPU)的板料成形并行计算方法。根据EST壳元及板料成形过程显式求解的特点,该方法采用将最小计算单位与线程一一对应的方式进行数组的求解,同时,采用并行缩减的方法进行单值的求解,实现了整个计算过程的细粒度并行。考虑到GPU并行计算系统的特点,采用由CPU进行主控,由GPU进行数值求解的程序架构,并以统一计算架构(Compute unified device architecture,CUDA)作为GPU编程环境,编制相应的程序。通过算例表明,与传统CPU串行计算方法相比,在计算精度一致的情况下,当计算模型单元数超过20 000个时,基于GPU的并行计算方法可以获得35倍以上的计算加速比,显著减少板料成形仿真的计算时间。相似文献

7.

基于CUDA的体绘制GPU加速算法

吴磊王彬《生命科学仪器》2009,(9)

本文主要是针对传统意义上的体绘制的经典算法——光线投射算法,在已有的GPU加速的基础上,提出了利用CUDA实现对算法的优化和加速。具体来讲,首先需要将体数据以三维纹理的形式储存在GPU的显存中,之后利用CUDA的并行处理能力对显存中的数据进行相应的处理,主要包括:生成存储顶点灰度值和颜色的纹理数组,计算顶点梯度,实现坐标系的转换,确定有效光线,利用Phong光照模型来求得光线上各等距采样点的反射分量,最后利用累加函数求得屏幕上每一点的像素值。实验结果表明:我们利用CUDA对光线投射算法的实现比传统的GPU加速算法大大提高了速度和成像质量。相似文献

8.

基于CUDA技术的振动筛离散颗粒运动仿真

胡斌星黄亚宇《新技术新工艺》2013,(6):1-3

在以往筛分过程中,对筛分效率和透筛率的计算均采用传统的和基于概率统计的方法。本文基于离散元理论,采用CUDA技术,利用GPU高并行度、多线程、强大计算能力和极高存储器带宽的特点,模拟大规模颗粒在筛分过程中的运动情况。在此基础上,寻找对离散元数值计算的可行方法,并改进程序,使其能高效地模拟颗粒运动,为相关结构的改造提供依据。相似文献

9.

中科院近代物理所成立CUDA研究中心

《现代科学仪器》2014,(3):52-52

日前,英伟达公司（NVIDIA）授权在我国建立的第七家“CUDA （Compute Unified Device Architecture统一计算设备架构）研究中心”在中国科学院近代物理研究所揭牌成立。中科院副院长詹文龙出席了揭牌仪式。相似文献

10.

基于CUDA架构的FDK算法的研究

《工业仪表与自动化装置》2015,(6)

该文研究了一种利用GPU并行架构的CUDA来完成FDK三维图像重建算法的加速。分析了FDK三维图像重建算法的可并行性特点,设计了适合CUDA的并行方法,分别在算法加权、滤波和反投影3个阶段,实现FDK的加速。经过实验验证,该文提出的方法与算法与CPU单独实现图像重建相比,不仅获得了150倍以上的加速效果,并且两种方式完成的重建图像,质量接近,平均误差小于10~(-4)。由此可得出结论,利用GPU的三维锥束CT图像重建能够得到较满意的结果。相似文献

11.

基于离散元理论的振动筛分数值模拟程序开发

孙鹏杨亚罗黄亚宇《机械设计与制造工程》2012,(3):71-73

依据离散元法理论对直线振动筛分过程进行了数值仿真,给出了程序运行的逻辑结构,并通过讨论确定了碰撞模型所选取的碰撞参数。通过引入CPU与GPU混合并行运算方法提高了数值仿真的运算效率,并依据运算结果讨论了并行运算对离散元三维数值仿真的影响。相似文献

12.

基于SimulationX的挖掘机高压斗杆缸缓冲装置的仿真与试验研究

陈勋周军盖丽红《机电工程》2014,(3):270-276

为研究高压油缸的行程末端缓冲装置的缓冲性能,获得油缸缓冲行程阶段的压力、流量等参数,以一款国产挖掘机高压斗杆缸作为研究对象,将计算机仿真技术应用到实际工程研究中。基于SimulationX仿真软件搭建了挖掘机工作装置液压系统的仿真模型(特别是缓冲模型),开展了液压-机械多体动力学联合仿真;在典型工况下对液压挖掘机斗杆缸的压力、流量等参数进行了试验,通过比对仿真结果,对控掘机液压系统仿真的准确性进行了评价。结果表明,所建立的仿真模型是合理的、科学的,该仿真技术在工程领域更进一步的推广是可行的。相似文献

13.

一种基于图形处理器的频繁模式挖掘算法 总被引：1，自引：1，他引：0

白洪涛欧阳丹彤何丽莉《仪器仪表学报》2009,30(10)

频繁模式挖掘是数据挖掘的核心问题.传统上,频繁模式并行挖掘主要是在集群上进行的,较少涉及共享内存多处理系统上的并行挖掘.基于广度优先搜索和直接计数策略研究了一种并行挖掘方法,并在图形处理器(graphics processing unit, GPU)最新统一计算设备架构CUDA(compute unified device architecture)下进行了实现.GPU-based FPMA用CPU控制搜索进程;在GPU的多处理器上,采用数据划分的计算策略,以适合GPU的顺序数据流方式计数,并根据候选项的长度动态剪枝事务数据集.实验结果表明,GPU-based FPMA比CPU版本平均加速了10倍以上. 相似文献

14.

GPU-based parallel computation for structural dynamic response analysis with CUDA

Dong-Keun Kang Chang-Wan Kim Hyun-Ik Yang 《Journal of Mechanical Science and Technology》2014,28(10):4155-4162

Frequency response analysis is an important computational tool to simulate and understand the dynamic behavior of structures. However, for more target frequency and/or larger scale structures, the runtime is greatly increased. Furthermore, increasingly complex degree of freedom problems intended to improve the accuracy of the analysis results is creating longer. In this paper, we present efficient analysis using runtime reduction in frequency response analysis with NVIDIA GPU using the compute unified device architecture (CUDA) programming environment. The proposed method is based on the sparse conjugate gradient method and a Jacobi preconditioner. Numerical examples which implemented by three different FE model are used to verify the validity. The results show that GPU parallel implementation achieves significant speed up compared to a single CPU processor. Through these results, in the frequency response analysis, we show the possibility for efficient analysis with reduction of the solving time by using GPU parallel implementation. 相似文献

15.

NPC型三电平逆变器供电的永磁同步电机矢量控制系统

谢剑云徐华勒《工业仪表与自动化装置》2014,(1):39-42

在分析永磁同步电机矢量控制理论的基础上,结合三电平中点钳位(NPC)逆变器输出谐波含量低、控制性能好等优点,提出了一种基于NPC型三电平逆变器的永磁同步电机(PMSM)矢量控制方法。深入分析了三电平逆变器空间电压矢量脉宽调制(SVPWM)技术,并利用Matlab/Simulink进行了基于三电平逆变器SVPWM算法的PMSM矢量控制仿真实验,结果表明三电平逆变器SVPWM和PMSM矢量控制的有机结合,有效地抑制了转矩脉动,提高了驱动性能。相似文献