首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
基于CPU-GPU混合加速的SPH流体仿真方法   总被引:1,自引:0,他引:1  
基于光滑粒子流体力学SPH的流体仿真是虚拟现实技术的重要研究内容,但SPH流体仿真需要大量的计算资源,采用一般计算方法难以实现流体仿真的实时性。流体仿真通常由物理计算、碰撞检测和渲染等部分组成,借助GPU并行加速粒子的物理属性计算和碰撞过程使SPH方法的实时流体仿真成为可能。为了满足流体仿真应用中的真实性和实时性需求,提出一种基于CPU GPU混合加速的SPH流体仿真方法,流体计算部分采用GPU并行加速,流体渲染部分采用基于CPU的OpenMP加速。实验结果表明,基于CPU GPU混合加速的SPH流体仿真方法与CPU实现相比,能显著地减少流体仿真单帧计算时间且能更快速地完成渲染任务。  相似文献   

2.
为了实现小尺度范围流体场景的实时、真实感模拟,采用弱可压SPH方法对水体进行建模,提出了流体计算的CPU GPU混合架构计算方法。针对邻域粒子查找算法影响流体计算效率的问题,采用三维空间网格对整个模拟区域进行均匀网格划分,利用并行前缀求和和并行计数排序实现邻域粒子的查找。最后,采用基于CUDA并行加速的Marching Cubes算法实现流体表面提取,利用环境贴图表现流体的反射和折射效果,实现流体表面着色。实验结果表明,所提出的流体建模和模拟算法能实现小尺度范围流体的实时计算和渲染,绘制出水的波动、翻卷和木块在水中晃动的动态效果,当粒子数达到1 048 576个时,GPU并行计算方法相较CPU方法的加速比为60.7。  相似文献   

3.
王栋栋  庄雷 《计算机应用》2009,29(6):1702-1710
采用基于粒子插值的SPH方法对火焰流体进行模拟,用GPU加速粒子状态地计算,同时用CPU并行地计算粒子邻接关系并控制粒子产生速率。在SPH模型中,较为高效地加入了漩涡场的计算,增加了粒子运动的细节。在粒子渲染过程中,采用了色度场、有向点扩散和颜色锐化技术,由离散的粒子空间分布得到了较为理想的连续火焰图像。由于该方法属于流体模拟的拉格朗日法,所以火焰具有物理真实性,又由于采用GPU为主CPU为辅的计算架构,使得模拟达到了实时。  相似文献   

4.
针对传统的粒子系统实时仿真存在只能针对单一自然景物模拟、计算耗时、图像不真实、算法复杂等问题,提出了一种基于粒子系统和图形处理器(GPU)加速通用可扩展的自然景物模拟算法。在该算法中,粒子的物理运动计算过程和渲染阶段完全由CPU转移至GPU,可以增加粒子数量和提高渲染速度;同时,在渲染过程中,可以较好地利用硬件支持的粒子图技术来改善渲染中粒子的外表,选择不同纹理,从而能够较方便地模拟不同的自然景物。最后,在GPU上实现了雪花、喷泉、烟花、瀑布等模拟,算法充分利用了GPU的多通道并行处理性和可编程性,提高了自然景物模拟的实时性,可运用于虚拟现实系统。  相似文献   

5.
刘博 《软件》2012,(11):239-243
随着GPU性能的飞速提升,越来越多的地形渲染算法能够完全由GPU实现.本文提出了一种新的完全基于GPU的地形渲染算法.该算法使用顶点着色器完成中间数据生成,在几何着色器中使用之前生成的信息完成地形的LOD操作和网格的动态生成.该算法不仅具有易于在GPU上实现的特点,同时能够提供无缝的、自适应地形起伏的渲染效果.这也顺应了图形学的主流:将图形计算或对几何体的操作从CPU转移到GPU上,从而做到无需CPU的干预,降低数据传输量,节约通信带宽的目的.实验证明,该算法适合于处理较大规模地形块.  相似文献   

6.
基于大规模粒子系统的实时喷泉模拟   总被引:1,自引:0,他引:1  
本文实现了一种新的喷泉模拟方法,与传统的在CPU上实现算法不同的是,本文算法完全基于计算机图形硬件(GPU)来实现,利用图形硬件的大规模并行计算能力,显著的增加了模拟喷泉的粒子数量,提高了渲染速度,同时减轻了CPU的负载,使整个三维场景的绘制更加高效。  相似文献   

7.
刘明  徐飞  刘玉 《微计算机信息》2008,24(15):293-295
本文通过有效利用图形硬件图形处理单元(GPU)的运算能力和编程性,将大量计算从CPU中分离出来,实现了自然逼真而且高效的大规模波动草叶的实时渲染.利用GPU的顶点程序进行草叶的运动计算,利用GPU的片元程序进行静态阴影的计算.本文技术由OpenGL结合Cg编程实现,达到了自然逼真的渲染效果和较高的渲染效率.  相似文献   

8.
基于GPU粒子系统的大规模场景高效雨雪实时模拟   总被引:3,自引:0,他引:3  
文治中  刘直芳  李纲  梁威 《计算机应用》2010,30(5):1398-1401
粒子系统实现的雨雪效果能有效增强三维场景的真实感,传统基于中央处理器(CPU)运算模拟的粒子系统占用了大量CPU运算时间,难以达到实时模拟的要求。为此提出了一种基于图形处理器的(GPU)运算的粒子系统来模拟的雨雪场景。该方法通过在GPU中重复使用消亡粒子在视点坐标系内生成新粒子,并在几何着色器中将粒子的点坐标转换为矩形坐标,将CPU从复杂庞大的几何运算中解放出来,从而大幅增加了场景绘制的微粒数,使雨雪场景模拟的实时性和逼真度得到增强。  相似文献   

9.
GPU通用计算在LBM方法中的应用   总被引:1,自引:0,他引:1  
提出了一种结合GPU通用计算与计算流体力学中的LBM算法来模拟二维流场的方法.根据GPU通用计算和LBM方法的基本原理,利用OpenGL的离屏渲染技术FBO和Cg语言,基于LBM方法中的D2Q9模型对二维方腔流进行数值模拟,并设计出基于OpenGL的GPU通用计算的二维流场数值计算框架.实验结果表明,利用GPU模拟与CPU模拟流场的数值结果相当吻合,特别地,利用GPU进行数值模拟实验的速度是利用CPU的4倍左右.  相似文献   

10.
基于多重网格法的实时流体模拟   总被引:3,自引:0,他引:3  
在GPU上实现了多重网格法,并用该方法改进了二维的实时流体模拟,更充分地利用GPU的并行计算能力.使用4层网格,依靠渲染到纹理的计算方式、帧缓存扩展的纹理管理方法,提高了图形硬件的利用率.实验对比表明,在同样的帧数下该方法能提高GPU实时流体模拟的精度.尤其在较大规模的问题上,与同等精度的基于一般迭代方法的GPU实时流体模拟相比,该方法在速度上可有成倍地提高.  相似文献   

11.
We introduce efficient, large scale fluid simulation on GPU hardware using the fluid‐implicit particle (FLIP) method over a sparse hierarchy of grids represented in NVIDIA® GVDB Voxels. Our approach handles tens of millions of particles within a virtually unbounded simulation domain. We describe novel techniques for parallel sparse grid hierarchy construction and fast incremental updates on the GPU for moving particles. In addition, our FLIP technique introduces sparse, work efficient parallel data gathering from particle to voxel, and a matrix‐free GPU‐based conjugate gradient solver optimized for sparse grids. Our results show that our method can achieve up to an order of magnitude faster simulations on the GPU as compared to FLIP simulations running on the CPU.  相似文献   

12.
基于四叉树的数据结构,提出了一种适于GPU批处理的地形可视化算法,以地形分块作为基本的处理单元,使用同一个顶点缓冲区对象实现所有地形块三角形集的渲染,提出了地形分块非线性分布的LOD选取函数,通过提出的地形块综合平滑因子,在顶点着色器上实现了高程值的平滑过渡,给出了GPU上算法的处理过程。实验对比结果表明,该算法地形绘制LOD层次调节方便,具有较高的地形渲染效率。  相似文献   

13.
长期以来,由于流体仿真和物体变形计算都具有相当程度的复杂性,使得流体与刚体的交互模拟,特别是和带有复杂动画的角色交互的效果,难以达到实时计算和渲染。在此,笔者提出了一个新的方法,用于生成沿着角色运动而产生交互的流体特效。为了实现这类效果的生成,控制流体特效与运动角色的交互,首先针对角色运动轨迹进行跟踪,根据轨迹的几何性质而生成初始状态的流体特效;然后借助光滑流体动力学(SPH)对流体粒子进行仿真。其中针对基于SPH技术的复杂性,流体仿真的过程借助GPU并行计算的能力,采用了一种新的高效粒子搜索算法,最终实现普通用户级个人计算机上实时渲染具有流体运动特征的角色运动特效。  相似文献   

14.
View-dependent multiresolution rendering places a heavy load on CPU. This paper presents a new method on view-dependent refinement of multiresolution meshes by using the computation power of modern programmable graphics hardware (GPU). Two rendering passes using this method are included. During the first pass, the level of detail selection is performed in the fragment shaders. The resultant buffer from the first pass is taken as the input texture to the second rendering pass by vertex texturing, and then the node culling and triangulation can be performed in the vertex shaders. Our approach can generate adaptive meshes in real-time, and can be fully implemented on GPU. The method improves the efficiency of mesh simplification, and significantly alleviates the computing load on CPU.  相似文献   

15.
Existing techniques for animation of object fracture are based on an assumption that the object materials are homogeneous while most real world materials are heterogeneous. In this paper, we propose to use movable cellular automata (MCA) to simulate fracture phenomena on heterogeneous objects. The method is based on the discrete representation and inherits the advantages from both classical cellular automaton and discrete element methods. In our approach, the object is represented as discrete spherical particles, named movable cellular automata. MCA is used to simulate the material and physical properties so as to determine when and where the fracture occurs. To achieve real-time performance, we accelerate the complex computation of automata’s physical properties in MCA simulation using CUDA on a GPU. The simulation results are directly sent to vertex buffer object (VBO) for rendering to avoid the costly communication between CPU and GPU. The experimental results show the effectiveness of our method.  相似文献   

16.
周庆  刘念  张楠 《微计算机信息》2007,23(36):268-270
针对动态流体模拟的细节复杂特性,采用一种基于粒子的新方法,当流体发生大幅动态变化时,该方法在描述流体细节方面取得更好效果。在模拟实现方面,在GPU上采用并行处理,提高模拟速度,实现计算机动画的实时模拟。  相似文献   

17.
提出了通过GPU渲染地形的一种简易方法,首要的任务就是将高度场的查询及批LOD处理也从CPU移至GPU。顶点位置可结合层级索引模板由顶点着色器计算给出,然后,对地形顶点采用适当的图元进行索引,调用一次API就可绘制所有的三角形。最后,添加额外的“裙摆顶点”来填补由批LOD算法造成的裂缝。该算法不必每帧都更新顶点缓冲,从而大大减少了系统内存和CPU的开销。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号