首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
针对顶点着色器细分地形网格需要额外生成模板、计算细分层次复杂的不足,提出了一种利用细分着色器进行地形网格细分的层次细节(LOD)地形渲染算法。利用分块四叉树组织建立地形粗糙网格的分层结构,以LOD判别函数对活动地形块进行筛选;提出了在细分控制着色器中基于视点三维连续距离的细分因子计算方法,并针对外部细分因子进行处理消除了裂缝;实现在细分计算着色器上的置换贴图,对精细网格的高度分量进行位移。而且将四叉树结构存储至顶点缓冲区,减少中央处理器(CPU)与图形处理器(GPU)的资源交换;引入细分队列加速细分过程。实验证明,该算法具有平滑的细节层次过渡和良好的细分效果,能够有效提高GPU利用率和地形渲染效率。  相似文献   

2.
在GPU上实现地形渲染的自适应算法   总被引:3,自引:0,他引:3  
为了满足飞行状态实时监控系统对地形渲染快速逼真的要求,提出一种基于GPU的交互式地形自适应渲染算法.该算法中每帧渲染包含2遍GPU处理过程:第1遍采用流计算的方式,利用固定网格映射方法生成粗糙地形采样网格,在此基础上,根据地形表面复杂度计算粗糙采样网格中每个三角形的细化深度;第2遍进行地形的渲染,根据第1遍计算出来的每个面片的细化等级,选择初始化阶段预存储在GPU缓存中的不同细化等级的网格模板,对粗糙采样网格进行自适应细分,为了消除T型连接的问题,在顶点着色器中包含了一个网格模板的匹配处理过程.最后采用高程数据配合卫星照片的方式,生成具有高度仿真的三维虚拟地貌.基于文中算法实现的实时监控系统在支线飞机的飞行试验中取得了较好的效果.  相似文献   

3.
在任意拓扑的四边形网格上构造光滑的曲面是计算机辅助几何设计中的一个重要问题.基于C-C细分,提出一种从四边形网格上生成插值网格顶点的光滑Bézier曲面片的算法.将输入四边形网格作为C-C细分的初始控制网格,在四边形网格的每张面上对应得到一张Bézier曲面,使Bézier曲面片逼近C-C细分极限曲面.曲面片在与奇异顶点相连的边界上G1连续,其他地方C2连续.为解决C-C细分的收缩问题,给出了基于误差控制的迭代扩张初始控制网格的方法,使从扩张后网格上生成的曲面插值于初始控制网格的顶点.实验结果表明,该算法效率高,生成的曲面具有较好的连续性,适用于对四边化后的网格模型上重建光滑的曲面.  相似文献   

4.
在任意拓扑的四边形网格上构造光滑的曲面是计算机辅助几何设计中的一个重要问题.基于C—C细分,提出一种从四边形网格上生成插值网格顶点的光滑Bezier曲面片的算法.将输入四边形网格作为C—C细分的初始控制网格,在四边形网格的每张面上对应得到一张Bezier曲面,使Bezier曲面片逼近C—C细分极限曲面.曲面片在与奇异顶点相连的边界上G^1连续,其他地方C^2连续.为解决C—C细分的收缩问题,给出了基于误差控制的迭代扩张初始控制网格的方法,使从扩张后网格上生成的曲面插值于初始控制网格的顶点.实验结果表明,该算法效率高,生成的曲面具有较好的连续性,适用于对四边化后的网格模型上重建光滑的曲面.  相似文献   

5.
利用GPU的强大浮点数计算能力和并行处理能力,提出一种完全基于GPU的视点相关自适应细分内核进行快速细分计算的方法.在GPU中,依次实现视点相关的面片细分深度值计算、基于基函数表的细分表面顶点求值、细分表面绘制等核心步骤,无须与CPU端系统内存进行几何数据交换.视点相关的自适应细分准则在表面绘制精度保持不变的情况下,有效地降低了细分表面的细分深度和细分的计算量,在此基础上完全基于GPU的细分框架使得曲面细分具有快速高效的特点.该方法还可以在局部重要细节用较大深度值进行实时自适应细分,以逼近极限曲面.  相似文献   

6.
为了充分利用GPU的并行计算能力高效地绘制递归定义的细分曲面,提出一种基于GPU的面分裂细分曲面的实时绘制算法.该算法通过离线预计算生成可以复用的细分查找表,它由细分矩阵组成,其大小仅与奇异点度数和最大细分深度线性相关,与输入网格无关;对于细分曲面控制网格的每个曲面片,如果包含2个或2个以上奇异点,则进行一次局部预细分;之后对于不规则曲面片,利用细分查找表由初始控制网格直接计算得到各细分层次上的控制顶点,无需逐层计算,从而最大限度地发挥GPU的并行处理能力;最后对各层次上的规则曲面片使用硬件细分着色器绘制,大大提高绘制效率.实验结果表明,文中算法可以高效地绘制细分曲面的极限曲面.  相似文献   

7.
基于简化光线投射GPU大规模地形实时可视化   总被引:1,自引:0,他引:1  
地形数据处理、三角形细分等级测度和T型连接消除是基于GPU大规模地形可视化的关键问题。利用GPU简化光线投射的固定网格投射方法生成地形粗糙网格;根据地形特征和视点因素确定三角形细分等级,并匹配与存储在GPU缓存中的三角形模板,实现地形网格的自适应细分;通过改变相邻三角形细分等级的方法消除T型连接,实现基于简化光线投射GPU大规模地形的无缝绘制。实验表明该方法可以取得较高的帧速率和较好的绘制效果,实现大规模地形的实时可视化。  相似文献   

8.
提出一种基于图形处理器(GPU)加速的真实感毛发快速绘制方法.方法通过混合绘制多层次的半透明纹理层来表示物体表面的毛发效果,并在绘制过程充分运用了GPU的可编程功能.其中采用GPU的顶点绘制器来完成多层网格层顶点位置的计算;采用像素绘制器来实现毛发特殊光照效果的计算.实验表明,通过采用GPU可编程计算,毛发的绘制速度得到了明显提高.方法对中等规模的模型达到了实时的毛发绘制速度,并具有逼真的仿真效果.  相似文献   

9.
本文以非均匀Catmull-Clark细分模式下的轮廓删除法为基础,通过在细分网格中定义模板并调整细分网格的顶点位置,为非均匀B样条曲面顶点及法向插值给出了一个有效的方法.该细分网格由待插顶点形成的网格细分少数几次而获得.细分网格的顶点被分为模板内的顶点和自由顶点.各个模板内的顶点通过构造优化模型并求解进行调整,自由顶点用能量优化法确定.这一方法不仅避免了求解线性方程组得到控制顶点的过程,而且在调整顶点的同时也兼顾了曲面的光顺性.  相似文献   

10.
提出了一种新的自适应细分算法,在顶点的1-邻域内,用与顶点相连较长三条边的端点构成的平面去替代其平均平面,将顶点到其平均平面的距离作为判断顶点重要度的标准,对三角网格进行自适应细分。由于原始三角面片的高密度和形状相似性,以点面距离为细分尺度所产生的误差,可被限制在一个体元之内,与反复修正顶点法矢算法相比,该算法大大减少了计算量。实验结果表明,所提方法在三角网格细分过程中,简化了数据模型,提高了处理速度。  相似文献   

11.
We present a novel method for massively parallel hierarchical scene processing on the GPU, which is based on sequential decomposition of the given hierarchical algorithm into small functional blocks. The computation is fully managed by the GPU using a specialized task pool which facilitates synchronization and communication of processing units. We present two applications of the proposed approach: construction of the bounding volume hierarchies and collision detection based on divide‐and‐conquer ray tracing. The results indicate that using our approach we achieve high utilization of the GPU even for complex hierarchical problems which pose a challenge for massive parallelization. The results indicate that using our approach we achieve high utilization of the GPU even for complex hierarchical problems which pose a challenge for massive parallelization.  相似文献   

12.
文中提出了一种简单有效的排序滤波算法,并在GPU上实现了该算法。算法首先检测图像中的信号,如果检测的像素是信号则保留不变,否则取其邻域并对邻域内的非噪声像素排序并取中值,若中值为信号,则用它代替噪声像素灰度值;否则扩大邻域窗口,重复算法。随着图像规模的增大,在CPU上执行的时间显著增加。文中在CUDA平台上对其进行了实现。实验结果表明该算法不仅能有效地移除椒盐噪声,而且执行效率高,图像的规模越大,加速比越高,最多可提高3个数量级。  相似文献   

13.
This paper presents a novel GPU-based multiresolution rendering on sole-cube maps (SCMs), which is a variant of geometry images built upon spherical parameterization. Given spherical parametrization of a manifold mesh, the sphere domain is gnomonically projected to a closed cube, which constitutes the 6-chart sole-cube maps. A quadtree structure of SCMs and normal map atlas are then constructed by using the regular re-sampling. Then, by packing the quadtree nodes into the SCMs texture atlas, a new parallel multiresolution rendering is processed on the latest GPU in two rendering passes: the multiresolution node selection in fragment shader; the triangulation in vertex shader followed by the node culling operation in geometry shader. The proposed approach generates adaptive mesh surfaces dynamically, and can be fully implemented in GPU parallelization. The proposed scheme alleviates the computing load of multiresolution mesh refinement on CPU, and our GPU-based multiresolution rendering is demonstrated with a variety of examples. Our user study confirmed that the visual quality of the SCMs multiresolution rendering, in comparison with the meshes/geometry images rendering, is also highly efficient especially for complex models in large-scale virtual environment.  相似文献   

14.
It is an important task to improve performance for sparse matrix vector multiplication (SpMV), and it is a difficult task because of its irregular memory access. General purpose GPU (GPGPU) provides high computing ability and substantial bandwidth that cannot be fully exploited by SpMV due to its irregularity. In this paper, we propose two novel methods to optimize the memory bandwidth for SpMV on GPGPU. First, a new storage format is proposed to exploit memory bandwidth of GPU architecture more efficiently. The new storage format can ensure that there are as many non-zeros as possible in the format which is suitable to exploit the memory bandwidth of the GPU. Second, we propose a cache blocking method to improve the performance of SpMV on GPU architecture. The sparse matrix is partitioned into sub-blocks that are stored in CSR format. With the blocking method, the corresponding part of vector x can be reused in the GPU cache, so the time to access the global memory for vector x is reduced heavily. Experiments are carried out on three GPU platforms, GeForce 9800 GX2, GeForce GTX 480, and Tesla K40. Experimental results show that both new methods can efficiently improve the utilization of GPU memory bandwidth and the performance of the GPU.  相似文献   

15.
基于图像空间的复杂模型碰撞检测算法   总被引:1,自引:0,他引:1  
朱连章  庄华 《计算机工程与设计》2007,28(15):3675-3677,3681
提出一种使用图形硬件用于复杂模型间的快速的碰撞检测算法.算法是基于CULLIDE的执行GPU可见性查询来减少物体模型间没有邻近特征的子集,描述了一个分类方案计算物体潜在碰撞集和碰撞自由子集,提高了裁减的性能.为了减少CPU的负载,利用GPU的可编程性,在GPU上进行精确的物体相交计算.  相似文献   

16.
为加快TIP(Tour Into the Picture)的绘制速度,提出1种基于GPU(Graphics Processing Unit)的方法,充分利用GPU的运算能力,把背景纹理提取过程从CPU转移到GPU中进行,利用GPU固定管道进行TIP绘制,CPU负责前景模型的深度计算及纹理提取.因此,CPU与GPU可以并行运算,显著提高纹理映射速度从而缩短整个TIP绘制时间,满足用户在虚拟场景中漫游的实时性要求.  相似文献   

17.
深度优先搜索算法在GPU集群中大型图上的简单执行,会导致线程间的负载不平衡和无法合并内存访问的情况,这使得算法的性能较低.为了明显提高算法在单个GPU和多个GPU环境下的性能,在处理数据之前通过采取一系列有效的操作来进行重新编排.提出了构造线程和数据之间映射的新技术,通过利用前缀求和及二分查找操作来达到完美的负载平衡.为了降低通信开销,对DFS各分支中需要进行交换的边集执行修剪操作.实验结果表明,算法在单个GPU上可以尽可能地实现最佳的并行性,在多GPU环境下可以最小化通信开销.在一个GPU集群中,它可以对合有数十亿节点的图有效地执行分布式DFS.  相似文献   

18.
高光谱图像分类是遥感信息处理领域的热点问题,在核稀疏表示分类框架下,联合光谱信息和像元空间信息,空谱联合核稀疏表示高光谱图像分类能够取得较好的分类效果,但较高的计算复杂度及高光谱图像较大的数据量限制了其在实时性要求较高情况下的应用。基于GPU/CUDA架构,提出了一种空谱联合核稀疏表示高光谱分类的并行优化方法,设计访存优化策略对主机和设备端数据交互进行优化;充分利用GPU并行计算能力,加速分类过程中核矩阵的计算;采用依据GPU并行特性实现的矩阵运算,优化基于交替方向乘子法的分类模型求解过程。利用实际高光谱图像数据进行的实验,验证了该方法的有效性和高效性。  相似文献   

19.
针对基于CPU的实时渲染全频阴影算法中内存使用效率低下、CPU运算能力消耗严重等问题,提出了基于GPU的改进算法.在预计算过程中使用基于小波变换的预计算辐射度传递(PRT)算法生成PRT矩阵,然后将其编码为易于被GPU使用的稀疏形式;在渲染过程中使用具有高度并行性的片断渲染器程序进行稀疏矩阵向量快速乘法计算,以求得最终渲染结果.相对于目前基于CPU的相应算法,算法充分利用了GPU的并行计算能力,平衡了CPU与GPU之间的负载,并同时降低了内存消耗.在一般情况下,算法可以获得超过一个数量级的性能提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号