首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
韩琪  蔡勇 《计算机仿真》2015,32(4):221-226,304
针对进行大规模拓扑优化问题计算量庞大且计算效率低的问题,设计并实现了一种基于图形处理器(GPU)的并行拓扑优化方法.采用双向渐进结构拓扑优化(BESO)为基础优化算法,采用一种基于节点计算的共轭梯度求解方法用于有限元方程组求解.通过对原串行算法的研究,并结合GPU的计算特点,实现了迭代过程全流程的并行计算.上述方法的程序设计和编写采用统一计算架构(CUDA),提出了基于单元和基于节点的两种并行策略.编写程序时充分使用CUDA自带的各种数学运算库,保证了程序的稳定性和易用性.数值算例证明,并行计算方法稳定并且高效,在优化结果一致的前提下,采用GTX580显卡可以取得巨大的计算加速比.  相似文献   

2.
针对大规模结构非线性动力问题的有限元分析非常耗时,基于消息传递接口(MPI)机群环境,提出多种基于并行求解策略的显式有限元并行算法。基于显式消息传递的区域分解技术,采取重叠、非重叠区域分解技术及动态任务分配方法,通过将计算与通信重叠,优化处理器间的通信,对非重叠通信区域分解并行算法、重叠通信区域分解并行算法、群动态任务分配算法、动态任务分配算法及动态负载平衡算法进行研究。为在机群环境下实现非线性动力有限元分析,开发了基于有效并行求解策略的显式有限元并行算法。编写了基于消息传递编程模式的并行有限元程序,在工作站机群上实现了数值算例,分析了算法的性能,并与传统的Newmark算法进行了比较。算例表明:群动态任务分配算法的性能优于动态任务分配算法,低于区域分解算法的性能,动态负载平衡算法最优。对相同规模的问题提出的算法比Newmark算法快,优于Newmark算法。对结构非线性动力问题的有限元分析,所提出的并行算法是可行有效的。  相似文献   

3.
研究动态模式识别算法在GPU并行计算平台的实现。随着GPGPU(通用计算图形处理器)硬件的发展,基于GPU的大规模并行计算技术将有效地处理动态模式识别算法带来的海量计算问题。文中通过介绍动态模式识别算法,对算法中涉及的巨大计算量进行分析,并针对性地对其中密集计算部分进行并行化分解,移除原算法中在执行中存在的依赖关系,最终得到算法在特定的GPU平台———Jacket上的并行计算实现。实例验证表明,相比于原CPU串行程序,在GPU上运行的并行化程序能实现明显加速,因而具有很好的工程应用价值。  相似文献   

4.
以曲面轮为基础发展的高精度曲面建模方法(HASM)可以建立具有高精度的数字高程模型,但使用该方法需要求解偏微分方程离散产生的大规模线性方程组,计算量巨大,严重制约了对大规模数据的模拟应用;而现代GPU技术的发展使GPU越来越广泛地应用于通用计算加速。为了提高HASM方法的模拟速度,把高精度曲面模拟与GPU通用技术相结合,提出了GPU加速的高精度曲面建模方法。把HASM模拟过程中的有限差分离散、离散后的大规模线性系统求解分别使用GPU进行分解,使用共轭梯度(CG)和预处理共轭梯度方法(PCG)将求解任务分解为可以并行处理的独立的多任务,使得计算任务并行化,同时并行运行大规模线程,每个线程执行一个独立的任务,充分利用了现代GPU强大的通用计算能力,并行处理以获得加速。利用并行化加速的高精度曲面建模算法使用英伟达公司的统一计算开发架构(CUDA)编程实现,GPU采用该公司的Quadro 2000。分别应用该算法进行了数值实验和实际项目区数字高程模型(DEM)模拟实验。实验结果表明,充分利用GPU的并行处理能力加速后的HASM方法,在保证达到相同曲面模拟的精度条件下,和传统的CPU方法相比,算法可以获得超过一个数量级的加速。  相似文献   

5.
GPU加速的神经网络BP算法*   总被引:3,自引:3,他引:0  
近年来图形处理器(GPU)快速拓展的可编程性能力加上渲染流水线的高速度及并行性,使得图形处理器通用计算(GPGPU)迅速成为一个研究热点。针对大规模神经网络BP算法效率低下问题,提出了一种GPU加速的神经网络BP算法。将BP网络的前向计算、反向学习转换为GPU纹理的渲染过程,从而利用GPU强大的浮点运算能力和高度并行的计算特性对BP算法进行求解。实验结果表明,在保证求解结果准确度不变的情况下,该方法运行效率有明显的提高。  相似文献   

6.
蔡勇  李胜 《计算机应用》2016,36(3):628-632
针对传统并行计算方法实现结构拓扑优化快速计算的硬件成本高、程序开发效率低的问题,提出了一种基于Matlab和图形处理器(GPU)的双向渐进结构优化(BESO)方法的全流程并行计算策略。首先,探讨了Matlab编程环境中实现GPU并行计算的三种途径的优缺点和适用范围;其次,分别采用内置函数直接并行的方式实现了拓扑优化算法中向量和稠密矩阵的并行化计算,采用MEX函数调用CUSOLVER库的形式实现了稀疏格式有限元方程组的快速求解,采用并行线程执行(PTX)代码的方式实现了拓扑优化中单元敏度分析等优化决策的并行化计算。数值算例表明,基于Matlab直接开发GPU并行计算程序不仅编程效率高,而且还可以避免不同编程语言间的计算精度差异,最终使GPU并行程序可以在保持计算结果不变的前提下取得可观的加速比。  相似文献   

7.
有限差分法是求解偏微分方程近似解的一种重要的数值方法。串行算法并不能高效的解决大规模复杂计算问题,并行化计算方法可提高复杂计算问题的效率,从而使并行机上计算有限差分问题成为可能。二维场中拉普拉斯方程的差分格式非常适合并行化方法的计算,将串行部分并行化以提高大规模计算的效率具有重要的现实意义。MPI(消息传递接口)是实现并行程序设计的标准之一。虚拟进程(MPI_PROC_NULL)的引用简化了MPI编程中的通信部分,串行算法可更改为并行化计算方法,最终实现有限差分方法的并行化计算。  相似文献   

8.
一种基于GPU加速的细粒度并行蚁群算法   总被引:1,自引:0,他引:1  
为改善蚁群算法对大规模旅行商问题的求解性能,提出一种基于图形处理器(GPU)加速的细粒度并行蚁群算法.将并行蚁群算法求解过程转化为统一计算设备架构的线程块并行执行过程,使得蚁群算法在GPU中加速执行.实验结果表明,该算法能提高全局搜索能力,增大细粒度并行蚁群算法的蚂蚁规模,从而提高了算法的运算速度.  相似文献   

9.
有限差分法是求解偏微分方程近似解的一种重要的数值方法。串行算法并不能高效的解决大规模复杂计算问题,并行化计算方法可提高复杂计算问题的效率.从而使并行机上计算有限差分问题成为可能。二维场中拉普拉斯方的差分程格式非常适合并行化方法的计算,将串行部分并行化以提高大规模计算的效率具有重要的现实意义。MPI(消息传递接口)是实现并行程序设计的标准之一。虚拟进程(MPI_PROC_NULL)的引用简化了MPI编程中的通信部分,串行算法可更改为并行化计算方法,最终实现有限差分方法的并行化计算。  相似文献   

10.
泊松-玻尔兹曼方程(Poisson-Boltzmann Equation,PBE)是广泛应用于溶剂化生物分子静电分析的隐式溶剂化模型.本文在原有有限元软件基础上对近来提出的基于高阶有限元求解PBE的无条件稳定方法~([9])设计并实现了一种高效的并行计算方法.无条件稳定方法对PBE拟时间迭代求解,避开了强非线性导致的不稳定性.基于非结构化四面体网格本文设计实现了基于代数分解的求解稀疏线性方程组的高效并行模型.规模可扩展至6400 CPU核,并行效率达到近86%.大规模并行迭代求解线性方程组是计算科学领域的共性问题,它的高效并行实现不仅对实际生物分子静电分析提供了很好的基础,也可扩展至其他各应用领域.  相似文献   

11.
未来新型计算模式—云计算   总被引:5,自引:0,他引:5  
云计算是近两年IT行业的新型计算模式,它将对人们未来的生活方式和工作模式产生深刻的影响。文章介绍了云计算的演变过程、定义、特点以及它的主要形式,探析了云计算的关键技术、与网格计算的区别和应用现状,最后对云计算的未来趋势作了前景展望。  相似文献   

12.
普适计算的信任计算模型   总被引:4,自引:0,他引:4  
郭亚军  洪帆 《计算机科学》2005,32(10):59-62
信任和安全有紧密的联系,当前的安全技术都隐含地与信任相关.普适计算环境是一个开放的环境,相互合作的主体具有自发性和不可预知性.在互相不知道的主体之间进行交互,必须有足够级的信任.普适计算比传统计算更强调信任的作用.本文在分析普适计算的信任特征后给出了适合该环境的信任计算模型.证明了普适计算环境中的信任关系是偏序关系,根据信任Hasse图,我们给出了信任评估机制.最后分析表明该模型满足Lamsal的普适计算信任建模要求.  相似文献   

13.
In this review article, we compare the performance of two computing systems: quantum computing and coherent computing. A layered architecture for circuit-model quantum computing, employing surface code quantum error correction, has been recently discussed. Using this concrete hardware platform, it is possible to provide resource analysis for executing the fault-tolerent quantum computing for prime number factoring and molecular eigen-energy calculation that cannot be solved by the present day computing systems. A particular quantum computing system could solve such problems on the time scale of 1-10 days by using 108 – 109 physical qubits. We discuss an alternative computing system based on an injection-locked laser network wnicn is called a coherent computing system here. A three-dimensional Ising model is mapped onto the mutually injection-locked slave laser network, while the independent injection signal from a master laser implements a Zeeman Hamiltonian. In this computing system, an Ising spin taking either up or down state is represented by the polarization degrees of freedom, right or left circular polarizations, of the lasing photons in each slave laser. A spin-spin coupling coefficient is implemented by simple linear polarization optics connecting the two slave lasers. We numerically study the scaling law of the proposed machine against the anti-ferromagnetic Ising model with varying problem size M. A transient time to reach a steady state polarization configuration is inversely proportional to the locking bandwidth and does not depend on the problem size strongly up to M=1000.  相似文献   

14.
一种新的计算方法:粒度进化计算   总被引:4,自引:4,他引:4  
从分析进化计算的起源入手,总结了进化计算产生的根源,然后探讨了人类进化——文化进化的基本特征,模仿进化计算的来源机制,提出了粒度进化计算。如果说进化计算是模拟达尔文生物进化机制而发展起来的一种计算方法,那么粒度进化计算则是在模仿文化进化机制的基础上,综合了Agent技术以及粒度计算、进化计算的理论和方法而提出的一种计算方法。文中,从群进化和超群进化两方面来介绍粒度进化计算的基本原理和方法,并给出了基于粒度Agent系统的粒度进化递归模型。  相似文献   

15.
对DNA计算的通用性及单链、双链、粘性末端、发夹、质粒、k-臂DNA分子等各种数据作了简单介绍,并对基于DNA分子结构特性和基于DNA计算机研制过程两个方面的DNA计算模型进行了分析对比。针对各种不同的DNA数据及特性,提出了混合DNA计算模型的研究思路,并从不同角度论述了混合DNA计算模型的可行性。  相似文献   

16.
边缘计算可以有效解决传统云计算中传输时延大、用户数据安全性不够高、传输带宽压力大以及终端移动设备计算能力受限、能耗大等问题.计算卸载是边缘计算中的关键技术,针对当前计算卸载技术的研究现状和存在的不足,本文围绕计算卸载,首先介绍边缘计算的体系架构以及部分应用和分析4种主要的影响因素以及相应具体的条件;其次针对3种决策目标分析了算法策略及对应变量在算法中的作用;最后总结目前在计算卸载中存在的不足.  相似文献   

17.
网格计算与对等计算的比较研究   总被引:1,自引:0,他引:1  
对网格计算和对等计算从概念、目标、体系结构、组成团体、资源、安全需求、应用、基础架构和特征等方面进行了深入比较,总结了各自的特点,最后对二者的研究方向进行展望.  相似文献   

18.
针对单边缘服务器卸载时导致异地边缘服务器空闲状态下资源浪费问题,在远程云与多个边缘服务器联合卸载的方案下,提出一种基于改进混合粒子群算法的边缘云协同计算卸载策略(cross reorganization PSO,CRPSO)。该卸载策略中以最小化系统总代价(时延和能耗的加权和)为目标建立模型,在粒子群算法中利用适应度对粒子进行优劣分组,通过引入遗传算法中的交叉思想对劣势组的粒子进行取优,由两层筛选机制优化原始种群中粒子,经过算法迭代实现任务的最优卸载策略。仿真结果表明,与Local-MEC算法、ECPSO算法和GCPSO算法相比,所提出的CRPSO算法的系统总代价最小,优化效果明显。  相似文献   

19.
20.
网格计算是一种能够整合零散资源并实现资源共享和协同工作的计算模式;云计算是网格计算、并行计算、分布式计算的发展,是一种新兴的商业计算模式。它具有与网格计算不同的新的特点。该文在研究网格计算与云计算概念的基础上从体系结构、专注方向、资源管理、作业调度等多种角度对网格计算与云计算进行了分析和研究。云计算所采用的商业理念、成熟的资源虚拟化技术以及非标准化的规范,使其体系结构、资源管理、作业调度等方面呈现出了不同的特点,也更适宜于为用户提供按需服务的目标,但在安全方面仍需不断完善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号