首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 831 毫秒
1.
王海兵 《计算机应用》2011,31(Z1):172-173,176
通过重载MPI消息传递函数,在重载的MPI函数中调用MPE库中各日志记录函数,实现了大规模面向对象有限元程序自定义并行性能监测。对一个典型冲击动力学问题进行了16 CPU的并行有限元模拟,通过并行性能监测对其有限元并行算法进行了分析。  相似文献   

2.
讨论自适应有限元计算中常用的标记策略的并行实现问题,介绍并行自适应有限元软件平台PHG中实现这些策略的统一函数接口.特别地,针对一类在分布式存储并行计算机上不易实现的策略,如GERS策略和MNS策略,介绍我们所设计的并行算法.  相似文献   

3.
成杰  张林波 《计算机科学》2012,39(5):278-281
介绍了所研制的一个开源三维结构分析并行自适应有限元软件PHG-Solid。它是以并行自适应有限元软件平台PHG为基础开发的,支持在纯三维结构上进行并行自适应有限元分析。与现有的商业和开源结构分析有限元软件相比,PHG-Solid的特点和优势在于:1)支持完全自动化且高度并行的自适应有限元计算;2)能稳健高效地求解大规模问题,具有很好的计算规模可扩展性;3)易于扩展,用户可根据需要添加相应的计算模块。通过几个大型数值算例来展示该软件的计算能力和并行可扩展性,其中的最大计算规模超过了5亿自由度,最大并行规模达到了1024个MPI进程。  相似文献   

4.
在工程技术和科学技术领域,有限元计算是应用数学和力学知识,计算机技术,解决工程技术问题的数值计算方法.模型通过程式计算,得到的结果数据称为向量式有限元后处理数据,简称行为数据.介绍了向量式有限元面单元行为数据的特点,相应的并行压缩模型,并对算法进行验证.验证结果表明,该并行压缩模型能有效压缩有限元行为数据.  相似文献   

5.
为提高大型结构振动分析的规模、精度和效率,基于面向对象有限元并行计算框架PANDA和高性能矩阵特征问题并行求解算法,开发出适用于大规模结构振动问题计算的并行有限元模态分析程序;在超级计算机银河YH和曙光5000A上,通过不同算例验证该程序的正确性和可靠性.以某靶室结构为研究对象演示该程序的应用,指出实际应用时需注意加速...  相似文献   

6.
泊松-玻尔兹曼方程(Poisson-Boltzmann Equation,PBE)是广泛应用于溶剂化生物分子静电分析的隐式溶剂化模型.本文在原有有限元软件基础上对近来提出的基于高阶有限元求解PBE的无条件稳定方法~([9])设计并实现了一种高效的并行计算方法.无条件稳定方法对PBE拟时间迭代求解,避开了强非线性导致的不稳定性.基于非结构化四面体网格本文设计实现了基于代数分解的求解稀疏线性方程组的高效并行模型.规模可扩展至6400 CPU核,并行效率达到近86%.大规模并行迭代求解线性方程组是计算科学领域的共性问题,它的高效并行实现不仅对实际生物分子静电分析提供了很好的基础,也可扩展至其他各应用领域.  相似文献   

7.
有限元方法是科学和工程计算中最常用的方法之一.但有限元方法计算量仍是很大的,许多问题即使在最快的计算机上,也需要大量的计算时间.最近,主要的工作致力于更好的有限元算法的研究以及设计并行的计算机系统支持这些算法.本文介绍一种非常适合于并行执行的有限元算法,并分析了该算法的数据流.基于这种分析,提出了四种可能的多处理机结构.其中两种采用专用链,产生固定拓扑的多处理机结构.另外两种采用多级互连网络.  相似文献   

8.
有限元分析在很多领域得到了应用,但其较大的计算规模对使用造成了限制,对复杂对象的分析难以在单台计算机上完成。提出并实现了一种并行化有限元软件的开发模式,在保留成熟的商业性有限元分析软件各种优点的情况下对关键计算进行了并行化开发,以较少投入成功实现了应用于大型结构分析的并行有限元分析系统。完成了数据在分布存储计算环境下的有效存储、高效的大型稀疏矩阵的并行算法,通过试验验证系统有良好的分析精度和扩展性。  相似文献   

9.
基于工作站机群并行求解有限元线性方程组   总被引:2,自引:0,他引:2  
随着计算机高速网络技术的发展,工作站机群正在成为并行计算的主要平台.有限元线性方程组在土木工程结构分析中是最常见的问题.预处理共轭梯度法(PCGM)是求解线性方程组的迭代方法.对预处理共轭梯度法进行并行化并在两个不同的机群上实现,对存储方式进行详细分析,编程中采用了稀疏矩阵向量相乘的优化技术.数值结果表明,设计的并行算法具有良好的加速比和并行效率,说明并行计算能更快地求解大规模问题.  相似文献   

10.
本文设计了一种新的三维自适应迎风稳定化有限元方法(SUPG-IP),并对比研究了几种半导体器件模拟的并行有限元方法.数值模拟结果表明:稳定化有限元方法适用于大偏压以及高掺杂器件模拟;而经典的Zlamal有限元方法更适用于计算半导体器件的电学响应曲线.我们基于三维并行自适应有限元平台PHG开发了半导体器件漂移扩散模型求解器DevSim,并对几种典型的半导体器件进行了模拟测试.计算结果与商业软件Sentaurus吻合较好,验证了算法的有效性.我们对PN结进行了超大规模网格并行模拟测试,网格达8亿单元并使用2048进程计算,展示了算法良好的并行可扩展性.  相似文献   

11.
针对大规模结构非线性动力问题的有限元分析非常耗时,基于消息传递接口(MPI)机群环境,提出多种基于并行求解策略的显式有限元并行算法。基于显式消息传递的区域分解技术,采取重叠、非重叠区域分解技术及动态任务分配方法,通过将计算与通信重叠,优化处理器间的通信,对非重叠通信区域分解并行算法、重叠通信区域分解并行算法、群动态任务分配算法、动态任务分配算法及动态负载平衡算法进行研究。为在机群环境下实现非线性动力有限元分析,开发了基于有效并行求解策略的显式有限元并行算法。编写了基于消息传递编程模式的并行有限元程序,在工作站机群上实现了数值算例,分析了算法的性能,并与传统的Newmark算法进行了比较。算例表明:群动态任务分配算法的性能优于动态任务分配算法,低于区域分解算法的性能,动态负载平衡算法最优。对相同规模的问题提出的算法比Newmark算法快,优于Newmark算法。对结构非线性动力问题的有限元分析,所提出的并行算法是可行有效的。  相似文献   

12.
GPU通用计算平台上中心差分格式显式有限元并行计算   总被引:3,自引:0,他引:3  
显式有限元是解决平面非线性动态问题的有效方法.由于显式有限元算法的条件稳定性,对于大规模的有限元问题的求解需要很长的计算时间.图形处理器(GPU)作为一种高度并行化的通用计算处理器,可以很好解决大规模科学计算的速度问题.统一计算架构(CUDA)为实现GPU通用计算提供了高效、简便的方法.因此,建立了基于GPU通用计算平台的中心差分格式的显式有限元并行计算方法.该方法针对GPU计算的特点,对串行算法的流程进行了优化和调整,通过采用线程与单元或节点的一一映射策略,实现了迭代过程的完全并行化.通过数值算例表明,在保证计算精度一致的前提下,采用NVIDIA GTX 460显卡,该方法能够大幅度提高计算效率,是求解平面非线性动态问题的一种高效简便的数值计算方法.  相似文献   

13.
EBE-PCG算法在有限元并行计算中的应用研究   总被引:1,自引:1,他引:0  
目前,在研究有限元并行计算时,讨论并行算法理论和并行算法设计与分析的居多, 研究并行算法的实现并解决实际问题较少.在Beowulf集群环境下,采用EBE策略设计出基于 PVM平台的EBE-PCG算法,并通过一个电法勘探的典型工程算例对该算法在有限元计算中的性能进行了测试.实验结果表明,该算法加速比和并行效率均较为理想;在处理同等规模的问题时,同CG算法、PCG算法相比,具有并行度更高,耗时更少等优点.  相似文献   

14.
基于 L S MPP的 K元 2 -立方体网络结构 ,设计了一种新颖快速的计算 FFT的 SIMD算法 .文中首先在本文的姊妹篇“基于 L S MPP的图像并行傅立叶分析技术 (1)”的分析与设计的基础上 ,讨论了输入图像像素矩阵及变换结果图像矩阵中元素的排序问题 ,并给出了算法实现中的有关处理策略 .接着较完整详细地给出了在 L S MPP SIMD计算机上实现的一种新颖快速的二维 FFT并行算法和实验结果 .最后对算法的性能进行了分析  相似文献   

15.
基于有限差分离散的并行应用非常普遍,针对此类问题的负载平衡性能评估,引入了一个刻画应用问题负载平衡能力的关键参数:最大负载变化率,推导了一个以并行效率为目标函数的负载平衡性能模型,涉及问题规模、并行通信计算比、离散格式复杂度和并行规模等.以POP全球海洋模式并行程序为测试实例,验证了该模型的性能.结果显示最大负载变化率作为衡量负载平衡程度的指标是有效的,基于模型的预测性能与实测性能在总体趋势上基本吻合.该性能模型对基于有限元、有限体积等其他局部离散格式的大型并行计算应用的负载平衡能力评估也具有参考价值.  相似文献   

16.
从河内塔的并行解到UNITY程序设计   总被引:1,自引:0,他引:1  
袁崇义  屈婉玲 《计算机学报》1998,21(Z1):195-200
从事并行程序设计实践的人往往把精力耗费在为变量分配内存,为循环体寻求并行上,却忽略对问题本身的分析.其实能否并行的决定因素是应用问题本身.人们往往急于得到能够运行的代码,一开始就把复杂的问题和复杂的并行环境掺和起来了.河内塔(Hanoi Tower)问题看似无法并行,实际上却允许极大的并行.它的并行解及求解过程对并行程序设计应有一定的启发.  相似文献   

17.
大规模并行应用的负载平衡能力对性能的影响很大,但难以度量.针对基于局部离散格式的(有限差分、有限元等)并行应用,通过分析并行计算通信比、并行规模、问题规模、格式复杂度与并行效率之间的数量关系,提出一个"最大负载偏移率"概念,即并行任务的最大负载相对平均负载的偏移量与平均负载之比,作为衡量负载平衡能力的性能指标,并导出了一个负载平衡性能量化模型.将POP全球海洋模式Benchmark程序作为计算实例,验证了负载平衡性能模型的有效性.该模型揭示出整体并行计算性能对负载平衡的依赖程度,特别是对大规模并行计算的情形,负载平衡程度对整体性能的影响随着并行规模的增大而愈加敏感.  相似文献   

18.
本文针对前推回代法的潮流计算的潜在并行特点,对前推回代的在数据结构表达方式进行研究,比较了各种数据结构形式并行性计算速度的影响,并进行了仿真计算.利用C 语言和FORTRAN语言对比编写,并利用TCP/IP通讯协议、C/S力式,进行模拟试验.对其中遇到的若干问题进行分析讨论.利用IEEE69节点系统在在四台PC机上进行并行仿真计算,仿真结果表明并行计算提高了潮流计算效率起到了一定作用.  相似文献   

19.
本文为一类H(curl)型椭圆问题的线性棱有限元方程,构造了一种基于节点辅助空间预条件子(HX预条件子)和基于简单粗空间的非重叠区域分解相结合的预条件子,并为该预条件子设计了并行算法,编制了基于MPI+OpenMP二级并行架构的并行程序.数值实验结果表明基于该预条件子的并行PCG法具有良好的算法可扩展能力和并行可扩展能力.  相似文献   

20.
针对开源有限元软件Calculix传统计算模式在大规模数值计算中的低效问题,提出了Calculix三级并行优化策略,即预处理并行优化、节点间并行调度以及节点内多核多线程并行改造。预处理并行优化在方程组分解过程中与分解过程后,分别对其参数矩阵进行有条件的动态舍弃,据此构造了部分列选主元多行双门槛不完全LU分解预处理算法,并对算法的可行性、有效性以及收敛性给出了证明。为充分发挥TH-2超级计算机强大的资源优势,相继给出了基于QoS的节点间任务动态调度算法,以及节点内多核多线程并行任务调度算法,进一步实现计算任务与资源之间的优化匹配和QoS需求。在实验环节中搭建了针对天河二号(TH-2)超级计算环境的有限元并行计算与分析平台,并完成了针对船舶疲劳强度分析问题的实际工程应用测试。理论分析与工程算例测试结果充分证明:Calculix三级并行优化方案能够有效提高Calculix求解线性方程组的速度,在可获取足够计算资源的前提下, 与传统计算模式相比 ,实际工程算例的计算速度平均提高了2~4倍。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号