首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
本文首先给出数值天气预报全球谱模式的控制方程;接着,利用数值天气预报全球谱模式计算的复杂性和数据整体相关性,给出了基于二维数据剖分方法的并行算法,并从负载平衡、减少通信延迟以及Cache与I/O优化三个方面给出了并行实现策略。  相似文献   

2.
针对大规模结构非线性动力问题的有限元分析非常耗时,基于消息传递接口(MPI)机群环境,提出多种基于并行求解策略的显式有限元并行算法。基于显式消息传递的区域分解技术,采取重叠、非重叠区域分解技术及动态任务分配方法,通过将计算与通信重叠,优化处理器间的通信,对非重叠通信区域分解并行算法、重叠通信区域分解并行算法、群动态任务分配算法、动态任务分配算法及动态负载平衡算法进行研究。为在机群环境下实现非线性动力有限元分析,开发了基于有效并行求解策略的显式有限元并行算法。编写了基于消息传递编程模式的并行有限元程序,在工作站机群上实现了数值算例,分析了算法的性能,并与传统的Newmark算法进行了比较。算例表明:群动态任务分配算法的性能优于动态任务分配算法,低于区域分解算法的性能,动态负载平衡算法最优。对相同规模的问题提出的算法比Newmark算法快,优于Newmark算法。对结构非线性动力问题的有限元分析,所提出的并行算法是可行有效的。  相似文献   

3.
谱聚类算法是基于谱图分割理论的聚类方法,其对高维、非凸数据分布问题有很好的聚类效果。但对大规模数据问题的聚类,该方法存在着计算时间和存储空间等方面的瓶颈。本文给出了一个自适应的谱聚类并行算法,通过局部计算和异步循环通信并行方法,最大限度减少了并行谱聚类中数据通信次数,并通过计算与通信重叠策略,进一步降低了并行算法的通信开销。在并行算法实现中,将自主开发的最优预条件共轭梯度法并行求解器 PLOBPCG 用于谱聚类的特征降维。在中科院的“元”超级计算机上,通过对两类大规模数据聚类的测试表明,在 2048 核上的加速比接近线性加速,并行效率达到96%以上。  相似文献   

4.
基于二维/轴对称高精度可压缩多相流计算流体力学方法 MuSiC-CCASSIM的结构化网格部分,设计了区域并行分解方法;针对各处理器边界数据的通信,设计了阻塞式通信与非阻塞式通信并行算法;为了减少通信开销,设计了MPI/OpenMP混合并行优化算法。在天河二号超级计算机上进行了测试,每个核固定网格规模为625*250,最多调用8 192核。测试数据表明,采用MPI/OpenMP混合并行算法、纯MPI非阻塞式通信并行算法和纯MPI阻塞式通信并行算法的程序的平均并行效率分别达到86%、83%和77%,三种算法都具有良好的可扩展性。  相似文献   

5.
本文提出一种求解大规模稀疏矩阵特征问题的并行共轭梯度算法.为了提高算法的并行效率,设计了负载平衡的行划分方式,实现了计算和通信重叠的稀疏矩阵重排序方法,通过预处理减少计算过程中各进程间消息传递的通信量.另外,基于多核处理器高性能并行计算,实现了MPI和细粒度(线程级)OpenMP混合并行算法.在深腾7800并行计算机上对并行算法进行了测试,结果表明在进程数增多时并行算法可保持通信时间稳定性,在并行计算机上有很好的扩展性,适合大规模稀疏特征问题的求解.  相似文献   

6.
作为颗粒离散元软件并行化的前期研究,对二维稳态导热问题的有限差分法求解程序进行了并行化处理.并行算法将计算域划分为若干个子域,并将各子域上的迭代计算任务分配给相应的处理器执行.同时,算法考虑负载平衡,并采用计算和通信的重叠技术,提高并行算法的效率.通过对二维稳态温度场导热问题的串/并行程序在曙光TC2600刀片服务器上的计算结果进行比较分析,验证了该并行方法的有效性.实验结果表明,计算耗时与通信耗时的比值越大,并行效率越高.  相似文献   

7.
逐次松弛迭代算法(SOR)是求解线性方程组的一种常用迭代算法,当系数矩阵正定时,它具有较快的收敛速度。但是,由于每个迭代步内存在数据相关,它难以实现并行计算。目前的SOR并行算法采用数据分解的方法,但由于该法并行区域过小,同步通讯代价大,并行效率低。本文提出了SOR的一种新型并行算法,该算法与传统SOR方法等价,具有相同的收敛性和迭代结果。该并行算法通过矩阵分块增大了可并行计算的区域,并引入流水线技术,利用各处理器间通讯与计算时间的重叠,获得较理想的并行加速效率。通过多核微机以及小规模集群上的数值实验证明,本文提出的SOR并行算法在求解大型稠密线性方程组时具有较好的并行效率。  相似文献   

8.
基于T213/L31并行计算和数值天气预报研究   总被引:1,自引:0,他引:1  
介绍了并行计算和数值天气预报的发展概况;给出了并行算法的一般设计方法;分析了数值天气预报并行计算的可行性;最后介绍了T213/L31的基本原理,计算流程并分析其并行实现的可行性。  相似文献   

9.
大规模并行计算机的出现和发展迫切要求有新的并行处设计理论和技术来指导更实际的并行算法的设计。本文首先简单介绍了针对MPC提出孤LogP和Barrier-LogP并行计算模型,然后借助于Barrier-LogP模型从通信平衡、数据分配和重叠通信与计算这三个方面讨论了更实际的并行算法设计的一般方法和技巧。  相似文献   

10.
气象资料三维变分同化阶段区域分解并行实现   总被引:2,自引:0,他引:2  
变分同化由于能明显改善同化质量,正在成为数值天气预报的主流同化方法.研究三维变分同化的并行计算,提出了三维变分同化的阶段区域分解、观测资料的自适应划分算法、计算与通信重叠的矩阵转置和周边区域通信以及文件I/O方法,在此基础上实现了MPI并行三维变分原型系统,在由8个双CPU节点组成的Linux机群上并行加速比达到了11.9.  相似文献   

11.
几何定理证明的数值验证法以数值计算代替符号计算来提高效率,但是在实际应用中对复杂命题的解题效率还存在问题。该文尝试用并行计算方法来提高算法效率,分析了MPI编程模型下的任务划分、通信组织、任务调度等问题,并在MPICH2下实现了数值并行验证算法,对算法的并行性能指标进行了测试,得到了较好的结果。  相似文献   

12.
三对角线性方程组的一种有效分布式并行算法   总被引:8,自引:0,他引:8  
提出了分布式存储环境下求解三对角线性方程的一种并行算法,该算法基于“分而治之”的策略,高效地形成并求解其缩减方程组,避免不必要的冗余计算,通过对计算量的仔细估计,较好地平衡了各处理机的负载;同时,充分利用了计算与通信重叠技术,减少处理机空闲时间,分析了自救的复杂性,给 分布存储多计算机系统上的数值试验结果,数值结果表明,算法的效率较迟利华和李晓梅的DPP算法有较大的提高。  相似文献   

13.
块三对角线性方程组的一种分布式并行算法   总被引:16,自引:0,他引:16  
骆志刚  李晓梅 《计算机学报》2000,23(10):1028-1034
提出了分布环境下求解三对角线性方程组的一种并行算法,该算法基于对计算量的仔细估算,合理地将方程组求解工作分配到各处理机,达到负载平衡,同时,充分地将计算与通信重叠,减少处理机空闲时间;当块三以角线性方程组的系数矩阵为对角占优时,算法在执行过程中不会中断;文中分析了算法的复杂性,给出了在分析布存储多计算机系统上的数值试验结果,数值结果表明,文中算法的效率较Chung等的算法有较大的提高。  相似文献   

14.
§1.引 言 谱方法是上世纪七十年代发展起来的应用于大规模数值天气预报模式系统的数值方法.近年来谱方法已成为求解偏微分方程的重要数值方法之一[1,2],与经典的网格点方法相比,它具有计算精度高、稳定性好、程序简单而有效的突出特点.谱方法虽然有计算量和存储量均大的缺点,但超级并行计算技术的发展推动了谱方法的进一步发展和应用[3,4].近十年来,谱方法在数值天气预报领域的应用越来越广泛,不仅应用于全球数值天气预报模式而且应用于有限区域数值天气预报模式.  相似文献   

15.
利用类体素法进行三维图像重建,速度快,精度高,本文主要从片间并行着手讨论了它的并行化设计技术,分析了在不同的数据存储情况下的计算时间和通信开锁。并在曙光一号并行上实现了基于片间并行的多线程化算法,对算法的性能进行了测试分析。  相似文献   

16.
一种实用的并行计算模型   总被引:11,自引:0,他引:11  
对于当前流行的工作站集群环境和各类并行机系统,文中提出了一种实用的并行计算模型,即基于LogGP的非独占异质同步模型NHBL(Nondedicated Heterogeneous Barrier LogGP),它旨在反映具有异质性和非独占性的NOW计算环境对并行算法设计和分析的影响,然后用NHBL模型分析了PSRS算法在国家高性能计算中心(合肥)的工作站集群NHPCC-Cluster和曙光-1000MPP由的代价,并用实测结果进行了验证。  相似文献   

17.
中国科学院过程工程研究所多相反应实验室,建立了一个通用粒子模拟平台并已开始应用。目前类似的并行模拟系统采用的Shift并行通信模式往往有一些问题,需要一种新的通信模式来弥补它的不足。本文设计具有良好通用性的非结构化通信模式All2All,用来完成通用粒子方法模拟平台中计算节点问的通信。本文的算例证明这种通信模式可解决在粒子并行模拟Shift通信模式所不能处理的,具有复杂拓扑关系的相邻节点间的数据通信问题。本文设计的All2All通信模式方法只需稍加修改,就可以方便地应用于其它领域的并行计算系统。  相似文献   

18.
流线是流场可视化的主要方法之一,而针对大规模流场的流线生成由于计算量大往往需要采用高性能计算机这样的并行计算环境结合并行化算法以实现计算加速.在当前异构计算系统越来越普遍的情况下,为了充分利用并行异构计算环境的计算能力,实现更高效的并行流线生成,本文采用了基于数据并行原语结合分布式消息通讯的技术架构,设计了一套适用于异构集群的混合并行流线生成系统,并在此基础上针对数据分块、数据冗余化及进程通讯策略等方面进行设计,提出并实现了一套并行粒子追踪算法.该系统被部署于国产超算平台上,并针对大规模CFD流场模拟结果数据可视化应用开展了实验.本文给出了相关实验结果,分析了核心并行算法的速度性能、可扩展性以及负载均衡等方面情况,说明了系统及算法的有效性和可扩展性.  相似文献   

19.
This paper presents an approach for parallel computation of structural optimization problems on the CRAY X-MP by using parallel sensitivity analysis calculation. In this approach, a main processor is chosen to perform all the optimization calculations except the constraint gradient evaluations. When a sensitivity analysis is needed the main processor decomposes it into several computation tasks, then assigns the computation tasks to the other available associate processors and manages the communication. Due to uncoupled characteristics of the constraint gradient calculations, the associate processors perform the computation tasks in parallel. The algorithm for the structural optimization process with parallel design sensitivity is presented along with some numerical test cases to demonstrate the efficiency of this approach.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号