首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 109 毫秒
1.
随着多核计算技术的发展,基于多核处理器的集群系统逐渐成为主流架构。为适应这种既有分布式又有共享内存的硬件体系架构,使用MPI与OpenMP混合编程模型,可以实现节点间和节点内两级并行,利用消息传递与共享并行处理两种编程方式,MPI用于节点间通信,OpenMP用于节点内并行计算。该文采用MPI与OpenMP混合并行模型,使用区域分解并行和循环并行两种方法,对GRAPES全球模式进行MPI与OpenMP混合并行方案设计和优化。试验结果表明:MPI与OpenMP混合并行方法可以在MPI并行的基础上提高模式的并行度,在计算核数相同的情况下,4个线程内的MPI与OpenMP混合并行方案比单一MPI方案效果好,但在线程数量大于4时,并行效果显著下降。  相似文献   

2.
基于处理器制造工艺的提升接近极限,传统的单纯靠提高主频来提升性能已不适合时代需求,促使处理器从单核向多核转化。经过近年发展,多核处理器在当前成为主流配置,而气象程序大部分还是串行的,极大地浪费了处理器的计算资源。MPI和OpenMP作为两种主要的并行环境,具有各自的优势。MPI适用于分布式内存计算机,但是需要对程序进行的修改较多,难度大。OpenMP使用共享内存方式,对程序修改较少。相对来说,OpenMP更适合于多核处理器的并行计算。通过对CALMET进行OpenMP并行化加快CALMET运行速度的尝试,介绍了对串行程序进行OpenMP并行化的一般方法。主要步骤包括:对串行程序进行性能分析,找出计算时间最长的程序段进行并行改写;对循环进行OpenMP并行化,修改中间变量为单个线程私有;编译运行并行程序,进行性能比较;比较并行与串行的运行输出结果是否一致。  相似文献   

3.
介绍可移植的共享内存并行编程应用程序接口 OpenM P, 通过对浅水波模式和复杂地形下的嵌套细网格模式的并行计算试验, 探讨它用于并行化气象预报模式的可行性, 并将其与 M PI 并行编程接口作比较。  相似文献   

4.
在引进欧洲中期天气预报中心 (ECMWF) 的全球谱模式的基础上,通过对原模式的分析改造,首次以分布与共享相结合的方式在国家气象中心IBM/SP高性能计算机上实现了全球谱模式的高效运行。采用调整向量长度、优化程序设计、完善消息传递机制和实现MPI与OpenMP的混合并行编程等方法,减少模式的通信量、计算量和内存的使用量,提高了计算效率。实现了在T213L31分辨率条件下,10天预报可以在3 h之内完成,达到业务对时限的要求。建立了与T213L31全球谱模式相配套的最优插值(OI)并行处理分析系统,解决了由于观测站点在全球不均匀分布所带来的计算负载不均衡问题。在此基础上,实现了T213L31全球资料同化与预报系统并建立了相应的自动作业监控系统。  相似文献   

5.
全球气象资料客观分析系统的分布式并行化   总被引:1,自引:0,他引:1  
对已有的率行算法进行并行化,是一项很困难的工作。通过对全球气象资料客观分析系统率行算法的研究,提出了在MPP高性能计算机上的一种静态分配数据的分布式并行算法。该算法通过间隔选取分析盒子和模式格点纬圈行,将数据分配给不同的处理机实现分布式并行。该并行算法负载平衡好,并行效率高,而且并行化代价较低,具有良好的可扩展性。最后,给出了并行算法的性能测试结果。  相似文献   

6.
广州区域数值预报模式并行化计算   总被引:6,自引:0,他引:6       下载免费PDF全文
采用消息传递方式 (MPI) 对最近发展的广州区域数值预报模式进行了并行化计算研究。根据模式的结构和计算过程特点, 模式适合采用水平分区方案进行并行计算处理。在曙光3000并行计算机上分别采用一维和二维分区并行方案实现了模式的并行化计算, 并对模式的并行效率、并行加速比和并行通讯时间百分比等做了测试。对测试结果的分析表明:采用8个CPU时, 两种方案都能在1 h内完成72 h的预报, 一维分区方案的并行效率则保持在90 %左右, 可以满足业务运行需要。当模式使用8个以上CPU时, 通讯时间迅速增加并超过了计算时间的50%, 模式并行效率明显下降。CPU相同时, 模式一维分区并行方案比二维分区并行方案并行效率高且实现起来简单。  相似文献   

7.
杨森  周小珊 《气象》2003,29(1):52-54
介绍了如何在Linux操作系统下,应用OpenMP编译选项实现MM5的多线程(并行)运行,笔记从用户使用OpenMP时可能出现的问题,到寻求解决问题的思路,到问题的最后解决,进行了说明,同时,介绍了使用OpenMP的优点。  相似文献   

8.
超级计算机上矩阵乘的并行计算与实现   总被引:3,自引:0,他引:3       下载免费PDF全文
数值预报系统中经常要用到矩阵乘运算。在分布式超级计算机 (如IBM-SP) 上, 矩阵乘的并行计算需要较多的数据移动, 有效的数据传输对矩阵乘的实现至关重要。该文讨论了两种矩阵乘的并行算法, 一种是基于矩阵的列-行划分方式, 一种是基于矩阵的网格划分方式。在IBM-SP计算机上的实验结果表明, 网格划分的矩阵乘并行算法通讯开销更小, 并行效率更高, 其并行加速比较列-行并行算法改善约10 %。  相似文献   

9.
杨昕 《气象科技》2006,34(Z1):27-30
GPFS(通用并行文件系统)普遍应用于IBM大规模集群系统中,能够为并行应用程序提供高性能的I/O存取访问。该文介绍了GPFS的原理和工作机制,并以安装在国家气象信息中心的IBM高性能计算机系统为试验平台,初步测试了在实际环境中GPFS的应用情况,在应用程序中对文件访问进行性能优化的方式有2种:①由主任务负责全部文件访问,②通过MPI-IO在GPFS中实现并行文件访问。测试结果表明,GPFS可以提供很好的文件访问支持,但要想获得较高的性能,需要在应用程序中进行深入调试。  相似文献   

10.
基于MPI技术的AREM模式并行开发及试验   总被引:1,自引:0,他引:1  
应用消息传递接口函数库(MPI)并行程序设计技术开发了中尺度暴雨数值预报模式AREM(Advanced Regional Eta-coordinate Model)的并行版本,并在3种计算机系统平台下进行了加速比测试,结果显示出较高的并行效率和较好的可扩展性。建立并行版本后,模式高分辨率版本能够满足时效性要求。通过采用并行模式的高低分辨率版本对一个暴雨个例进行模拟表明,高分辨并行版本的模拟结果与观测更为接近,并具有较好的预报时效性。  相似文献   

11.
高性能并行计算,一直是气候系统模式研究中的重要科学前沿。然而,随着计算机技术的发展,计算机体系结构越来越复杂,以及气候系统模式本身的复杂性使得开发高性能气候系统模式成为一个难题。采用了一种全新的并行程序设计方法:基于针对气象科学中的计算特点发展出的领域编程框架J-Earth,构建了高性能并行大气环流模式H-GAMIL。在对原模式GAMIL分析和解构以后,结合J-Earth的特点,采用面相对象的编程方式,对H-GAMIL进行重构。重构后的H-GAMIL具有现代软件标准化模块化的特点,并具有自动二维剖分、MPI(Message Passing Interface)和Open MP(Open Multi-Processing)混合并行实现、并行输出等新功能。解决了原模式一维剖分受到处理器限制,串行IO等问题。在此基础上,本文对H-GAMIL进行了并行效率测试,结果显示,模式水平分辨率为1°(纬度)×1°(经度)时,可使用上千处理器核,并行效率达40%以上且负载平衡达70%。测试结果表明了H-GAMIL具有较好的并行效率和可扩展性;同时对H-GAMIL模拟性能进行对比分析,其结果表明H-GAMIL保持了原模式的守恒性,并且具有与原模式相当的模拟性能,能够满足气候研究的计算需求,达到实用程度。  相似文献   

12.
神威集合数值天气预报系统是以国产巨型机“神威”为平台的实时业务系统, 检验子系统是其重要的组成部分。文章介绍了神威集合数值天气预报系统中检验资料提取的并行化实现方法及并行效率。  相似文献   

13.
大规模数据并行处理的性能受到处理机数量、I/O速度、通信速度等多方面因素的制约。增加处理机数量或提高处理机的计算速度,可以提高计算机的整体处理速度,但是通信和I/O会成为影响并行效率的主要因素。为了综合分析这些因素对计算性能的影响,用一种比较典型的大规模数据并行的计算模型,具体分析了处理机数量、处理机速度与处理机间的通信延迟、通信速率以及输入输出速度之间的关系。得到了大规模并行机的通信和I/O性能与处理机速度与数量之间存在的关系。指出,增加处理机数量、提高单节点处理速度的同时,必须按照一定的关系相应增加节点间的通信性能和I/O性能。单纯以增加处理机数量、提高单处理机速度提高计算机峰值速度的方法会降低系统的计算效率,不能达到计算速度与计算机处理能力同步增长的目的。  相似文献   

14.
高分辨率数值预报模式并行计算方法研究   总被引:1,自引:0,他引:1  
根据计算机软硬件条件引进开发数值模式在PVM环境下的并行版本,于1996年6月开始模式并行计算业务实验。结果表明:在数值预报中采用并行计算技术后,其CPU加速比达到3.21,并行效率达80%,模式并行计算版本运行基本稳定,计算结果与串行计算结果基本一致。  相似文献   

15.
原始方程模式多处理器的并行计算方案设计及试验   总被引:1,自引:0,他引:1       下载免费PDF全文
矫梅燕  李国杰  林洪 《大气科学》1995,19(5):623-630
本文介绍并行处理器(Transputer芯片)的性能和特点,及其对微机功能扩充上的应用。结合气象问题,设计了五层原始方程数值预报模式的并行计算方案。经过试验,计算速度明显提高,结果正确可靠,从而为省级气象部门的数值预报业务化及科学研究提供了一条有效途径。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号