首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 483 毫秒
1.
并行程序性能分析在科学计算程序设计和优化中发挥着重要作用,通过它可以了解并行程序运行效率,分析计算瓶颈,从而改进和优化程序设计,更好地发挥高性能计算机效 能。本文介绍了WRF三维变分同化原理和并行策略,采用性能分析工具TAU对WRF三雏变分同化并行程序运行效率进行了量化分析,确定了程序的计算热点和瓶颈,并提出了相应的优化方案。  相似文献   

2.
郭强 《计算机学报》1990,13(11):839-845
目前,诸如Fortran 8x这样的程序设计语言中已经引入了并行运算成份。本文讨论在普通串行(标量)机上实现数组语句串行计算的一般方法,目的旨在探讨标量机上实现并行程序设计语言的编译器。  相似文献   

3.
LS SIMD C编译器的数据通信优化算法   总被引:1,自引:1,他引:0  
1 引言当前理想的程序自动并行化系统的实现存在许多难于解决的问题,因此较为流行的并行计算方法是利用并行语言编写并行程序,编译器对并行程序进行编译生成相应的节点程序执行。并行语言按并行执行的粒度分为基于任务的并行语言(主要面向一般应用领域的计算)和数据并行语言(主要应用于科学数值计算),典型的数据并行语言如HPF。对于数据并行语言而言,程序执行的并行性已由程序设计人员根据程序中的数据相关性给出。因此,如何确定数据的分布、优化数据的通信是影响并行程序执行效率的重要问题。数据分布大致可以分为两个阶段:首先对源程序中数据的相关性分析得到数据在抽象处理机上的分布,然后将抽象处理机上的数据分布映射到物理处理机上。数据分布的确定通常有以下几种实现方式:一种是由程序员给出抽象数据分布,编译  相似文献   

4.
OpenMP并行程序的编译器优化   总被引:3,自引:0,他引:3       下载免费PDF全文
OpemMP标准以其良好的可移植性和易用性被广泛应用于并行程序设计。该文讨论了OpenMP并行程序的编译器优化算法,在编译过程中通过并行区合并和扩展,实现并行区重构,并在并行区中实现了基于跨处理器相关图的barrier同步优化。分析验证表明,这些优化策略减少了并行区和barrier同步的数目,有效地提高了OpenMP程序的并行性能。  相似文献   

5.
有效的程序自动并行化系统能帮助用户充分利用并行计算机的硬件资源和提高并行程序设计的效率。OpenMP作为共享内存结构的编程标准,具有良好的性能和可移植性。本文介绍了基于SUIF的OpenMP并行程序自动生成工具OAGT的设计和实现,重点讨论了其中所涉及的几个主要技术问题:循环分析、流水并行、归约操作、同步优化等。  相似文献   

6.
并行程序概念设计方法的研究   总被引:3,自引:1,他引:3  
并行程序概念设计方法是将数据并行高层建模语言研究、并行识别方法、并行程序自动构造和人机交互界面技术集成在一起的并行程序设计的一种新方法,能简化并行程序设计,有效缩短并行程序开发周期,提高并行计算效率。文中就上述4个方面的主要技术作了简要介绍,给出了并行程序概念设计系统(PPCDS)的基本框架和计算实例。  相似文献   

7.
与串行程序相比,并行程序调试会遇到新的问题。首先并行程序往往需要长时间运行,从而导致并行程序调试是一个尤其费时的过程;其次并行程序调试过程中,某一次调试出现的错误在下次调试的时候不一定出现,给错误跟踪带来了很大困难。本文针对这两个问题,设计和实现了一个中间件系统,在并行调试工具XMPI中使能BLCR检查点系统的。通过该中间件,在使用XMPI调试大型MPI并行程序的时候,减少调试阶段并行程序运行时间,并且可以更好跟踪并行程序错误,提高并行程序开发效率。  相似文献   

8.
并行应用程序的远程实时跟踪可视化系统的设计及实现   总被引:2,自引:0,他引:2  
并行应用程序的远程实时跟踪可视化技术通过实现对并行应用程序的实时监控,帮助科研人员更进一步地了解和控制并行数值模拟的计算过程.介绍一个面向并行应用程序的远程实时跟踪可视化系统.该系统远程实时访问运行在分布存储并行机上的并行程序中的变量,将计算的中间结果实时地显示在客户端图形工作站上,从而实现程序的远程实时跟踪.从设计目标、体系结构及其实现等几个方面来介绍该系统,着重讲述该系统中的核心部分——数据传输模块的实现,详细阐述该模块实现过程中所采用的分布类型数据的位置索引及同步访问机制等关键技术.  相似文献   

9.
本文在并行系统模拟环境中,采集了一个迭代类并行程序实例的运行时间数据,据此,分析了影响程序运行时间的主要因素,建立了一个并行程序运行时间推算模型,从而可以在迭代次数,输入数据规模,以及并行系统的配置等三个方向上对程序运行时间进行预测,实验数据表明,该模型是相当精确的,可以为我们节省大量的模拟时间。  相似文献   

10.
计算机体系结构的发展与分布式并行程序设计语音OCCAM   总被引:1,自引:0,他引:1  
本文主要概述了计算机体系结构的发展趋势以及相应的程序设计语言必然向分布式并行语言方向发展。文章中归纳了分布式程序设计语言研制的两种途径,重点介绍了一种新型的分布式并行程序设计语言——OCCAM。OCCAM既是一种分布式多机并行系统设计的系统程序设计语言,又是一种面向应用和教学的并行程序设计语言。它适合于科学计算,数字处理,实时系统的程序设计。最后,文章给出了在IBM——PC机上,UCSD——P系统支持下的并行算法及其结构的OCCAM模拟程序。  相似文献   

11.
基于事务性执行的投机并行多线程是一种适合未来多核微处理器架构的新型并行程序设计和编译技术.但在此基础上的并行程序执行过程更为复杂,程序执行过程的模拟成为关键问题之一.本文提出利用二进制代码级动态插桩技术对投机并行多线程程序进行功能性模拟,设计并实现了完整的软件平台,可精确地模拟和监控并行程序的线程级投机执行过程,检测访存冲突,从而实现投机并行多线程的语义.该软件平台同时可以作为进一步研究投机多线程并行程序真实执行过程的基础,并有效支持投机并行多线程编译器的设计和分析.  相似文献   

12.
吕海  邸瑞华  龚华 《计算机科学》2012,39(1):305-310
通过对基于MPI编程模型实现的开源有限元计算分析软件在多核集群计算平台中的程序性能的分析,找出程序瓶颈及其原因,实现了基于MPI编程模型的并行程序在多核计算环境中的性能优化。根据程序性能瓶颈的分析,提出了基于MPI/OpenMP混合并行编程模型的大规模线性/非线性方程组求解和多线程多进程同时进行消息通信的两种程序性能优化方案。不同计算规模的实验结果表明,在多核集群计算平台中,MPI/OpenMP混合编程模型实现的大规模非线性方程组求解器相对于单纯基于MPI编程模型实现的并行程序,其性能有2倍到3倍的提升;多线程多进程同时消息传递的优化方案虽然对程序能够起到性能优化作用,但是对解决程序消息通信瓶颈的问题不是最好的方法。两个方案总体性能分析结果表明,基于MPI/OpenMP混合编程模型实现的并行程序,在多核集群计算平台中能够更好地发挥硬件系统的计算能力。  相似文献   

13.
多核处理器并行编程模型的研究与设计   总被引:2,自引:0,他引:2  
为了在多核处理器上充分利用多核资源以提升程序性能,研究了多核处理器的体系结构和多核环境下可能影响并行程序性能的因素,实现了基于任务的并行编程模型.该模型提供了单任务数据并行和多任务并行两种并行处理方式,其中单任务数据并行使用cache块技术划分数据集,多任务并行使用任务密取的任务调度策略.用该模型实现了计算斐波那契数列的递归算法,实验结果表明,使用该模型编写多核并行程序可以达到较高的相对于串行计算的加速比.  相似文献   

14.
并行程序Petri网模型的结构性质   总被引:1,自引:0,他引:1  
正确性是并行程序的基础,但是由于它的复杂性,其验证要比串行程序困难得多,因此有必要进行建模并研究其性质.从程序的角度出发,在将基于消息传递的并行程序转换为Petri网模型之后,证明了与并行正确的并行程序对应的Petri网模型应当满足的结构性质,包括强连通性、S-不变量、T-不变量、受控死锁性质以及守恒性,并举例说明了这些性质在并行程序验证中的应用.这些性质可用于并行程序的事前验证,而且避免了使用动态性质进行验证时的状态爆炸问题,从而提高并行程序设计和验证效率.同时这些方法具有良好的可推广性.  相似文献   

15.
袁伟  孙永强 《软件学报》1998,9(1):47-52
面向对象的并行程序设计提供了类似于共享内存模型对通讯和计算的抽象能力,从而非常适合于大型并行软件系统的开发.但是基于远程对象调用的分布式对象的实现效率一直是面向对象方法在分布式/并行程序设计中得到广泛应用的障碍.本文介绍了并行机MANNA上所采用的面向对象的并行程序设计模型——Dual-Object模型.该模型通过引入从语义角度出发给出的数据一致特性的描述,在一定程度上解决了实现效率低下的问题.其次,文章通过程序设计实例详细地讨论了基于Dual-Object模型的扩展C++并行程序设计,并给出了部分实际测试结果.  相似文献   

16.
并行程序设计是发挥并行计算机效率的关键,它涉及到并行算法与并行处理技术,并行程序设计,软件重用,设计工具与设计环境等诸多专业方向的研究与应用,是当前并行计算机应用领域中的一个重要研究方向,本文重点讨论并行算法与并行程序效率评测,并行程序设计与重构,软件重用技术,以及并行程序设计环境。  相似文献   

17.
并行程序的设计在思路和方法上与串行程序有着本质的差别,其开发难度也比较大。为此,设计开发了一个通用的函数库来降低并行程序的开发难度。该函数库以MPI为基础,对并行程序开发中的常用功能进行了封装,具有一定的通用性。该函数库可以大大简化MPI并行程序的开发。并从区域分解、数组下标和循环变量的转换、数据交换和全局规约、输入输出等几个方面对该函数库进行了介绍,然后以数值求解二维拉普拉斯方程为例介绍了使用该函数库将串行程序改为并行程序的方法和步骤。目前已经成功地将其应用到风暴潮数值模式的并行化中,取得了较好的效果。  相似文献   

18.
介绍了一种异构环境下的并行调试及性能分析工具ParaVT的设计方法和实现.通过对并行程序源代码的分析处理,利用自动插桩模板插入用于调试和性能分析的用户代码,从而对并行程序进行断点调试和性能参数收集,达到进一步优化程序设计的目的.  相似文献   

19.
并行构件技术的出现提高了并行软件的开发效率,但现有的并行构件技术缺乏对异构多核平台的支持.为了提高并行构件程序在异构平台上的执行性能,扩展CCA(通用构件体系结构)并行构件模型支持CCA异构并行构件,提出了一种异构的CCA并行构件模型.使用管理者—工人模式调度CCA异构并行构件内的计算任务到异构多核平台上加速执行.在CCA构件工具包的基础上实现了支持扩展CCA并行构件模型的编译系统和运行时框架.在CELL BE和GPU两种异构多核处理器上进行的实验证明了提出的方法比原始的CCA构件程序具有较优的性能.提出的并行构件模型应用在并行程序开发中可以提高并行程序的性能.  相似文献   

20.
并行化编译器通过发掘串行程序中的并行性来提高程序的运行性能。但当可并行的工作量与并行的线程数目之比较小时,有可能采用并行执行反而会降低程序的整体性能。本文工作基于SUIF结构.研究精确的工作量计算方法,并实现了基于工作量的条件并行化技术.有效地提高了并行程序的执行性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号