首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 578 毫秒
1.
并行程序的编写、调试和性能分析十分复杂和困难,极大地阻碍了并行计算的普及,因此需要一个较完善的并行程序开发环境来帮助开发并行程序、监视程序运行和分析程序的性能,以减轻并行程序开发者的困难。本文针对消息传递类型的并行程序,研究并开发了一种可视化并行程序开发环境GPPDS(Graphical Parallel Program Development System),包括图形化并行程序开发模块、远程提交编译计算模块、性能数据监测模块以及性能可视化模块等。GPPDS是一个轻量的开发环境,功能实用、简单,便于使用。  相似文献   

2.
针对网络并行计算中使用的并行软件环境对非专业人员来说使用难度大且大多是基于UNIX环境开发的特点,构造了1个基于Win32系统的可视化并行程序开发平台(WVP3).该平台提供了可视化界面,并对底层的并行软件进行了较好的封装,使得Windows用户及非计算机专业人员也可以进行并行程序设计.计算时,只需利用该平台提供的工具将并行问题以图形的形式描述出来,平台按照用户的任务描述自动生成任务间的通信语句,自动完成整个并行计算过程.此外,提供了平台的可视化任务描述手段及部分实现细节,描述了该平台使用的用户分析算法和处理机调度方法,并结合实例介绍了使用该平台进行并行程序设计的方法.  相似文献   

3.
裂缝型碳酸盐岩油藏非均质性极强,数值模拟运算时间长,迫切需要一种切实可行的解决方法。介绍了区域分解法在数值模拟中的应用方法,提供了油藏数值模拟串行算法并行化的一般策略与方法。基于已开发的双重介质油藏数值模拟串行算法及建立的Windows平台PC集群网络并行计算环境,利用消息传递界面(MPI库)实现了并行过程中所有消息的传递功能。通过对国内某实际碳酸盐岩油田的模拟表明,并行后的算法是成功的,2个PC加速比高达1.86,4个PC达到3.46,8个PC达到6.89。通过模拟还发现,并行数值模拟时,存在最佳的子区域规模和数目。该算法解决了大规模碳酸盐岩油藏数值模拟时间长的问题,具有实际的应用价值。  相似文献   

4.
介绍了BSP(Bulk Synchronous Parallel)模型,讨论了在该模型下进行并行程序设计的优点,并行算法的分析和设计方法及其必须遵守的原则,以两矩阵的乘法为例说明了如何借助BSP并行程序性能预测工具,利用两阶段BSP并行程序设计方法进行BSP并行程序的设计和开发。  相似文献   

5.
文章介绍一个面向普通PC互连构成的多处理机系统的并行程序开发环境ParaDK.ParaDK由并行程序设计语言ParaC、并行操作系统ParaOS和一个并行程序调试工具组成.ParaC是标准C++扩展了支持并行的宏与库函数而成.ParaOS在MSDOS基础上增加了并行处理所需功能并支持多线程.对ParaOS的多线程机制和线程间同步与通信的方式作了较详细的讨论,并简要介绍了并行调试工具的功能.  相似文献   

6.
针对一类典型二维Laplace问题,研究其有限差分离散方法及其相应离散系统的并行求解算法与并行程序设计,本文设计给出一种求解二维Laplace问题的串行算法和相应的并行算法及OpenMP并行程序。数值实验结果验证:并行算法与并行程序是正确可靠的;对于中等规模问题8线程加速比达到3.03,且在同等的线程数目条件下,求解规模越大,加速比越大  相似文献   

7.
结构动力分析显隐式混合积分并行算法及实现   总被引:6,自引:0,他引:6  
在分布式并行计算机环境下开展有限元并行算法研究是计算力学领域的前沿课题之一。基于区域分裂法,提出了一种新的结构动力分析的显-隐式混合积分并行算法,给出了其算法执行过程,并从物理直观意义上解释了该算法的设计思想,指出了其本质是一种单元弱耦合的混合积分算法。同时在网络并行计算机群系统上,基于并行平台(PVM)设计了算法程序。最后,通过数值算例证明了该算法的可靠性和有效性,并指出了进一步提高并行效率的关键是如何合理确定隐式积分区域单元数目  相似文献   

8.
针对车辆-轨道结构动力分析问题,提出了一种基于网络并行计算环境的并行求解方法.考虑车辆和轨道结构特征,建立车辆-轨道结构动力分析模型,推求动力响应微分方程.针对推导的微分方程,改进串行求解算法,提出一种宏流水并行算法.针对算法的性质分析了该算法的适用范围,并从理论上分析了最佳节点机个数和最大加速比.考虑车辆通过轨道不平顺情况,实现了求解轨道结构动力响应的宏流水并行程序.分别在工作站和个人计算机组成的网络并行环境中,测试了提出的宏流水算法性能.实验结果表明,宏流水并行算法可以获得良好的加速比.  相似文献   

9.
分析对称矩阵LDLT分解过程的并行结构,给出对称矩阵LDLT分解的并行算法,然后考虑粗粒度组合后的负载平衡,提出基于OpenMP的对称矩阵LDLT分解并行算法的实现方案,并对该方案的并行计算性能进行数值实验.实验表明,基于OpenMP的对称矩阵LDLT分解并行算法在多核处理器系统中能够显著地提高算法性能.  相似文献   

10.
油藏模拟实时监控   总被引:2,自引:0,他引:2  
利用VisualC^ 多线程的功能,开发了基于油藏数值模拟和实际动态参数的、具有实时监控功能的油藏数值模拟软件;将一个复杂的油田问题划分为几个简单的并行问题,实现了模拟计算过程中的计算、监控、动画等的并行功能,并对计算过程实施了动态监控,该软件节约了模拟过程中拟合时间,形象地展示油田开过程中油水等在地下的运移情况,用户只需通过简单的菜单操作,就可实现串行操作所不能实现的功能。  相似文献   

11.
【目的】对现有的下一代测序(Next Generation Sequencing,NGS)纠错算法和工具进行分析,提出基于Hadoop平台的纠错算法,以解决大数据处理中计算机内存不足和运行时间长的问题,提升纠错性能。【方法】使用特定的数据对现有的基于K-spectrum的纠错算法进行测试,对各纠错工具的运行时间、内存峰值和纠错结果进行比较来衡量纠错工具的性能。在此基础上提出Hadoop分布式并行纠错算法(Parallel algorithm),并与串行程序、Lighter和Racer进行比较,分析分布式并行实现的可行性。【结果】现有的基于Kspectrum的纠错工具普遍存在较大的内存消耗现象,其中Racer和Sga的纠错效果较好。而Hadoop分布式并行纠错算法对计算机单机内存的消耗较低,当数据量超过一定值时,并行分布式程序的运算时间比串行单机程序明显减少。【结论】本研究提出的Hadoop分布式并行纠错算法不仅降低了内存消耗,而且提高了运算性能,更有利于大规模基因数据的分析处理。  相似文献   

12.
为改善并行应用程序运行效率,对性能数据的采集和分析两个方面进行了研究,分别提出多线程同时采集多种类型的性能数据,以及性能分析应该面向Web的两种思想,并提出了一种对负载均衡程度进行量化的算法,实现了面向Web的性能评价工具。它可以在应用程序运行的同时收集系统负载信息和记录应用程序的行为。用户可以藉此在Internet上任何一台计算机上通过浏览器对性能数据进行多视图、多角度的观察分析,找出性能瓶颈,最终提高应用程序的性能。  相似文献   

13.
针对并行程序的动态性能分析方法存在的问题,提出了一种大粒度并行程序的新的性能分析方法,即间歇性性能分析方法。该方法采用了基于假设验证模型的瓶颈搜索全局策略,数据复用搜索加速方法以及用户交互式的搜索制导等技术,并应用这种性能分析方法改进了一个已有的并行程序事后性能分析系统。实验表明,该方法具有良好的准确性和易用性。  相似文献   

14.
阶段并行模型是BSP(Bulk Synchronous Parallel)模型的改进,它更接近于表述实际的机器行为,同时具有编程简单、独立于体系结构和执行性能可预测等特点。NOWs正成为并行计算领域的的一个新的发展热点,以太网构成的微机集群系统是NOWs的一种重要实现形式,研究了群集系统中阶段并行模型上的并行算法设计,以FFT算法为例,进行了设计和分析,并给出了测试结果。  相似文献   

15.
针对大数据在线聚集执行时间长、执行性能及延迟调度性能较差的问题,提出基于MapReduce的大数据在线聚集优化程序设计.使用分片聚集方法使集群中所有机器的计算资源得到充分调用,采用子连接的启发式优先方法优化各节点本地执行连接任务关系运算,实现大数据在线聚集的并行连接.利用混合近似查询框架的大数据在线聚集动态切换机制及基于渐进近似估计的动态切换机制,降低混合近似查询切换误判率,增强大数据在线聚集的执行性能.实验结果表明,该方法设计的在线聚集优化程序在不同数据规模下的执行时间较小,同时在基本频繁查询性能方面具备显著优势.  相似文献   

16.
数控加工程序的检验与仿真系统的研制   总被引:5,自引:1,他引:4  
无论是自动编程还是还是手工编程,都不可避免存在错误,而人工检验工作量大,可靠性也难以保证,数控加工程序的检验与仿真软件系统,是数控机床加工出合格零件前重要工具,可用以减少编程错误,缩短编程时间,减少废品率。  相似文献   

17.
描述了基于共享机制的分布式可扩展机群系统上性能分析和可视化显示工具的实现技术,分析工具由事件收集器、数据分析器和可视化显示三部分组成,事件收集器收集感兴趣的程序和系统事件,为了易于使用,减少用户负担,将部分探测机制的实现放在了系统的运行时间库和共享存贮器的一致性维护协议中,这样易于将事件与存贮器的地址联系,进而可将事件映射到程序的源代码中,便于用户调试程序,查找性能瓶颈,改进程序的执行性能。  相似文献   

18.
基于很多大数据应用存在对数据进行多种并行处理的需求, 提出两层混合式并行方法, 即执行单元的混合并行和计算模型的混合并行. 通过在同一个计算节点上执行单元的混合并行, 充分挖掘基础设施的计算能力, 从而提高数据处理性能; 采用在同一个执行引擎中集成多个计算模型的并行方法, 以适合应用多样异质处理模式. 不同的混合并行方法可以契合不同的数据和计算特点, 以满足不同的并行目标. 介绍了混合式并行方法的基本思想, 并以前期开发的并行编程模型BSPCloud为基础, 阐述了进程和线程混合并行、BSP和MapReduce混合并行的主要实现机制.  相似文献   

19.
通过对具有一般约束的空间七杆7R机构和空间六杆6R六自由度机器人机构结构的分析,在已有的位移分析的研究基础上,把空间七杆7R机构和空间六杆6R六自由度机器人机构转换为一个自由度为零的空间六杆框架模型,这样便可以通过研究空间框架的形状随输角或末端执行器的变化情况,来进行空间多杆机构位置解析和空间机器人机构位置逆解的求解。  相似文献   

20.
基于CUDA平台的时域有限差分算法研究   总被引:1,自引:1,他引:0  
文章针对传统时域有限差分(FDTD)算法的不足,以图形加速卡为核心,通过理论分析和数值模拟,研究并实现了基于CUDA平台的FDTD并行算法。CUDA是最新的可编程多线程的通用计算GPU模型,由于FDTD算法在空间上具有天然的并行性,因此非常适合在GPU上实现并行算。文章描述了在CUDA编程模型上的FDTD算法的设计以及优化过程,并通过数值仿真实验结果证明了基于GPU的并行FDTD算法可以大大减少计算时间,基于GPU加速已成为电磁场数值计算的研究热点之一。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号