首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
网络通信系统是机群的一个重要组成部分,也是影响机群整机处理效率的关键因素.随着单个结点计算能力的增强,网络通信能力也需要相应地提高.一种提高网络通信能力的方法是引入多个网卡同时进行消息发送,即并行通信.通常,并行通信是基于RMA机制实现的,对于小于17KB的消息,由于RMA机制的握手过程使得并行通信性能的提高很有限.提出了基于智能网卡支持的并行通信协议.该协议将消息重组所需的握手过程下移到网卡上实现,从而减少了握手开销,扩展了并行通信的范围.实验数据表明,与基于RMA机制的并行协议相比,该协议提高了3KB-17KB消息段的通信性能;对应用程序,如FT程序,该协议将其执行时间减少了9.4%,而基于RMA机制的并行协议只减少了7.8%.最后分析了限制并行通信性能提高的主要因素.  相似文献   

2.
在大规模机群环境下,检查点和恢复机制是一种必不可少的容错技术。该文提出一种基于机群通信系统的可靠性机制,在不作全局同步的情况下获取通信系统全局状态的方法,并利用该方法实现了一个对应用程序透明的并行检查点系统。该系统通过底层通信系统的支持降低了并行检查点的实现复杂度和执行开销,适用于大规模机群应用。  相似文献   

3.
刘雷  李晶  陈莉  冯晓兵 《计算机工程》2014,(3):99-102,112
投机并行化是解决遗留串行代码并行化的重要技术,但以往投机并行化运行时系统面临着诸多的性能问题,如任务分配不均衡、通信频繁、冲突代价高,以及进程启动,结柬频繁而导致开销过高等。为此,提出一种基于进程实现的投机并行化运行时系统。采用隐式单程序多数据的并行任务划分和执行模式。通过实现重甩进程的投机任务调度策略和委托正确性检查技术,降低投机进程启动/结束和通信的开销,提高投机进程的利用率,同时利用守护进程与投机进程协同执行的方式,确保在投机进程出现异常情况时程序也能正确执行。实验结果表明,该基于进程实现的投机运行时系统比同类型系统的性能提高231%。  相似文献   

4.
随着机群研究的蓬勃发展和高性能网络的出现,机群通信系统的性能得到了大幅度地提升,该文针对普通的网络应用程序高效地移植到机群高性能通信系统之中的问题展开研究,提出了机群环境中的高效soeket——sockvia。sockvia利用核心级的VIA作为底层的支持协议,在操作系统核心中提供了与基于TCP/IP的socket完全兼容的socket编程界面和运行环境,使得网络应用程序无需修改源码和重新编译连接,可透明地移植到机群高性能通信系统之中,同时sockvia还表现出理想的通信性能,经过标准的netpelf测试,sockvia在AMD64住平台上最低延迟为9.71usec,最高带宽可达1974.85Mbit/sec。  相似文献   

5.
随着机群研究的蓬勃发展和高性能网络的出现,机群通信系统的性能得到了大幅度地提升,该文针对普通的网络应用程序高效地移植到机群高性能通信系统之中的问题展开研究,提出了机群环境中的高效socket——sockvia。sockvia利用核心级的VIA作为底层的支持协议,在操作系统核心中提供了与基于TCP/IP的socket完全兼容的socket编程界面和运行环境,使得网络应用程序无需修改源码和重新编译连接,可透明地移植到机群高性能通信系统之中,同时sockvia还表现出理想的通信性能,经过标准的netperf测试,sockvia在AMD64位平台上最低延迟为9.71usec,最高带宽可达1974.85Mbit/sec。  相似文献   

6.
张伟哲  张宏莉  张元竞 《软件学报》2010,21(Z1):238-250
针对基于MPI 的并行作业性能预测问题,鉴于历史预测与建模分析方法在异构网络计算环境中性能预测的局限,提出了基于判例构造的并行作业性能预测方法.在MPI 库PMPI 接口中插入封套函数,获取通信日志,并设计了日志规整和合并算法.将最核心的日志循环收缩问题,转化为字符串循环子串收缩问题,提出了一种基于后缀数组算法,在理论和实际的性能方面均优于已有算法;判例程序自动构建阶段,解决了计算时间与通信时间等比例缩放问题,设计了自动构建可执行判例程序的方法.同构与异构机群环境实验结果表明,判例预测方法能够比较准确地预估计算作业的运行时间,对于同构机群误差不超过3%,异构机群误差不超过10%,与同类算法相比,具有较好的综合性能.  相似文献   

7.
通信对机群并行计算性能的影响   总被引:1,自引:1,他引:1  
分析了通信和计算重叠模型及LogGP模型,指出各通信参数对并行计算性能的影响,结合并行程序的特征介绍了在机群环境下改善并行计算性能经常采用的五种通信方式:采用高速网络、采用用户级通信协议、利用SMP通信、动态预取或迁移数据、消息合并发送,详尽测试了各种方式影响性能情况并分析了其特点和适用范围.采用高速网络是最常用的方法,性能提高明显,适用于各类应用程序.需要传送大量小消息的并行程序还应采用用户级通信协议.对于特定的一类应用程序,采用消息合并发送方式提高性能最多.采用动态预取或迁移数据和利用SMP通信时要慎重,这两种方法只在特定条件下有效.  相似文献   

8.
高性能并行计算机技术是当今关键技术之一,由清华大学计算机系设计的高性能网络并行超级计算系统THNPSC-1在设计接口时,通过一个表对通信缓冲区进行维护,这样可以直接将数据从应用空间输入/输出到网络,从而支持真正意义上的0拷贝通信协议。通过提供用户层网络访问接口,通信与计算重叠等手段,该接口取得了很高的通信性能。其中实际测量的应用程序之间16字节信息的传递延迟不到7us,最大持续通信带宽可达30MBytes/s。  相似文献   

9.
本系统结合网络安全通信系统的应用需求和功能需求两方面,在深入研究实现数据加密技术的对称密钥密码体制和公开密钥密码体制的基础上,提出了一套网络安全通信系统的设计方案。实验表明,该系统能确保通信双方能够实现网络中聊天和文件传输的安全,它体现了消息保密性和消息认证性两方面的安全特性。  相似文献   

10.
机群的网络通信速度是影响系统整体性能的重要原因。本文讨论了机群系统中几种常见的互连网络,网络通信的类型,衡量通信性能的基本指标和相应的测量方案。  相似文献   

11.
邬延辉  陆鑫达 《计算机工程》2004,30(9):15-16,30
网格中的机群或者超级计算机通过广域网互相连接,在这个平台上进行并行编程应用的一个主要问题是它们的等级网络结构,广域网上的延迟和带宽通常是局域网中的好几倍。该文针对LogP模型进行了扩展,提出带参数的LogP模型,详细讨论比较了其中的各个参数以及如何通过实验对它们进行测量。在此模型基础上通过选取合适的通信结构,并且把消息分割成多个部分。在不同的广域连接上采用并行化发送,达到优化通信操作的目的。  相似文献   

12.
基于Myrinet/GM的多通道通信   总被引:1,自引:0,他引:1  
通信子系统对并行系统的计算效率有重要影响,大规模应用对并行平台的通信性能和可用性提出了挑战性的要求.多通道通信技术通过并行采用多路网络链路互连来提高并行系统通信性能和可用性.首先分析了多进程复用网络对通信性能的影响,然后以Myrinet/GM网络平台为基础,提出了基于网络接口层的通信链路动态选择与分配策略,设计和实现了支持多路Myrinet网络并行通信的协议层MNC.MNC支持通信进程平等,充分地利用多路Myrinet网络链路资源.在使用2路Myrinet互连的PC机群平台上,MNC进程间通信带宽相对于单链路提高了约34%,有效地提高了应用层通信性能.  相似文献   

13.
机群计算多通道通信技术研究与设计   总被引:1,自引:0,他引:1  
讨论了提高机群系统通信性能的主要途径,详细分析了多通道通信技术的提出背景和相关技术,并提出了支持多路Myrinet网络并行通信的多通道通信技术设计方案MNC。  相似文献   

14.
姚渺  裴巍  单珊  孟波  杨愚鲁 《计算机工程与应用》2005,41(17):156-159,196
集群系统通信性能作为影响集群性能的主要因素之一,其测量对寻找集群内部通信瓶颈具有指导作用。采用NetPIPE基准测试对PC集群系统和Sun工作站集群的通信性能进行了测量,实验结果与理论分析一致,表明在通信性能方面,MPI环境整体上优于PVM,合并一些非相关短消息为长消息能够优化集群应用。并采用性能模拟的方法,以基准测试为工具,对两个集群系统的带参数LogP通信模型进行了定量化地测量和计算,完整表征了集群通信子系统的通信性能特征。  相似文献   

15.
This paper gives an overview of two related tools that we have developed to provide more accurate measurement and modelling of the performance of message-passing communication and application programs on distributed memory parallel computers. MPIBench uses a very precise, globally synchronised clock to measure the performance of MPI communication routines. It can generate probability distributions of communication times, not just the average values produced by other MPI benchmarks. This allows useful insights to be made into the MPI communication performance of parallel computers, and in particular how performance is affected by network contention. The Performance Evaluating Virtual Parallel Machine (PEVPM) provides a simple, fast and accurate technique for modelling and predicting the performance of message-passing parallel programs. It uses a virtual parallel machine to simulate the execution of the parallel program. The effects of network contention can be accurately modelled by sampling from the probability distributions generated by MPIBench. These tools are particularly useful on clusters with commodity Ethernet networks, where relatively high latencies, network congestion and TCP problems can significantly affect communication performance, which is difficult to model accurately using other tools. Experiments with example parallel programs demonstrate that PEVPM gives accurate performance predictions on commodity clusters. We also show that modelling communication performance using average times rather than sampling from probability distributions can give misleading results, particularly for programs running on a large number of processors.  相似文献   

16.
This paper presents a language based on the logic programming paradigm that supports objects, messages and inheritance. The object-oriented extension is fairly simple: objects are clusters of processes, objects' state is represented by logical variables, message-passing communication between objects is performed via multi-head clauses, and inheritance is mapped into clause union. The language implementation is obtained by translating logic objects into a concurrent logic language based on multi-head clauses, taking advantage of its distributed implementation on a massively parallel architecture. The runtime support realizes some interesting features such as intensional messages and the transparency of object allocation, object migration and parallelism.  相似文献   

17.
CCSAS:一个高效灵活的应用服务器集群通信系统   总被引:1,自引:0,他引:1  
可靠的集群通信系统为Web应用服务器集群在高负载条件下满足性能需求提供了基础.本文分析了利用集群技术扩展Web应用服务器对于通信的关键需求,提出了一个高效、灵活的集群通信系统,阐述了该系统的结构和设计,介绍了其中若干关键技术和解决办法,包括多播消息的高效传递、协议层次、可配置集群拓扑结构和备份模式等.本文描述的集群通信系统已在自主研发的OnceAS应用服务器中实现.  相似文献   

18.
图计算应用的通信模式以时空随机的点对点细粒度通信为主,但现有高性能计算机的网络系统应对大量细粒度通信时表现不佳,进而影响整体性能。虽然在应用层进行通信优化可以有效提升图计算应用性能,但这会给应用开发人员带来很大的负担,因此提出并实现结构动态的消息聚合技术,通过构建虚拟拓扑的方法在通信路径上增加中间点从而提升消息聚合的效果。传统的消息聚合策略一般仅在通信源或者目的地上进行,聚合机会有限,而所提技术通过灵活调整虚拟拓扑的结构和配置适应了不同硬件条件和应用特征。同时,还提出并实现了面向图计算的有消息聚合的运行时系统,这使得在程序迭代执行时可以动态选择参数,从而减少开发人员负担。在256节点规模的系统上实验的结果显示,使用所提消息聚合技术优化后的典型图计算应用的性能可得到100%以上的提升。  相似文献   

19.
克服机群系统通信瓶颈的软件方法   总被引:4,自引:1,他引:4  
机群系统是一种新兴的并行计算系统 ,它能够以较低的价格提供很高的计算性能 ,因此有广泛的应用前景 .机群系统从整体上说是一种松耦合的体系结构 ,通信是其性能提高的主要瓶颈 .本文首先针对机群系统通信问题做了简要分析 ,在此基础上论述了软件在提高通信性能方面的重要地位 ,着重讨论了如何通过软件方法来提高机群系统性能的途径 .实验结果表明 ,对于许多问题 ,基于相同的硬件支持 ,可以通过软件方法 ,成倍地提高其在机群系统上的求解性能  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号