首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
王勇  王忠群  刘涛  吴小兰 《计算机工程与设计》2007,28(15):3566-3568,3730
随着分布式应用技术的发展,构件的静态性限制了分布式系统在运行期间适应其可用资源变化的要求.为了动态适应系统可用资源,提高系统性能,支持构件可迁移的分布式应用研究受到广泛关注.针对提高构件可迁移分布式应用的可靠性,提出一种分布式系统容错算法.在准同步检查点算法的基础上,通过引入shadow-chain和通讯录机制,实现了构件间通信的可靠性和构件重定位的透明性,从而使得系统能够在较低代价下设置检查点,并能将出错后的系统回卷到一致性状态.  相似文献   

2.
在分布式系统中保持全系统的负载平衡是非常重要的一个环节,进程动态迁移可在一种透明的工作方式下改善系统的性能。本文对分布式系统中进程的动态迁移进行了系统的分析,并提出了一个设计方案,在一定程度上增大了现有系统的利用率,降低了通信频繁率。  相似文献   

3.
分布式系统检查点算法中程序卷回时文件系统的状态恢复   总被引:3,自引:0,他引:3  
检查点技术,也称为“回溯恢复”,是软件容错的重要手段,它主要用于保存和恢复程序的运行状态。在分布式计算和并行计算系统中有十分重要的作用。该文从减少检查点的开销角度,对分布式系统检查点算法中关于程序卷回时文件系统状态的恢复问题进行了分析讨论和进一步的研究。  相似文献   

4.
针对分布式系统存在的状态信息不完全问题,引入部分可观察的马尔可夫决策过程(POMDP)模型到生存控制系统中.在该控制系统的构造过程中,结合前瞻的思想,提出一种简易、有效的搜索算法(NSL算法)来作出决策,从而在一定程度上弥补了现有生存控制系统的不足,提高了分布式系统的可生存性.  相似文献   

5.
分布式系统中基于复制的动态容错模型   总被引:1,自引:0,他引:1  
基于C/S模型的分布式应用系统中,服务器上服务进程的失效往往会导致系统崩溃或系统性能的下降。文章从提高分布式系统软件容错能力的角度出发,提出一种基于复制的动态容错模型。采用进程复制技术,将复制的服务进程分布到不同主机运行,复制进程通过与主服务进程共享消息缓冲队列,动态地保持运行轨迹一致,当主服务进程失效后,从复制的进程中选取一个作为主服务进程,使系统继续运行。  相似文献   

6.
分布式系统中一种负载平衡的动态反馈调整自适应算法   总被引:2,自引:0,他引:2  
重点研究了分布式系统中的进程迁移和定位、负荷分担中的负载平衡等问题;提出并讨论了基于动态阈值和阈长的进程定位模型和系统负载平衡的动态反馈调整自适应算法,还通过具体的实验分析论证了算法的性能.实验结果说明该算法能在一定的范围内很好地解决进程定位和负载平衡问题,具有较大的实用价值.  相似文献   

7.
8.
Linux核外进程恢复可采用先产生原进程整体构架,再恢复断点信息的方法来实现。即用进程中断时的上下文结合相应的恢复代码,与原可执行文件一起产生一个新文件,使该文件在产生原进程整体构架后,就执行恢复代码,恢复出断点处的上下文,然后从断点处继续原来进程的执行。  相似文献   

9.
一种新的用于分布式系统的恢复技术   总被引:1,自引:0,他引:1  
本文提出了在总线型局部网络结构的分布式系统中,针对单节点机发生故障的情况下,以进程间的通讯关系来设置断点的方法,建立相应的进程通讯关系表,从而提出一种新颖的系统恢复算法。该算法的主要思想是:若某节点机发生故障,则该位置,以使进程通讯关系表恢复到一致状态。在本算法中,回郑时所要作废的通讯总次数最大为U-Uq1+1,它的算法复杂度最大为:O。  相似文献   

10.
一种面向移动计算的低代价透明检查点恢复协议   总被引:2,自引:0,他引:2       下载免费PDF全文
移动计算系统中的检查点恢复协议面临着许多与传统分布式系统所不同的问题.在目前已出现的支持移动计算的检查点恢复机制中,基于建立全局一致的检查点的方法不能确保错误的独立恢复;基于m-MSS-m通信的消息日志方法其移动站之间交换的消息需通过移动基站的转发.提出了一种基于消息日志的支持移动站之间直接通信(m-m)的容错协议并给出了相应的算法及正确性证明.与m-MSS-m通信相比,m-m通信有利于降低信道冲突;减少消息传递延迟.仿真结果表明,所设计的协议比传统协议具有更小的无错误状态下引入负载和错误恢复时间.  相似文献   

11.
秦志光  宋旭  耿技  陈伟 《计算机应用》2013,33(2):400-403
针对现有生存性模型缺乏实践指导意义及不能刻画Web应用特性的问题,对Web应用的特点进行讨论,尤其是对原子Web应用和组合Web应用的区别及特点进行探讨,重点考虑了如何对组合Web应用中各原子Web应用之间的调用关系进行分析和建模;同时通过将环境引入到生存性的分析中,分别构建了原子Web应用的生存性模型和基于马尔可夫过程模型的组合Web应用生存性模型。根据建立的Web应用生存性模型,提出一个在Web应用处于不利环境中时,部分或全部服务失效情况下的恢复方案。最后通过已建立的模型对一个案例进行了分析,给出了其恢复过程,在恢复过程中保证了较好的生存性。  相似文献   

12.
针对空中交通管制系统(ATC)中对飞行数据集群处理的可靠性要求,提出了一种基于Linux的用户级进程检查点设置与恢复方案.对基于该Linux用户级的进程检查点的飞行数据集群处理的各个主要模块进行了介绍,在此基础上给出了系统设计框架.从进程的初始化数据段、堆、栈和打开的文件的保存与恢复,给出了该方案的详细实现方法.该进程检查点设置与恢复方案不但可以在主机崩溃重启后恢复进程在重启前的运行状态,更重要的是可以在分布式系统通过进程迁移将保存的进程检查点迁移到其它主机运行,从而有效的提高系统的可靠性,减少运算损失.  相似文献   

13.
为降低设置检查点的开销,提出一种高效的异步存储非阻塞协调式检查点算法。该算法允许多个进程并发地在进程状态信息量较小时设置检查点,只在稳固存储器空闲时进行异步存储,并可同时进行检查点设置及进程执行。实验结果表明,该算法能降低设置检查点的开销,提高系统性能。  相似文献   

14.
随着网络和分布式系统在关键基础设施中的广泛应用,人们对于保能性的关注程度越来越高。基于保能性,参考了传统的可生存系统分析方法和概率风险评测方法,采用层次化方法,将可生存性归结到带来可生存性影响的不利事件上,然后从技术角度和经济效益角度考虑可生存性量化。  相似文献   

15.
要支持异地软件开发,分布式的过程支持系统的建立是必要的.通过比较4种分布式的过程支持系统的体系结构,引擎分布、数据分布的结构能有效地支持分布式软件过程.设计实现了基于P2P方式的多引擎PSEE(ProcessSensitive Software Engineering Environment)——MEPSS,在MEPSS中,每个引擎具有自治性,同时各引擎间通过交互形成一个完整的过程支持系统.  相似文献   

16.
基于进程通信的电力系统分布式计算模型   总被引:2,自引:0,他引:2       下载免费PDF全文
当前,在电力系统分布式计算领域,缺乏一种通用的计算模型以满足各种电力系统分布式计算的基础需求。基于此,分析了电力系统分布式计算的特点,从软件设计的角度出发,抽象出其中的节点行为模型,并针对此提出了一种可广泛适用于电力系统分布式计算的,基于进程通信的计算模型。实际应用表明,该模型可以有效地应用于电力系统的分布式计算中。  相似文献   

17.
针对传统访问控制模型应用到可生存系统时存在的局限性,提出可生存性访问控制的概念和要求,并设计一种可生存性访问控制模型TTC。TTC模型在系统受到入侵而被控制之后仍然能保护关键服务和数据,能实时响应入侵检测报警并指导入侵恢复工作。它包括触发、跟踪和控制等三个规则。触发规则和跟踪规则利用攻击树跟踪入侵者在系统内的活动,控制规则禁止被跟踪的主体破坏关键服务和数据。通过对模型的形式化证明,模型的应用示例,以及与传统访问控制模型的对比,证实了TTC模型在增强可生存性方面的价值。  相似文献   

18.
大型实验装置计算机集中控制系统是一个由前端、预放、靶场等十几个分系统构成的大型分布式控制系统.基于MAS的分布式控制系统具有了良好的扩充性,开放性与可重构性.针对该大型实验装置的控制软件系统提出了一种基于MAS的分布式控制软件系统模型,对单智能体Agent的结构及多智能体Agent的协作做了介绍,并对控制软件系统的核心--控制流程算法做了详细设计,为该模型应用于其它大型实验装置提供了理论基础.  相似文献   

19.
WindowsNT环境下的进程检查点设置与回卷恢复   总被引:6,自引:0,他引:6  
阐述了WindowsNT环境下应用程序的检查点设置与回卷恢复机制,并介绍了设计和实现的检查点设置与恢复工具WinNTCkp.WinNTCkpt采用标准WindowsAPI函数,通过代码动态注入和对系统调用进行包裹的方法进行检查点设置与回卷恢复。与同类工具相比,WinNTCkpt具有不需修改应用程序源代码,不需对应用程序进行重新编译或连接,支持对用户文件内容的检查设置与回卷恢复的特点。WinNTCkpt是正在研制开发的高可用性机群计算环境的核心,也是在机群环境下实现进程迁移和负载平衡的技术基础。  相似文献   

20.
工作站机群系统已成为分布式并行处理发展的主流方向之一 .随着机群系统应用领域的逐渐拓展和规模的不断扩大 ,人们对其可靠性的要求日益提高 .设计高可靠的群机系统 ,需要着重研究其系统容错技术 .本文叙述了并行异构环境回卷恢复和检查点派生 .实现透明的可移植容错和负载均衡能力 .避免调整检查点就可以构成全局一致性状态 .不仅使 BSP应用程序自治容错能力 ,而且能够在机群 (Clusters)间迁移 ,保持系统负载均衡 .重点介绍检查点设置、检查点派生、卷回、进程迁移技术  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号