首页 | 官方网站   微博 | 高级检索  
     

超步透导的回卷恢复
引用本文:丁俊,童维勤.超步透导的回卷恢复[J].小型微型计算机系统,2002,23(6):731-735.
作者姓名:丁俊  童维勤
作者单位:上海大学,计算机工程与科学学院,上海,200072
基金项目:上海市教育委员会曙光计划资助项目
摘    要:工作站机群系统已成为分布式并行处理发展的主流方向之一 .随着机群系统应用领域的逐渐拓展和规模的不断扩大 ,人们对其可靠性的要求日益提高 .设计高可靠的群机系统 ,需要着重研究其系统容错技术 .本文叙述了并行异构环境回卷恢复和检查点派生 .实现透明的可移植容错和负载均衡能力 .避免调整检查点就可以构成全局一致性状态 .不仅使 BSP应用程序自治容错能力 ,而且能够在机群 (Clusters)间迁移 ,保持系统负载均衡 .重点介绍检查点设置、检查点派生、卷回、进程迁移技术

关 键 词:检查点  容错  故障恢复  卷回  进程迁移  进程状态
文章编号:1000-1220(2002)06-0731-05
修稿时间:2001年1月2日

Superstep-Induced Rollback Recovery
DING Jun,TONG Wei qin.Superstep-Induced Rollback Recovery[J].Mini-micro Systems,2002,23(6):731-735.
Authors:DING Jun  TONG Wei qin
Abstract:Cluster of Workstations(COW) now becomes one of the leading teachnologies in the field of distributed parallel processing.To implement the COW with high reliability,it is necessary research its system reliability technique.This paper discusses techniques of checkpointing ,checkpoint propagation and rollback recovery which enable parallel programs written using the BSPlib communication library to tolerate fault and to be ported. The techniques can be used in a mode which is almost totally transparent to the programmer. The critical techniques of checkpointing?checkpoint propagation ?rollback recovery and process migration are focused on in user level.
Keywords:checkpoint  fault tolerance  fault recovery  rollback  fault detection  process migration  process state
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号