首页 | 官方网站   微博 | 高级检索  
     

实现可靠计算的容错网格结构
引用本文:邱敏,桂小林. 实现可靠计算的容错网格结构[J]. 微电子学与计算机, 2005, 22(7): 99-102,106
作者姓名:邱敏  桂小林
作者单位:西安交通大学计算机科学与技术系,陕西,西安,710049
基金项目:国家自然科学基金项目(60273085) 国家863计划项目(2001AA111081) 教育部ChinaGrid计划项目
摘    要:由于网格资源的分布性。流动性和异构性,计算故障在网格计算环境中发生的概率比传统机群系统要高.而且结点故障的发生具有不确定性,检测和恢复更加困难。为了在网格计算环境中实现应用程序的可靠执行,提出了一种基于分布式错误检测技术的容错网格体系结构,研究了在结点故障、网络故障和进程故障时,应用程序恢复执行的方法。针对网格环境下上述三种故障发生的特性,研究了不同的应用程序恢复执行机制,其目标是以较小代价获得应用的可靠执行。

关 键 词:容错计算 网格计算 可靠性 错误检测 故障恢复
文章编号:1000-7180(2005)07-099-04
收稿时间:2004-12-22
修稿时间:2004-12-22

Study of a Fault-tolerant Grid Framework for Dependable Grid Computing
Qiu Min,GUI Xiao-Lin. Study of a Fault-tolerant Grid Framework for Dependable Grid Computing[J]. Microelectronics & Computer, 2005, 22(7): 99-102,106
Authors:Qiu Min  GUI Xiao-Lin
Abstract:For the distribution, variability and heterogeneity of Grid resources, the faults probability in grid is much higher than in cluster systems, especially, for the uncertainty of nodes fault, it's more difficult for faults detection and recovery. In this paper, we study the techniques of fault-tolerance in grid computing environment and propose a fault-tolerant grid architecture. Based on the HBM in Globus, we describe faults detection and recovery of network, grid node and processes, and establish the fault-tolerant grid structure oriented parallel computing. Using these strategies, users can recover or adjust computing with small cost and high performance.
Keywords:Fault-tolerance computing   Grid computing   Reliability   Fault detection   Fault recovery
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号