首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
As the scale and complexity of heterogeneous computing systems grow, failures occur frequently and have an adverse effect on solving large-scale applications. Hence, fault-tolerant scheduling is an imperative step for large-scale computing systems. The existing fault-tolerant scheduling algorithms belong to static scheduling, and they allocate multiple copies of each task to several processors no matter whether processor failures affect the execution of tasks. Such active replication strategies not only waste resource but also sacrifice the makespan. What is more, they cannot guarantee the successful execution of applications. In this paper, we propose a fault-tolerant dynamic rescheduling algorithm named FTDR, which can overcome above drawbacks. FTDR keeps listening to the processor failure, and reschedules the suspended tasks once failures occur. Because FTDR reschedules the tasks that are suspended because of failures, it can tolerate an arbitrary number of failures. Randomly generated DAGs are tested in our experiments. Experimental results show that the proposed algorithm achieves good performance in terms of makespan and resource consumption compared with its direct competitors.  相似文献   

2.
容错机制就是评价移动Agent系统服务质量的重要标准,同时,它也是移动Agent技术优势得以体现的重要手段.本文提出一种基于异构机群环境下的移动Agent系统分布式容错机制,并分析了当前的种种Agent系统容错机制,以期进一步完善MAS容错策略.  相似文献   

3.
一般来说,异构分布式实时系统中任务的周期并不完全相同且任务的时限不等于它们的周期,同时系统中还有一些无容错需求的任务.因此现有的任务调度算法一般不能满足这些要求.针对这类系统,在结合基版本/副版本技术和EDF算法的基础上,给出了一种新的容错调度算法.该算法由两部分组成:任务分配调度算法和单处理器调度算法.对于单处理器调度算法,本文采用了EDF算法;在此基础上,给出一种启发式静态任务分配算法.分析了系统的可调度性,给出了任务可调度条件和基版本/副版本时限的设置方法.仿真结果表明,这种算法是有效的.  相似文献   

4.
This paper addresses fault-tolerant topology control in a heterogeneous wireless sensor network consisting of several resource-rich supernodes, used for data relaying, and a large number of energy-constrained wireless sensor nodes. We introduce the k-degree anycast topology control (fc-ATC) problem, with the objective of selecting each sensor's transmission range such that each sensor is k-vertex supernode connected and the total power consumed by sensors is minimized. Such topologies are needed for applications that support sensor data reporting, even in the event of failures of up to k - 1 sensor nodes. We propose three solutions for the k-ATC problem: a k-approximation algorithm, a greedy centralized algorithm that minimizes the maximum transmission range between all sensors, and a distributed and localized algorithm that incrementally adjusts sensors' transmission range such that the k-vertex supernode connectivity requirement is met. Extended simulation results are presented to verify our approaches.  相似文献   

5.
异构分布式实时仿真系统的容错调度算法   总被引:1,自引:0,他引:1  
刘云生  张童  张传富  查亚兵 《软件学报》2006,17(10):2040-2047
异构分布式实时仿真系统是一类特殊的实时系统,基于改进的SP(spare processor)容错模型(checkpoint-based spare processor,简称CSP)对其容错问题进行了研究.首先,根据仿真系统的特点提出了两个命题,这是后续工作的基础;而后,基于Markov链对仿真任务的最坏反应时间进行了分析,并提出了仿真任务的可调度性分析规则;最后,基于CSP容错模型和上述可调度分析规则提出了异构分布式实时仿真系统的容错调度算法CSP-RTFT.算法的仿真结果表明:该算法较之基于SP模型的算法SP-RTFT可获得更好的稳定性、更高的任务接收率;缺点是资源利用率比PB模型下的算法要低.  相似文献   

6.
7.
异构跨域身份认证是对不同体制信任域内的节点进行身份确认和安全信息交互的技术,现有的认证方案主要存在单点攻击风险和认证复杂等问题。为此,设计了主从区块链身份认证模型和匹配使用的分层拜占庭容错算法,通过主从链分步、分阶段共识,减少了共识参与节点数量,并将PKI体制与CL-PKC体制的特有功能节点与主从链节点相对应,在不改变原有信任域节点功能的前提下,使用区块链证书的哈希值高效传递信任,优化了认证流程,实现了双向异构跨域身份认证。最后通过仿真实验验证以及安全性和性能分析,表明该方案与相关方案对比,在实现安全通信的同时,提高了共识效率和容错性,降低了认证过程的通信开销。  相似文献   

8.
朱晓敏  祝江汉  马满好 《软件学报》2011,22(7):1440-1456
容错调度是调度问题中一个重要的研究内容,是提高系统可靠性的有效手段.目前已有很多集群系统中实时任务的容错调度算法,但是这些算法都没有考虑到任务的QoS需求问题.提出了一种异构集群系统中具有QoS需求的实时任务容错调度算法FTQ(fault-tolerant QoS-based scheduling).该算法采用主版本/副版本(primary/backup,简称PB)技术,综合考虑了任务的时间限制、任务的QoS需求、系统的可靠性和系统资源的利用率,能够自适应地根据系统负载情况动态地调整任务的QoS级别和副版本的执行模式,从而提高了系统的灵活性、可靠性、可调度性和资源的利用率.对系统的可靠性进行了定量分析,并将其引入到容错调度算法中,提高了系统的可靠性.同时,在调度过程中尽量提前主版本的开始时间,推迟副版本的开始时间,以使任务的副版本采用被动执行模式或者使任务主版本和副版本的重叠部分尽量少,提高了资源的利用率.此外,采用了副版本重叠技术,并分析了副版本的最晚开始时间及其约束条件,提高了任务的调度成功率.通过大量的模拟实验,对FTQ,NOFTQ和DYFARS算法进行了比较.实验结果表明,FTQ算法的性能优于其他方法,具有更好的调度质量.  相似文献   

9.
赵毅  曹宗雁  朱鹏  迟学斌 《软件学报》2013,24(S2):89-98
中国科学院超级计算环境是整合了包括总中心、分中心和所级中心计算资源的3层架构超级计算环境.为提升超级计算环境的可靠性,提供稳定、可靠的计算服务,其容错机制的研究成为超级计算环境的一个研究重点.在对容错基本思想及各类计算机容错技术进行充分调研的基础上,提出一种适用于超级计算环境的容错框架,依据该框架给出了不同层次的容错方案,并对不同层次的容错开销进行了分析和比较,验证了不同层次容错方案对应用程序所带来的影响.  相似文献   

10.
随机化技术防御进程控制流劫持攻击,是建立在攻击者无法了解当前内存地址空间布局的基础之上,但是,攻击者可以利用内存信息泄露绕过随机化防御获得gadget地址,向程序注入由gadget地址构造的payload,继续实施控制流劫持攻击,窃取敏感数据并夺取或破坏执行软件的系统。目前,异构冗余执行系统是解决该问题的方法之一,基本思想是同一程序运行多个多样化进程,同时处理等效的程序输入。随机化技术使冗余的进程对恶意输入做出不同的输出,同时正常功能不受影响。近年来,一些符合上述描述的系统已经被提出,分析进程异构冗余执行系统的表决设计可以发现,基于ptrace的实现方法会引入大量的上下文切换,影响系统的执行效率。率先直接修改内核设计出一种进程异构冗余执行系统,表决过程完全在内核中完成,冗余的进程独立地采用内存地址空间随机化技术,构建相互异构的内存地址空间布局,在与内存信息泄露相关的系统调用处进行表决,发现泄露信息不一致,阻断进程控制流劫持攻击。即使攻击者跳过内存信息泄露进行漏洞利用,异构内存空间布局也使得注入由gadget地址构造的payload无法同时在冗余的进程中有效,阻断进程控制流劫持攻击。实现...  相似文献   

11.
基于CORBA消息服务的容错机制研究   总被引:11,自引:0,他引:11  
郭长国  周明辉  贾焰  邹鹏 《计算机学报》2002,25(10):1059-1064
CORBA逐渐成为面向对象分布式应用中间件的主要标准,但是CORBA当前没有为容错提供相应的机制,该文在比较各种容错方法的基础上,讨论了一种基于异步消息服务回调和查询模型的容错方法,该方法使服务对象的副本可以并行地处理客户请求,提高了容错的性能,该方法具有对服务对象透明,可以满足用户不同容错要求等特点,文中还给出了这种方法在为遗留应用增加容错能力时的应用实例。  相似文献   

12.
设计具有更优的"度-直径"折衷关系,并能更好地适应动态、异构的Internet环境的DHT方法是结构化P2P技术研究的重点.提出一种容错、非对称的DHT方法:A-DHT.A-DHT根据接入延迟、带宽和用户行为把节点分成胖节点和瘦节点两类,并以Hyper-de Bruijn图为基础构建非对称的网络拓扑.A-DHT充分利用胖节点的消息转发能力实现了更优的、"平均度-直径"折中.同时,A-DHT又利用瘦节的冗余边得到了比各种基于字母表的DHT方法更好的容错性.介绍了A-DHT的静态拓扑结构、路由算法以及基于A-DHT构建P2P网络的若干算法.理论分析和实验证明,A-DHT在低网络负载条件下能够有效降低路径长度和延迟,在高网络负载条件下能够有效避免胖节点的过载,同时具有较好的容错特性.  相似文献   

13.
We propose a new approach, called cluster-based search (CBS), for scheduling large task graphs in parallel on a heterogeneous cluster of workstations connected by a high-speed network (e.g., using an ATM switch at OC-3 speed). The CBS algorithm uses a parallel random neighborhood search which works by refining multiple different initial schedules simultaneously using different workstations. The workstations communicate periodically to exchange their best solutions found thus far in order to direct the search to more promising regions in the search space. Heterogeneity of machines is exploited by the biased partitioning of the search space. The parallel random neighborhood search is fault-tolerant in that the workload of a failed workstation is automatically redistributed to other workstations so that the search can continue. We have implemented the CBS algorithm as a core function of our on-going development of SSI middleware for a Sun workstation cluster.  相似文献   

14.
随着互联网+、云计算以及大数据等领域的迅速发展,异构平台成为部署科学计算、工业控制、云存储等关键应用的重要平台.由于平台内处理机性能及软硬件体系结构的异构性,异构平台表现出良好的可扩展性与高性价比.但是平台规模扩大和系统应用日趋复杂导致异构平台上实时任务的可调度性变差,系统可用性降低.针对此问题,提出了一种异构平台实时任务的可用性提升容错调度算法(availability improving fault-tolerant scheduling algorithm, AIFSAL).以处理器利用率和可用性成本为依据设计任务调度整体框架结构、处理机、任务以及调度模型;结合可用性成本设计算法并通过主副版本备份(primary/backup copy, PB)方法实现容错,任务副版本根据处理器利用率不同选择被动或重叠方式执行以减少系统冗余开销,提高可调度性,调度中无论任务主、副版本均优先选择可用性成本低的处理机以提高系统可用性;对任务分配情况和可调度性进行理论分析以证明AIFSAL的可行性.仿真实验与比较分析表明,AIFSAL较可用性约束(availability approached task scheduling algorithm, AATSAL)算法、单调速率扩展(task partition based fault-tolerant rate-monotonic, TPFTRM)算法以及最早完成时间(MinMin)算法在不降低可调度性的基础上有效地提升了系统可用性,减少了系统综合开销,综合性能提高显著.  相似文献   

15.
主动式汽车驾驶模拟器是一种能正确模拟汽车驾驶操作,并能在主要性能上获得与实车相同感觉的汽车驾驶训练仿真教学设备,它一般由机械装置部分、传感器电路、软件部分和显示设备组成,其中车速表驱动模块是其一个重要组成部分。作者设计了驾驶训练模拟器车速表驱动模块的硬件电路,编制了单片机控制程序,最后利用VC 编写了计算机与单片机之间的串口通讯驱动程序,实现了计算机对车速表的驱动。  相似文献   

16.
异构分布式系统中实时周期任务的容错调度算法   总被引:1,自引:0,他引:1  
罗威  阳富民  庞丽萍  涂刚 《计算机学报》2007,30(10):1740-1749
提出一个基于抢占性实时周期任务的可靠性调度模型,该模型与现有可靠性模型相比充分考虑了单处理机故障容错情况下的系统可靠性,因而更加接近现实和精确.在此基础上,提出一个基于异构分布式系统的实时容错调度算法IRDFTAHS,IRDFTAHS算法以提高系统的可靠性为目标来进行任务的分配,从而在不增加硬件代价的前提条件下通过调度增加了系统的可靠性.该算法同时支持主动和被动两种方式的副版本,使得容错调度算法具有更大的灵活性.最后,通过仿真实验对IRDFTAHS和现有的调度算法在几个方面进行比较.实验结果表明,IRDFTAHS算法的综合性能优于现有算法.  相似文献   

17.
1IntroductionThehyper-distributedhyper--parallelartificialintelligence(Al)approachisexpectedtobeabletoovercomemanyformidabledifficultiesarisingintheclassicalsequelltialsymboliclogicandtheordinaryneuralnetworks.Theconcurrentpropagationofcompetitivewaveshasbeenusedinhyper--distributedhyper-parallelheuristicsearchingsuccessfully[1--3].In[1]and[2],however,therearemanyrestrictionsimposedonthewavepropagation,knownasthesynchronoushomogeneouspropagationortheasynchronoussuperimpositionofpartialsynchron…  相似文献   

18.
分布式环境下的入侵检测系统是入侵检测的研究热点,系统中各Agent运行于不同的平台上,具有不同的数据表达格式,这需要有效的通信机制保障Agent间的通信与协作.本文在入侵检测标准化组织现有文档的基础上,提出了一个具有通用性的分布式入侵检测系统通信机制框架.Agent间的消息交换格式参照IDMEF标准,并根据入侵检测Agent通信需求扩充了警报数据的XML描述.框架还给出了Agent通信安全机制,使通信机制总体上满足了分布式入侵检测系统警报信息量大、实时通信、安全性高的特点.  相似文献   

19.
异类网(IPv6/IPv4)通信的转换机制   总被引:2,自引:0,他引:2  
我们正在向下一代网络环境 (IPv6 )过渡 ,IPv4和 IPv6两种网络环境共存是不争的事实 ,如何在不牺牲现有网络体系框架的优势和便利的情况 ,实现异类网之间的通信是本文主要探讨的内容 .在通过分析各种异类网转换机制的基础上 ,给出了一个基于 SOCKS的 IPv6 / IPv4转换机制的原理和实例  相似文献   

20.
运载火箭推进剂加注自动对接与脱离机器人本体设计   总被引:1,自引:0,他引:1  
为提高火箭发射中燃料加注系统的可靠性和安全性,设计了一种用于火箭推进剂加注时自动对接和脱 离的机器人本体结构.应用ADAMS 对其进行了运动学和动力学仿真分析,得到了在给定输入下加泄连接器的仿真 输出曲线.通过分析验证了机构设计的合理性和实用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号