共查询到17条相似文献,搜索用时 62 毫秒
1.
文中设计了一种容错系统,该系统是建立在应用程序层之下、操作系统层之上位置结构的中间件。系统由三模冗余与其之间的通信链路组成系统的硬件结构以及由故障检测模块(对节点的检测和对应用程序的检测)、故障处理模块所组成的软件部分构成。基于VxWorks实时操作系统,设计了一种高可用的容错中间件系统,分析了系统的组成原理,给出了基于心跳检测的故障检测机制和N版本编程方法进行故障检测,以及前向和后向任务恢复方法进行故障恢复,并实现了原型系统。试验表明:给出的容错中间件系统具备了基本的容错能力,可有效提高系统的可用性和可靠性。 相似文献
2.
文中设计了一种容错系统,该系统是建立在应用程序层之下、操作系统层之上位置结构的中间件.系统由三模冗余与其之间的通信链路组成系统的硬件结构以及由故障检测模块(对节点的检测和对应用程序的检测)、故障处理模块所组成的软件部分构成.基于 VxWorks 实时操作系统,设计了一种高可用的容错中间件系统,分析了系统的组成原理,给出了基于心跳检测的故障检测机制和 N 版本编程方法进行故障检测,以及前向和后向任务恢复方法进行故障恢复,并实现了原型系统.试验表明:给出的容错中间件系统具备了基本的容错能力,可有效提高系统的可用性和可靠性 相似文献
3.
为了保证诸任务对临界critical资源resource的互斥访问,VxWorks提供了任务同步机制。二进制信号量是VxWorks系统中实现任务同步的一种重要手段,它保证了任务在并发时结果的一致性。简要介绍二进制信号量,阐述用二进制信号量解决任务互斥和同步的方法,并给出二进制信号量应用在某数据采集系统中的程序框架。某数据采集系统中有效地利用了VxWorks的信号量机制,实现了8个接收通道的数据采集、数据存储以及数据查询等任务对缓冲区的共享。 相似文献
4.
在任务运行过程中,会出现一些异常的情况,导致任务不能正常运行或者对操作系统造成影响。一般来说,这些异常是由程序的逻辑错误造成的,防止这些异常情况的出现和出现后进行补救就有格外重要的意义。1代码重入与共享在应用中,可能会出现多个任务调用同一段代码的情况,由于任务占用CPU是串行的,不会出现代码资源使用冲突。但是,不同优先级的任务同时调用同一段代码,则可能出现低优先级任务执行某一函数时被执行该函数的高优先级任务打断的情况,如果函数中要改写全局变量而没有使用互斥,就有可能导致错误的存取。例如在中断中调用内存分配或… 相似文献
5.
基于VxWorks的系统故障快速恢复设计 总被引:2,自引:0,他引:2
针对CDMA通讯系统基站侧的重要单板——基带信号处理单板的系统故障需要在极短时间内进行自恢复的要求,设计了一种基于VxWorks操作系统的故障快速恢复方法,包括操作系统的任务、消息队列、信号量等操作设计,同时对设计前后系统故障恢复情况进行了对比测试、验证。 相似文献
6.
检查点机制在现代并行分布式计算中有着重要的应用。本文介绍了一种基于Linux的检查点系统的设计和实现方法,它对系统容错、进程迁移和动态负载平衡的研究都具有重要的意义。 相似文献
7.
8.
傅欣 《电脑编程技巧与维护》2010,(2):116-116,119
永久故障恢复机制是焦点问题,提出进程拷贝(Process Copy)的思想。通过修改和扩展Linux内核功能,在操作系统级实现了进程拷贝机制,并应用该机制实现了永久故障的恢复。 相似文献
9.
VxWorks嵌入式实时系统任务机制的研究 总被引:4,自引:0,他引:4
本文对VxWorks的任务机制进行了较为深入的研究,阐述了其任务调度、任务间通信机制,并讨论了如何选择合适机制的方法。 相似文献
10.
为了保证诸任务对临界critical资源resource的互斥访问,VxWorks提供了任务同步机制.二进制信号量是Vx-Worlsks系统中实现任务同步的一种重要手段,它保证了任务在并发时结果的一致性.简要介绍二进制信号量,阐述用二进制信号量解决任务互斥和同步的方法,并给出二进制信号量应用在某数据采集系统中的程序框架.某数据采集系统中有效地利用了VxWorks的信号量机制,实现了8个接收通道的数据采集、数据存储以及数据查询等任务对缓冲区的共享. 相似文献
11.
12.
13.
14.
动态电压频率缩放(DVFS)技术是当前最有效的功耗调节手段之一.本文首先分析现有DVFS技术存在的不足,指出限制DVFS技术高效运用的核心因素;基于现有低效的方式我们提出一种基于任务行为分析的DVFS机制(TC-DVFS).其具有三个层次:一、采集任务的系统调用信息;二、识别任务的关键系统调用,并以关键系统调用刻画任务行为;三、根据任务行为构建特征库,并以任务的特征库来指导DVFS.我们将TC-DVFS添加到linux内核中,并在intel-core2处理器平台上对不同类型的应用任务进行性能与功耗测试.结果显示TC-DVFS总体获得10%的性能提升,并降低5%调频失效率和5%的系统能耗. 相似文献
15.
Chtepen M. Claeys F.H.A. Dhoedt B. De Turck F. Demeester P. Vanrolleghem P.A. 《Parallel and Distributed Systems, IEEE Transactions on》2009,20(2):180-190
A grid is a distributed computational and storage environment often composed of heterogeneous autonomously managed subsystems. As a result, varying resource availability becomes commonplace, often resulting in loss and delay of executing jobs. To ensure good grid performance, fault tolerance should be taken into account. Commonly utilized techniques for providing fault tolerance in distributed systems are periodic job checkpointing and replication. While very robust, both techniques can delay job execution if inappropriate checkpointing intervals and replica numbers are chosen. This paper introduces several heuristics that dynamically adapt the above mentioned parameters based on information on grid status to provide high job throughput in the presence of failure while reducing the system overhead. Furthermore, a novel fault-tolerant algorithm combining checkpointing and replication is presented. The proposed methods are evaluated in a newly developed grid simulation environment dynamic scheduling in distributed environments (DSiDE), which allows for easy modeling of dynamic system and job behavior. Simulations are run employing workload and system parameters derived from logs that were collected from several large-scale parallel production systems. Experiments have shown that adaptive approaches can considerably improve system performance, while the preference for one of the solutions depends on particular system characteristics, such as load, job submission patterns, and failure frequency. 相似文献
16.
作为系统重要属性之一的弹性受到越来越多的关注,而系统在受损后的规定时间内应当尽量多的恢复关键任务,所以相应的恢复策略的制定以及能够恢复到什么程度对系统的弹性来说是十分重要的.针对这种情况,文章提出一种新的考虑时间以及任务重要度等因素的适应度函数,利用遗传算法求解规定时间内系统恢复任务重要度的最大值,获得模型的满意解.仿真算例中,通过对比表明应用此算法的系统拥有更高的弹性恢复能力,证明了该模型和算法的有效性. 相似文献