期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
Windows NT环境下的进程检查点设置与回卷恢复 被引量:12
1
作者 张悠慧 汪东升 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 2001年第1期50-55,共6页
阐述了 Windows NT环境下应用程序的检查点设置与回卷恢复机制 ,并介绍了设计和实现的检查点设置与恢复工具 Win NTCkpt.Win NTCkpt采用标准 Windows API函数 ,通过代码动态注入和对系统调用进行包裹的方法进行检查点设置与回卷恢复 .... 阐述了 Windows NT环境下应用程序的检查点设置与回卷恢复机制 ,并介绍了设计和实现的检查点设置与恢复工具 Win NTCkpt.Win NTCkpt采用标准 Windows API函数 ,通过代码动态注入和对系统调用进行包裹的方法进行检查点设置与回卷恢复 .与同类工具相比 ,Win NTCkpt具有不需修改应用程序源代码 ,不需对应用程序进行重新编译或连接 ,支持对用户文件内容的检查点设置与回卷恢复的特点 .Win NTCkpt是正在研制开发的高可用性机群计算环境的核心 ,也是在机群环境下实现进程迁移和负载平衡的技术基础 . 展开更多
关键词 WINDOWSNT 检查点设置与回卷恢复 进程迁移 函数包裹
在线阅读 下载PDF
Solaris系统多线程检查点设置与卷回恢复 被引量:2
2
作者 张悠慧 汪东升 郑纬民 《计算机工程与应用》 CSCD 北大核心 2000年第8期45-47,共3页
文章利用UNIX进程检查点设置思想,结合多线程在Solaris系统中的实现特点,提出了一种适合于Solaris操作系统的多线程检查点设置与恢复技术,其检查点设置与恢复技术具有在用户级实现、对用户透明和简单高效的特点。文章主要介绍检查点... 文章利用UNIX进程检查点设置思想,结合多线程在Solaris系统中的实现特点,提出了一种适合于Solaris操作系统的多线程检查点设置与恢复技术,其检查点设置与恢复技术具有在用户级实现、对用户透明和简单高效的特点。文章主要介绍检查点信息的保存与恢复、函数换名、包裹,线程号映射等关键技术。 展开更多
关键词 SOLARIS系统 UNIX 多线和 检查点设置 卷回恢复
在线阅读 下载PDF
日志检查点回卷恢复策略的检查点周期求解模型 被引量:2
3
作者 徐振朋 门朝光 李香 《高技术通讯》 CAS CSCD 北大核心 2011年第6期575-580,共6页
基于Markov链进程状态模型和拉普拉斯变换,提出了一种日志检查点回卷恢复容错策略的最佳检查点周期求解模型,该模型充分考虑了日志检查点回卷恢复策略中进程回卷恢复与正常运行期间执行速度存在的差别,同时允许进程检查点和回卷恢复... 基于Markov链进程状态模型和拉普拉斯变换,提出了一种日志检查点回卷恢复容错策略的最佳检查点周期求解模型,该模型充分考虑了日志检查点回卷恢复策略中进程回卷恢复与正常运行期间执行速度存在的差别,同时允许进程检查点和回卷恢复期间发生故障事件。通过求解进程状态Markov链转移概率和权重,得到完成检查点间隔的期望执行用时,最后通过系统最小容错负载率得出进程的最佳检查点周期。该模型退化后与现有其它求解模型相一致,结果表明该模型能确保相对较低的容错开销。 展开更多
关键词 分布式计算 容错 消息日志 回卷恢复 检查点周期
在线阅读 下载PDF
一种基于检查点的卷回恢复与进程迁移系统 被引量:16
4
作者 汪东升 沈美明 +1 位作者 郑纬民 裴丹 《软件学报》 EI CSCD 北大核心 1999年第1期68-73,共6页
ChaRM是一种并行程序后向故障恢复与进程迁移系统.它不仅实现了对工作站机群系统瞬时故障的恢复,而且通过检查点设置时的Miror存储技术和进程迁移技术,实现了对机群系统结点永久故障的恢复,并支持系统软硬件的在线维护、... ChaRM是一种并行程序后向故障恢复与进程迁移系统.它不仅实现了对工作站机群系统瞬时故障的恢复,而且通过检查点设置时的Miror存储技术和进程迁移技术,实现了对机群系统结点永久故障的恢复,并支持系统软硬件的在线维护、处理机资源的排他/限时使用和动态负载平衡等功能.文章主要介绍ChaRM系统的检查点设置与回卷恢复、进程迁移等实现技术,并给出了部分性能评测结果. 展开更多
关键词 检查点 回卷恢复 进程迁移 计算机网络
在线阅读 下载PDF
WOB:一种新的文件检查点设置策略 被引量:7
5
作者 裴丹 汪东升 +1 位作者 沈美明 郑纬民 《电子学报》 EI CAS CSCD 北大核心 2000年第5期9-12,共4页
实现分布 /并行系统容错的基础是单进程检查点设置和卷回恢复技术 ,而对进程活动文件状态进行保存和恢复则是这种技术的重要方面 .本文提出的延迟写策略 ,实现了对用户文件的检查点设置 ,有效地解决了在发生故障时用户文件内容与进程全... 实现分布 /并行系统容错的基础是单进程检查点设置和卷回恢复技术 ,而对进程活动文件状态进行保存和恢复则是这种技术的重要方面 .本文提出的延迟写策略 ,实现了对用户文件的检查点设置 ,有效地解决了在发生故障时用户文件内容与进程全局状态的不一致问题 .它对用户通明 ,并且通过优化设置内存缓冲区大小、时延隐藏等手段 ,使得这种策略在空间开销、正常运行时间、恢复时间等性能指标上优于其它方法 . 展开更多
关键词 检查点设置 卷回恢复 WOB 文件 容错
在线阅读 下载PDF
Unix进程检查点设置关键技术 被引量:5
6
作者 王春露 汪东升 《计算机工程与应用》 CSCD 北大核心 2002年第1期90-93,136,共5页
Unix进程的检查点设置是实现分布/并行系统容错、重播调试、进程迁移、系统模拟和作业切换等功能的基础。该论文主要论述UNIX进程检查点基本信息的保存与恢复、文件检查点、检查点信息的优化等关键技术,最后介绍Libckpt、Condor以及自... Unix进程的检查点设置是实现分布/并行系统容错、重播调试、进程迁移、系统模拟和作业切换等功能的基础。该论文主要论述UNIX进程检查点基本信息的保存与恢复、文件检查点、检查点信息的优化等关键技术,最后介绍Libckpt、Condor以及自行设计的Libcsm等检查点设置工具。 展开更多
关键词 检查点 文件检查点 回卷恢复
在线阅读 下载PDF
基于PVM的协调检查点设置关键技术 被引量:1
7
作者 王春露 汪东升 《小型微型计算机系统》 CSCD 北大核心 2002年第5期524-528,共5页
本文论述了基于 PVM的并行程序运行回卷恢复系统设计和实现过程中的退出再加入 PVM机制、任务号隐式映射机制、任务结束前同步机制、防止 PVM库重入机制、信号与消息协同触发机制、应用任务初始化机制以及作为前述各机制实现基础的函数... 本文论述了基于 PVM的并行程序运行回卷恢复系统设计和实现过程中的退出再加入 PVM机制、任务号隐式映射机制、任务结束前同步机制、防止 PVM库重入机制、信号与消息协同触发机制、应用任务初始化机制以及作为前述各机制实现基础的函数包裹与换名机制等关键技术 .这些技术已经成功地应用于我们自主开发的 Cha RM系统中 。 展开更多
关键词 检查点设置 卷回恢复 容错 PVM 函数包裹 计算机集群 并行计算机
在线阅读 下载PDF
基于Lustre文件系统的MPI检查点系统实现技术与性能测试 被引量:4
8
作者 谢旻 卢宇彤 +2 位作者 周恩强 曹宏嘉 杨学军 《计算机研究与发展》 EI CSCD 北大核心 2007年第10期1709-1716,共8页
基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1)协同... 基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1)协同协议操作利用了并行应用的近邻通信特性,通过虚连接方法减少协议的处理开销;2)采用Lustre文件系统简化检查点映像文件管理的复杂性;3)通过并行I/O操作提高性能,优化检查点映像的存储过程.实际应用的测试表明,该检查点系统具有较小的运行时间开销和良好的可扩展性. 展开更多
关键词 容错技术 MPICH2 回卷恢复 协同式检查点 LUSTRE文件系统
在线阅读 下载PDF
双机容错系统中最佳检查点间隔的分析 被引量:3
9
作者 鄢喜爱 杨金民 田华 《计算机工程》 CAS CSCD 北大核心 2007年第5期283-284,F0003,共3页
设置检查点是容错计算机系统进行故障恢复的重要手段。因为检查点间隔选择过大或过小都将使系统性能受到影响,所以检查点间隔的适当选定是系统性能优化的一个重要指标。该文针对双机容错系统,采用检查点设置与回卷恢复的方法提出了一种... 设置检查点是容错计算机系统进行故障恢复的重要手段。因为检查点间隔选择过大或过小都将使系统性能受到影响,所以检查点间隔的适当选定是系统性能优化的一个重要指标。该文针对双机容错系统,采用检查点设置与回卷恢复的方法提出了一种系统模型,利用马尔科夫链得到了最佳检查点间隔的求解等式,通过实验证实了求解等式的正确性。 展开更多
关键词 双机容错 回卷恢复 检查点间隔
在线阅读 下载PDF
一种基于虚拟对象的进程检查点实现方法 被引量:1
10
作者 杨金民 张大方 《系统仿真学报》 CAS CSCD 2004年第6期1354-1357,共4页
检查点回卷恢复策略是实现软件容错的一种重要方法。基于虚拟对象策略的进程检查点实现方法把应用层与系统层的直接交互被重定向为应用层与虚拟对象层的交互以及虚拟对象层与系统层的交互。故障恢复时,虚拟对象层重新和系统层捆绑结合,... 检查点回卷恢复策略是实现软件容错的一种重要方法。基于虚拟对象策略的进程检查点实现方法把应用层与系统层的直接交互被重定向为应用层与虚拟对象层的交互以及虚拟对象层与系统层的交互。故障恢复时,虚拟对象层重新和系统层捆绑结合,使得进程环境故障前后的差异性对应用层透明。另外,基于虚拟对象的检查点策略不须要进行对象句柄转换,避免了对象句柄转换所带来的开销。该方法具有开销小的特点,并且支持多线程及线程间的同步。 展开更多
关键词 软件容错 检查点 回卷恢复 进程 虚拟对象
在线阅读 下载PDF
具有O(n)消息复杂度的非阻塞检查点算法①
11
作者 刘国良 陈蜀宇 《高技术通讯》 CAS CSCD 北大核心 2012年第12期1243-1249,共7页
为了用检查点设置及回卷恢复技术提高并行分布式系统容错性能时降低设置检查点的时间和空间开销,提出了一种非阻塞协调检查点算法。与传统的两阶段提交算法不同,该算法是单阶段提交算法,可跳过临时检查点阶段直接获得永久检查点,减... 为了用检查点设置及回卷恢复技术提高并行分布式系统容错性能时降低设置检查点的时间和空间开销,提出了一种非阻塞协调检查点算法。与传统的两阶段提交算法不同,该算法是单阶段提交算法,可跳过临时检查点阶段直接获得永久检查点,减少了同步控制消息的数量,加快了检查点的形成时间。它通过发送进程排除孤儿消息,实现了并行计算;通过设置检查点算法启动周期,解决中途消息问题。该算法的时间复杂度由通常的O(n^2)降低到O(n).只需要n-1个同步消息。 展开更多
关键词 容错 非阻塞检查点 回卷恢复 单阶段提交算法
在线阅读 下载PDF
一种降低并行程序检查点开销的方法 被引量:3
12
作者 周小成 孙凝晖 +1 位作者 霍志刚 马捷 《计算机工程》 CAS CSCD 北大核心 2007年第12期84-86,共3页
检查点设置和卷回恢复是提高系统可靠性和实现容错计算的有效途径,其性能通常用开销率来评价,而检查点开销是影响开销率的主要因素。针对目前并行程序运行时存在较多通信阻塞时间的现状,该文在写时复制检查点缓存的基础上提出了一种进... 检查点设置和卷回恢复是提高系统可靠性和实现容错计算的有效途径,其性能通常用开销率来评价,而检查点开销是影响开销率的主要因素。针对目前并行程序运行时存在较多通信阻塞时间的现状,该文在写时复制检查点缓存的基础上提出了一种进一步降低检查点开销的方法。通过控制状态保存线程的调度和选择合适的状态保存粒度,该方法能很好地利用通信阻塞时间隐藏状态保存线程运行时带来的开销,从而能进一步降低开销率。 展开更多
关键词 检查点设置和卷回恢复 检查点开销 通信阻塞时间
在线阅读 下载PDF
ATC中FDP集群进程检查点的研究与实现
13
作者 殷源 胡术 +2 位作者 宋万忠 骆健 喻德军 《计算机工程与设计》 CSCD 北大核心 2012年第9期3588-3592,共5页
针对空中交通管制系统(ATC)中对飞行数据集群处理的可靠性要求,提出了一种基于Linux的用户级进程检查点设置与恢复方案。对基于该Linux用户级的进程检查点的飞行数据集群处理的各个主要模块进行了介绍,在此基础上给出了系统设计框架。... 针对空中交通管制系统(ATC)中对飞行数据集群处理的可靠性要求,提出了一种基于Linux的用户级进程检查点设置与恢复方案。对基于该Linux用户级的进程检查点的飞行数据集群处理的各个主要模块进行了介绍,在此基础上给出了系统设计框架。从进程的初始化数据段、堆、栈和打开的文件的保存与恢复,给出了该方案的详细实现方法。该进程检查点设置与恢复方案不但可以在主机崩溃重启后恢复进程在重启前的运行状态,更重要的是可以在分布式系统通过进程迁移将保存的进程检查点迁移到其它主机运行,从而有效的提高系统的可靠性,减少运算损失。 展开更多
关键词 飞行数据处理 高可用性 进程检查点 回卷恢复 进程迁移 集群
在线阅读 下载PDF
一种高效的协调式检查点算法
14
作者 刘翠英 高胜法 王慧丽 《计算机工程》 CAS CSCD 北大核心 2011年第23期49-51,共3页
为降低设置检查点的开销,提出一种高效的异步存储非阻塞协调式检查点算法。该算法允许多个进程并发地在进程状态信息量较小时设置检查点,只在稳固存储器空闲时进行异步存储,并可同时进行检查点设置及进程执行。实验结果表明,该算法能降... 为降低设置检查点的开销,提出一种高效的异步存储非阻塞协调式检查点算法。该算法允许多个进程并发地在进程状态信息量较小时设置检查点,只在稳固存储器空闲时进行异步存储,并可同时进行检查点设置及进程执行。实验结果表明,该算法能降低设置检查点的开销,提高系统性能。 展开更多
关键词 分布式系统 容错 检查点算法 非阻塞 回卷恢复
在线阅读 下载PDF
一种可靠高效的回卷恢复实现方法 被引量:5
15
作者 杨金民 张大方 黎文伟 《电子学报》 EI CAS CSCD 北大核心 2006年第2期237-240,共4页
本文针对现有用户级进程检查点实现中的线程挂起点不确定性问题提出一种基于线程自挂的解决方案.另外,为了降低分布式回卷恢复开销,本文提出一个多线程化的回卷恢复实现基架.基于所提回卷恢复策略,开发了一个回卷恢复试验床W INDAR.试... 本文针对现有用户级进程检查点实现中的线程挂起点不确定性问题提出一种基于线程自挂的解决方案.另外,为了降低分布式回卷恢复开销,本文提出一个多线程化的回卷恢复实现基架.基于所提回卷恢复策略,开发了一个回卷恢复试验床W INDAR.试验结果表明,多线程化实现策略能够显著提高悲观消息日志协议性能. 展开更多
关键词 检查点 进程状态 回卷恢复 多线程
在线阅读 下载PDF
基于回卷恢复的容错硬实时系统可调度性分析 被引量:1
16
作者 丁万夫 郭锐锋 +2 位作者 赵进 刘娴 李杰 《系统工程与电子技术》 EI CSCD 北大核心 2011年第7期1673-1679,共7页
在硬实时系统中,由于任务超时完成将会导致灾难性后果,因此硬实时系统必须具有实时性和可靠性保障。为了提高硬实时系统的容错能力,基于回卷恢复模型提出了允许容错优先级提升的分配策略。为了获得系统中容错优先级分配的最佳策略,基于... 在硬实时系统中,由于任务超时完成将会导致灾难性后果,因此硬实时系统必须具有实时性和可靠性保障。为了提高硬实时系统的容错能力,基于回卷恢复模型提出了允许容错优先级提升的分配策略。为了获得系统中容错优先级分配的最佳策略,基于任务最坏响应时间的可调度性分析,提出了一种最优的容错优先级配置搜索算法(fault-tolerant priority configuration search algorithm,FTPCSA)。该算法能够将搜索空间由O(n!)减少到O(n2)。最后给出了该算法的最优性证明。经过深入分析和实验证明,允许容错优先级提升的分配策略能够在容错优先级继承策略的基础上,进一步提高系统的容错能力。 展开更多
关键词 回卷恢复 硬实时系统 可调度性分析 检查点
在线阅读 下载PDF
基于故障敏感图的回卷算法和故障恢复 被引量:1
17
作者 柳颖 陈道蓄 +1 位作者 谢立 曹建农 《软件学报》 EI CSCD 北大核心 2000年第2期235-239,共5页
扩充的面向图结构的分布式程序设计模型 (extended graph- oriented model,简称 Ex GOM)提供了一个支持动态配置的系统框架 .系统的动态配置包括系统运行时的伸缩、运行时的升级以及出现故障后的重配置 .故障后的重配置所涉及的问题之... 扩充的面向图结构的分布式程序设计模型 (extended graph- oriented model,简称 Ex GOM)提供了一个支持动态配置的系统框架 .系统的动态配置包括系统运行时的伸缩、运行时的升级以及出现故障后的重配置 .故障后的重配置所涉及的问题之一是如何恢复系统原状态 ,该文着重就此问题进行了讨论 ,给出了基于故障敏感图的异步检查点回卷算法和故障恢复策略 .该算法和策略考虑了在暂时性主机故障中单个主机上有多个故障进程的情况 .与其他异步回卷及故障恢复算法相比 ,该算法将故障区域局部化 ,仅对故障敏感节点进行回卷 ,从而有效地降低了系统开销 . 展开更多
关键词 分布式程序设计 检查点 回卷 故障恢复
在线阅读 下载PDF
基于并发性发掘的低开销回卷恢复实现方法
18
作者 袁功彪 杨金民 白树仁 《计算机工程》 CAS CSCD 2013年第11期46-51,共6页
现有的回卷恢复容错技术存在同步约束和阻塞问题,其时间开销随系统节点规模的增大而剧增。为此,提出一种基于并发性发掘的低开销回卷恢复实现方法。利用消息传递附带跟踪消息依赖的策略解除消息日志中的同步约束,解析进程负载以发掘进... 现有的回卷恢复容错技术存在同步约束和阻塞问题,其时间开销随系统节点规模的增大而剧增。为此,提出一种基于并发性发掘的低开销回卷恢复实现方法。利用消息传递附带跟踪消息依赖的策略解除消息日志中的同步约束,解析进程负载以发掘进程负载的并发性,构建进程负载并发执行的实现架构,采用数据缓存策略和多线程技术实现进程内部各负载的并发执行,以降低故障恢复开销。3个NAS NPB2.3标准性能检测程序的实验结果表明,该方法可使检查点开销从0.63 s、3.19 s、1.21 s分别降低到0.18 s、0.67 s、0.19 s,日志开销率从13.4%、3.5%、18.3%分别降低到0.7%、0.1%、1.0%。 展开更多
关键词 回卷恢复 时间开销 同步约束 并发性挖掘 消息日志 检查点
在线阅读 下载PDF
支持构件迁移的分布式系统容错算法 被引量:1
19
作者 王勇 王忠群 +1 位作者 刘涛 吴小兰 《计算机工程与设计》 CSCD 北大核心 2007年第15期3566-3568,3730,共4页
随着分布式应用技术的发展,构件的静态性限制了分布式系统在运行期间适应其可用资源变化的要求。为了动态适应系统可用资源,提高系统性能,支持构件可迁移的分布式应用研究受到广泛关注。针对提高构件可迁移分布式应用的可靠性,提出一种... 随着分布式应用技术的发展,构件的静态性限制了分布式系统在运行期间适应其可用资源变化的要求。为了动态适应系统可用资源,提高系统性能,支持构件可迁移的分布式应用研究受到广泛关注。针对提高构件可迁移分布式应用的可靠性,提出一种分布式系统容错算法。在准同步检查点算法的基础上,通过引入shadow-chain和通讯录机制,实现了构件间通信的可靠性和构件重定位的透明性,从而使得系统能够在较低代价下设置检查点,并能将出错后的系统回卷到一致性状态。 展开更多
关键词 分布式系统 可迁移构件 检查点 回卷恢复 容错
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部