期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
WOB:一种新的文件检查点设置策略 被引量:7
1
作者 裴丹 汪东升 +1 位作者 沈美明 郑纬民 《电子学报》 EI CAS CSCD 北大核心 2000年第5期9-12,共4页
实现分布 /并行系统容错的基础是单进程检查点设置和卷回恢复技术 ,而对进程活动文件状态进行保存和恢复则是这种技术的重要方面 .本文提出的延迟写策略 ,实现了对用户文件的检查点设置 ,有效地解决了在发生故障时用户文件内容与进程全... 实现分布 /并行系统容错的基础是单进程检查点设置和卷回恢复技术 ,而对进程活动文件状态进行保存和恢复则是这种技术的重要方面 .本文提出的延迟写策略 ,实现了对用户文件的检查点设置 ,有效地解决了在发生故障时用户文件内容与进程全局状态的不一致问题 .它对用户通明 ,并且通过优化设置内存缓冲区大小、时延隐藏等手段 ,使得这种策略在空间开销、正常运行时间、恢复时间等性能指标上优于其它方法 . 展开更多
关键词 检查点设置 卷回恢复 WOB 文件 容错
在线阅读 下载PDF
Windows NT环境下的进程检查点设置与回卷恢复 被引量:12
2
作者 张悠慧 汪东升 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 2001年第1期50-55,共6页
阐述了 Windows NT环境下应用程序的检查点设置与回卷恢复机制 ,并介绍了设计和实现的检查点设置与恢复工具 Win NTCkpt.Win NTCkpt采用标准 Windows API函数 ,通过代码动态注入和对系统调用进行包裹的方法进行检查点设置与回卷恢复 .... 阐述了 Windows NT环境下应用程序的检查点设置与回卷恢复机制 ,并介绍了设计和实现的检查点设置与恢复工具 Win NTCkpt.Win NTCkpt采用标准 Windows API函数 ,通过代码动态注入和对系统调用进行包裹的方法进行检查点设置与回卷恢复 .与同类工具相比 ,Win NTCkpt具有不需修改应用程序源代码 ,不需对应用程序进行重新编译或连接 ,支持对用户文件内容的检查点设置与回卷恢复的特点 .Win NTCkpt是正在研制开发的高可用性机群计算环境的核心 ,也是在机群环境下实现进程迁移和负载平衡的技术基础 . 展开更多
关键词 WINDOWSNT 检查点设置与回卷恢复 进程迁移 函数包裹
在线阅读 下载PDF
具有O(n)消息复杂度的协调检查点设置算法 被引量:17
3
作者 汪东升 邵明珑 《软件学报》 EI CSCD 北大核心 2003年第1期43-48,共6页
协调检查点设置及回卷恢复技术作为一种有效的容错手段,已广泛地运用在集群等并行/分布计算机系统中.为了进一步降低协调检查点设置的时间和空间开销,提出了一种基于消息计数的协调检查点设置算法.该算法无须对底层消息通道的FIFO特性... 协调检查点设置及回卷恢复技术作为一种有效的容错手段,已广泛地运用在集群等并行/分布计算机系统中.为了进一步降低协调检查点设置的时间和空间开销,提出了一种基于消息计数的协调检查点设置算法.该算法无须对底层消息通道的FIFO特性进行假设,并使同步阶段引入的控制消息复杂度由通常的O(n2)降低到O(n),有效地提高了系统的效率和扩展性. 展开更多
关键词 O(n)消息复杂度 协调检查点设置算法 消息计数 算法分析 计算机
在线阅读 下载PDF
Solaris系统多线程检查点设置与卷回恢复 被引量:2
4
作者 张悠慧 汪东升 郑纬民 《计算机工程与应用》 CSCD 北大核心 2000年第8期45-47,共3页
文章利用UNIX进程检查点设置思想,结合多线程在Solaris系统中的实现特点,提出了一种适合于Solaris操作系统的多线程检查点设置与恢复技术,其检查点设置与恢复技术具有在用户级实现、对用户透明和简单高效的特点。文章主要介绍检查点... 文章利用UNIX进程检查点设置思想,结合多线程在Solaris系统中的实现特点,提出了一种适合于Solaris操作系统的多线程检查点设置与恢复技术,其检查点设置与恢复技术具有在用户级实现、对用户透明和简单高效的特点。文章主要介绍检查点信息的保存与恢复、函数换名、包裹,线程号映射等关键技术。 展开更多
关键词 SOLARIS系统 UNIX 多线和 检查点设置 卷回恢复
在线阅读 下载PDF
基于PVM的协调检查点设置关键技术 被引量:1
5
作者 王春露 汪东升 《小型微型计算机系统》 CSCD 北大核心 2002年第5期524-528,共5页
本文论述了基于 PVM的并行程序运行回卷恢复系统设计和实现过程中的退出再加入 PVM机制、任务号隐式映射机制、任务结束前同步机制、防止 PVM库重入机制、信号与消息协同触发机制、应用任务初始化机制以及作为前述各机制实现基础的函数... 本文论述了基于 PVM的并行程序运行回卷恢复系统设计和实现过程中的退出再加入 PVM机制、任务号隐式映射机制、任务结束前同步机制、防止 PVM库重入机制、信号与消息协同触发机制、应用任务初始化机制以及作为前述各机制实现基础的函数包裹与换名机制等关键技术 .这些技术已经成功地应用于我们自主开发的 Cha RM系统中 。 展开更多
关键词 检查点设置 卷回恢复 容错 PVM 函数包裹 计算机集群 并行计算机
在线阅读 下载PDF
基于虚拟文件操作的文件检查点设置 被引量:3
6
作者 刘少锋 汪东升 朱晶 《软件学报》 EI CSCD 北大核心 2002年第8期1528-1533,共6页
实现分布/并行系统容错的基础是单进程检查点设置和卷回恢复技术,而对活动文件信息进行保存和恢复则是这种技术的重要方面.提出一种虚拟文件操作策略,实现了对用户文件的检查点设置,有效地解决了发生故障时用户文件内容与进程全局状态... 实现分布/并行系统容错的基础是单进程检查点设置和卷回恢复技术,而对活动文件信息进行保存和恢复则是这种技术的重要方面.提出一种虚拟文件操作策略,实现了对用户文件的检查点设置,有效地解决了发生故障时用户文件内容与进程全局状态的不一致的问题.该方法通过文件块式管理、检查点分布操作等技术,使得在空间开销、正常运行时间、恢复时间等性能指标上优于其他方法,并且具有对用户透明、可最大限度地保留已完成工作的特点. 展开更多
关键词 虚拟文件操作 文件检查点设置 文件集 磁盘文件 进程 操作系统
在线阅读 下载PDF
实时交互进程的并发检查点技术
7
作者 廖剑伟 李莉 +1 位作者 陈善雄 余建桥 《电子科技大学学报》 EI CAS CSCD 北大核心 2011年第4期573-576,共4页
提出了一种并发检查点技术,允许进程在设置检查点的同时尽可能保持继续执行。在拷贝进程地址空间(设置检查点的步骤之一)的同时,阻塞页面写操作并拷贝该原始页面到指定缓冲区,达到不需要在拷贝进程空间的同时停止该被设置检查点进程,最... 提出了一种并发检查点技术,允许进程在设置检查点的同时尽可能保持继续执行。在拷贝进程地址空间(设置检查点的步骤之一)的同时,阻塞页面写操作并拷贝该原始页面到指定缓冲区,达到不需要在拷贝进程空间的同时停止该被设置检查点进程,最后结合缓冲区中拷贝页面,得到具有一致性的进程状态的映像文件。实验结果表明,可以减少20%~70%被检查进程的停止时间,使得检查点的设置与进程的执行具有一定的并发性。减少被检查进程在设置检查点时的停止时间,适合实时性和交互性要求较高的进程设置检查点。 展开更多
关键词 设置检查点 并发性 实时交互进程
在线阅读 下载PDF
改进的检查点间隔动态设置算法
8
作者 陈鸿 黎忠文 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第z1期54-60,共7页
设置检查点是一种常用的容错技术.带有检查点系统的额外开销包括检查点的比较和保存开销,以及由错误造成的重新执行的开销.对双机冗余模式下的附加检查点进行分析得到了使平均执行时间最小的检查点个数的计算方法,进而提出了改进的检查... 设置检查点是一种常用的容错技术.带有检查点系统的额外开销包括检查点的比较和保存开销,以及由错误造成的重新执行的开销.对双机冗余模式下的附加检查点进行分析得到了使平均执行时间最小的检查点个数的计算方法,进而提出了改进的检查点间隔动态设置算法.仿真结果表明与原算法相比,该算法明显提高了任务在错误出现的情况下按时完成的概率. 展开更多
关键词 检查点间隔设置 双机冗余 任务复制
在线阅读 下载PDF
一种降低并行程序检查点开销的方法 被引量:3
9
作者 周小成 孙凝晖 +1 位作者 霍志刚 马捷 《计算机工程》 CAS CSCD 北大核心 2007年第12期84-86,共3页
检查点设置和卷回恢复是提高系统可靠性和实现容错计算的有效途径,其性能通常用开销率来评价,而检查点开销是影响开销率的主要因素。针对目前并行程序运行时存在较多通信阻塞时间的现状,该文在写时复制检查点缓存的基础上提出了一种进... 检查点设置和卷回恢复是提高系统可靠性和实现容错计算的有效途径,其性能通常用开销率来评价,而检查点开销是影响开销率的主要因素。针对目前并行程序运行时存在较多通信阻塞时间的现状,该文在写时复制检查点缓存的基础上提出了一种进一步降低检查点开销的方法。通过控制状态保存线程的调度和选择合适的状态保存粒度,该方法能很好地利用通信阻塞时间隐藏状态保存线程运行时带来的开销,从而能进一步降低开销率。 展开更多
关键词 检查点设置和卷回恢复 检查点开销 通信阻塞时间
在线阅读 下载PDF
静态分析面向异构系统的应用级Checkpoint设置问题 被引量:2
10
作者 贾佳 杨学军 马亚青 《软件学报》 EI CSCD 北大核心 2013年第6期1361-1375,共15页
应用级checkpointing是一种在大规模科学计算领域中备受关注的容错技术,该技术由用户程序员选择在适当的地方保存关键数据,从而降低了容错开销.选择合适的checkpointing位置、减小全局checkpoint保存数据量是优化应用级checkpointing技... 应用级checkpointing是一种在大规模科学计算领域中备受关注的容错技术,该技术由用户程序员选择在适当的地方保存关键数据,从而降低了容错开销.选择合适的checkpointing位置、减小全局checkpoint保存数据量是优化应用级checkpointing技术的关键问题.对于近年来推出的带有通用GPU的异构系统上的应用级checkpointing技术,也同样面临上述问题.针对异构系统体系结构和程序特征,对面向异构系统的应用级checkpointing技术的检查点设置进行了静态分析,提出两套不同机制的检查点设置方法:同步及异步检查点设置方法,并分别就checkpointing优化设置问题对其进行数学建模和求解.最后,通过实验验证并评估了所提出的两种方法的性能. 展开更多
关键词 应用级checkpointing 异构系统 通用GPU 同步检查点设置 异步检查点设置
在线阅读 下载PDF
嵌入式实时系统容错集成技术的研究 被引量:1
11
作者 黎忠文 《计算机科学》 CSCD 北大核心 2006年第5期277-281,共5页
本文提出了一种用于嵌入式实时系统的集成检查点回卷、任务重复和 DVS 的容错方法。该方法支待处理器速度的在线调整,并根据系统的特点,分别插入额外的 SCP 或 CCP 点,有效使用检查点的存贮和比较功能,减少任务的执行时间,提高系统性能... 本文提出了一种用于嵌入式实时系统的集成检查点回卷、任务重复和 DVS 的容错方法。该方法支待处理器速度的在线调整,并根据系统的特点,分别插入额外的 SCP 或 CCP 点,有效使用检查点的存贮和比较功能,减少任务的执行时间,提高系统性能。通过概率原理导出了该方法任务的平均执行时间。仿真结果表明在 DMR 系统上,与原有的方法相比,所提出的方法明显减少了任务的平均执行时间。在此基础上,进一步提出了可适配处理器速度的算法,在减少任务执行时间的同时又节约系统能源。本文研究成果也可用于其它任务重复系统,如 TMR-F、DMR-F-1和 RFCS 等。 展开更多
关键词 设置检查点 任务重复 DMR DVS SCP CCP CSCP 嵌入式实时系统 容错集成技术
在线阅读 下载PDF
异构系统的异步应用级Checkpointing技术
12
作者 贾佳 《计算机工程与科学》 CSCD 北大核心 2011年第11期54-59,共6页
应用级checkpointing技术是同构系统上最为常用和成熟的容错技术,但在异构系统下的应用还处于起步阶段,还没有一套严谨合理的针对异构系统架构和故障模型特点的实现方案和配置方法。针对这一现况,本文基于CUDA异构系统的体系结构和编程... 应用级checkpointing技术是同构系统上最为常用和成熟的容错技术,但在异构系统下的应用还处于起步阶段,还没有一套严谨合理的针对异构系统架构和故障模型特点的实现方案和配置方法。针对这一现况,本文基于CUDA异构系统的体系结构和编程模型,对CUDA程序在CPU和GPU上的执行模式进行分析,提出了一种面向异构系统应用级checkpointing技术的异步执行机制,并基于这一机制对异构系统的检查点优化设置问题进行讨论,设计了一套优化方案。最后在CUDA平台下通过三个实例验证了这一技术的可行性和实用性,并进行了性能评估。结果表明,这种面向CPU-GPU的异构系统的应用级checkpointing异步执行机制是行之有效的,相比CPU-GPU同步执行的checkpointing机制在设置上更为灵活,优化空间更大。而本文基于这一机制所提出的检查点优化设置方法也有效地减少了check-pointing的开销,从而获得了更高的容错性能。 展开更多
关键词 应用级checkpointing技术 异构系统 异步执行机制 检查点最优化设置
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部