-
题名减少检查点开销的一种方法
被引量:1
- 1
-
-
作者
李凯原
杨孝宗
-
机构
哈尔滨工业大学计算机科学与工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2000年第2期4-5,14,共3页
-
基金
国家自然科学基金!69873013
-
文摘
设置检查点(checkpointing)是容错计算机系统进行故障恢复的重要手段。设置检查点的开销则是影响其性能的一个主要因素。文章提出了一种预先保存部分检查点数据的新方法。该方法不仅能够有效地减少检查点开销,而且具有比较短的检查点延迟。
-
关键词
故障恢复
检查点开销
容错计算机系统
存储器
-
Keywords
fault tolerance, fault recovery, checkpoint overhead, pre-save
-
分类号
TP380.63
[自动化与计算机技术—计算机系统结构]
-
-
题名一种降低并行程序检查点开销的方法
被引量:3
- 2
-
-
作者
周小成
孙凝晖
霍志刚
马捷
-
机构
中国科学院研究生院
中国科学院计算技术研究所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第12期84-86,共3页
-
基金
中国科学院新一代机群关键技术研究基金资助项目(KGCX2-SW-116)
-
文摘
检查点设置和卷回恢复是提高系统可靠性和实现容错计算的有效途径,其性能通常用开销率来评价,而检查点开销是影响开销率的主要因素。针对目前并行程序运行时存在较多通信阻塞时间的现状,该文在写时复制检查点缓存的基础上提出了一种进一步降低检查点开销的方法。通过控制状态保存线程的调度和选择合适的状态保存粒度,该方法能很好地利用通信阻塞时间隐藏状态保存线程运行时带来的开销,从而能进一步降低开销率。
-
关键词
检查点设置和卷回恢复
检查点开销
通信阻塞时间
-
Keywords
Checkpointing and rollback recovery
Checkpoint overhead
Communication blocking time
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名用时间序列分析方法动态确定检查点时间间隔
被引量:2
- 3
-
-
作者
梁蓓
张大方
杨金民
季洁
-
机构
湖南大学计算机与通信学院
-
出处
《系统仿真学报》
CAS
CSCD
2004年第10期2350-2353,共4页
-
基金
国家自然科学基金资助项目(60273070)
-
文摘
设置检查点是容错计算机系统进行故障恢复的重要手段。检查点的开销则是影响其性能的一个主要因素。许多文献已指出检查点开销主要是来自于对进程状态的保存。文章采用时间序列分析的方法对进程状态大小变化情况进行分析和预测,动态选择恰当的检查点时间间隔,减少检查点时需保存的进程状态量,从而减小了检查点的开销。
-
关键词
容错
检查点开销
时间序列分析
进程检查点
-
Keywords
fault tolerance
checkpoint overhead
Time Series Analysis
checkpointing
-
分类号
TP302.08
[自动化与计算机技术—计算机系统结构]
-