-
题名网格计算中一种在线分布式容错作业调度算法
被引量:5
- 1
-
-
作者
王宁
张聪沛
-
机构
黄河水利职业技术学院
河南大学
-
出处
《电子测量与仪器学报》
CSCD
北大核心
2018年第3期135-141,共7页
-
基金
河南省科技攻关项目(172102210385)
河南省高等学校重点科研项目(15A520023)
+1 种基金
河南省教育厅人文社科项目(2017-ZZJH-340)
开封市科技攻关计划项目(1703002)资助
-
文摘
针对网格计算环境中可能出现各种故障的问题,提出了一种在线分布式容错作业调度算法,算法由2个主要算法模块构成,即作业调度和副本放置算法模块以及副本管理算法模块。一方面,前者基于作业副本思想即每个副本在不同的站点被独立调度,因而可以把这些未被充分利用的闲置资源用来运行作业副本,以使至少有一个副本会成功完成;另一方面,后者使得运行一个作业副本的每个远程单独资源管理器(SRM)将在每个监控间隔把作业副本的状态通知给原始SRM(PSRM),PSRM定期检查应用状态表,然后查询全部远程SRM来获得计算机器和网络状态,完成对站点内运行的任何作业副本的健康情况的监控,从而实现容错功能。实验结果表明,在线分布式容错作业调度算法相比于其他的网格容错调度算法和非容错调度算法,在各种情形的故障率下,都能取得较好的作业平均响应时间。
-
关键词
网格计算环境
调度算法
容错性
故障率
作业平均响应时间
-
Keywords
grid computing environment
scheduling algorithm
fault-tolerance
failure rate
job average response time
-
分类号
TP393.02
[自动化与计算机技术—计算机应用技术]
-