-
题名基于深度强化学习的电子政务云动态化任务调度方法
被引量:2
- 1
-
-
作者
龙宇杰
修熙
黄庆
黄晓勉
李莹
吴维刚
-
机构
中山大学计算机学院
广州市数字政府运营中心
广东亿迅科技有限公司
广州市品高软件股份有限公司
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第6期1797-1802,共6页
-
文摘
电子政务云中心的任务调度一直是个复杂的问题。大多数现有的任务调度方法依赖于专家知识,通用性不强,无法处理动态的云环境,通常会导致云中心的资源利用率降低和服务质量下降,任务的完工时间变长。为此,提出了一种基于演员评论家(actor-critic,A2C)算法的深度强化学习调度方法。首先,actor网络参数化策略根据当前系统状态选择调度动作,同时critic网络对当前系统状态给出评分;然后,使用梯度上升的方式来更新actor策略网络,其中使用了critic网络的评分来计算动作的优劣;最后,使用了两个真实的业务数据集进行模拟实验。结果显示,与经典的策略梯度算法以及五个启发式任务调度方法相比,该方法可以提高云数据中心的资源利用率并缩短离线任务的完工时间,能更好地适应动态的电子政务云环境。
-
关键词
电子政务
云计算
任务调度
深度强化学习
演员评论家算法
-
Keywords
e-government
cloud computing
task scheduling
deep reinforcement learning
actor-critic
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-