-
题名分层强化学习综述
被引量:17
- 1
-
-
作者
赖俊
魏竞毅
陈希亮
-
机构
陆军工程大学指挥控制工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第3期72-79,共8页
-
基金
国家自然科学基金(61806221)。
-
文摘
近年来强化学习愈发体现其强大的学习能力,2017年AlphaGo在围棋上击败世界冠军,同时在复杂竞技游戏星际争霸2和DOTA2中人类的顶尖战队也败于AI之手,但其自身又存在着自身的弱点,在不断的发展中瓶颈逐渐出现。分层强化学习因为能够解决其维数灾难问题,使得其在环境更为复杂,动作空间更大的环境中表现出更加优异的处理能力,对其的研究在近几年不断升温。对强化学习的基本理论进行简要介绍,对Option、HAMs、MAXQ这3种经典分层强化学习算法进行介绍,之后对近几年在分层的思想下提出的分层强化学习算法从3个方面进行综述,并对其进行分析,讨论了分层强化学习的发展前景和挑战。
-
关键词
分层强化学习
子策略共享
多层分层结构
自动分层
-
Keywords
hierarchical reinforcement learning
subpolicy sharing
multi-layer hierarchical structure
automatic stratification
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-