摘要
强化学习是一类特殊的机器学习,通过与所在环境的自主交互来学习决策策略,使得策略收到的长期累积奖赏最大.最近,在围棋和电子游戏等领域,强化学习被成功用于取得人类水平的操作能力,受到了广泛关注.本文将对强化学习进行简要介绍,重点介绍基于函数近似的强化学习方法,以及在围棋等领域中的应用.
Reinforcement learning is a particular type of machine learning that autonomously learns from interactions with the environment, so that its long-term reward is maximized. It has recently been successfully applied to playing the game of Go and video games, and human expert level is demonstrated. Since these results are receiving increasing attentions, this paper briefly introduces reinforcement learning, focusing on the methods with function approximation,and its applications in the game of Go.
出处
《自动化学报》
EI
CSCD
北大核心
2016年第5期685-695,共11页
Acta Automatica Sinica
基金
国家自然科学基金(61403208
61375061)
南京邮电大学引进人才科研启动基金(NY214014)资助~~
关键词
强化学习
函数近似
核方法
神经网络
加性模型
深度强化学习
Reinforcement learning
linear function approximation
kernel methods
neural networks
additive model
deep reinforcement learning
作者简介
陈兴国 南京邮电大学计算机学院/软件学院讲师.2014年获得南京大学计算机系博士学位.主要研究方向为机器学习,强化学习.E-mail:chenxg@njupt.edu.cn
俞扬 南京大学计算机系副教授,2011年获得南京大学计算机系博士学位.主要研究方向为机器学习,演化学习,强化学习.本文通信作者.E—mail:yuy@nju.edu.cn