期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
强化学习的模型、算法及应用 被引量:9
1
作者 战忠丽 王强 陈显亭 《电子科技》 2011年第1期47-49,共3页
强化学习不需要具有先验知识,通过试错与环境交互获得策略的改进,具有自学习和在线学习能力,是构造智能体的核心技术之一。文中首先综述了强化学习模型和基本原理,然后介绍了强化学习的主要算法,包括Sarsa算法、TD算法、Q-学习算法及函... 强化学习不需要具有先验知识,通过试错与环境交互获得策略的改进,具有自学习和在线学习能力,是构造智能体的核心技术之一。文中首先综述了强化学习模型和基本原理,然后介绍了强化学习的主要算法,包括Sarsa算法、TD算法、Q-学习算法及函数估计算法,最后介绍了强化学习的应用情况及未来研究方向。 展开更多
关键词 强化学习 Sarsa算法 瞬时差分算法 Q-学习算法 函数估计
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部