期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Q-学习的非线性控制
1
作者 杨东 殷苌茗 +1 位作者 陈焕文 吴柏森 《长沙电力学院学报(自然科学版)》 2003年第1期35-38,共4页
给出了一种新的激励学习(RL)方法,它能够有效地解决一个状态与动作空间为连续的非线性控制问题.在实际的应用中,离散的RL方法能把许多非线性控制问题分解成几个局部线性控制作业.提供了一种由简单的线性控制器和Q-学习构成的层次性RL算... 给出了一种新的激励学习(RL)方法,它能够有效地解决一个状态与动作空间为连续的非线性控制问题.在实际的应用中,离散的RL方法能把许多非线性控制问题分解成几个局部线性控制作业.提供了一种由简单的线性控制器和Q-学习构成的层次性RL算法.连续状态 动作空间被形象地分成为一些格子,并且每个格子都有它自己的局部线性控制器.状态空间的隔离是处理维数问题的一种相当简单的方法,但是经常会引起非Markov效果,而局部线性控制器能弥补这个缺陷. 展开更多
关键词 激励学习(rl) 马尔科夫决策过程(MDP) Q-学习 非线性控制 局部线性控制器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部