期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
改进的HDP算法研究及其在非线性系统中的应用 被引量:2
1
作者 马智慧 苏晓明 +1 位作者 李桂君 田振宇 《控制工程》 CSCD 北大核心 2021年第9期1893-1901,共9页
启发式动态规划算法(HDP)是近似动态规划(ADP)的一种实现方法,它将神经网络、动态规划和强化学习融为一体。然而,现存的启发式动态规划算法需要假设系统的内部动态完全已知,这一条件在实际工程系统中是极其严格的。为了解决这个问题,提... 启发式动态规划算法(HDP)是近似动态规划(ADP)的一种实现方法,它将神经网络、动态规划和强化学习融为一体。然而,现存的启发式动态规划算法需要假设系统的内部动态完全已知,这一条件在实际工程系统中是极其严格的。为了解决这个问题,提出了一种基于迭代步神经网络训练策略的启发式动态规划算法,该算法采用定点训练并且通过依赖于状态的性能指标的导数来求得控制量,评价网络用于近似值函数,而动作网络用于近似最优控制策略,因此该算法允许在不知道系统内部动态的情况下执行启发式动态规划算法。通过一个非线性系统的引例以及球杆系统的控制来验证此算法的有效性。 展开更多
关键词 启发式动态规划 优化控制 性能指标函数 神经网络 非线性球杆系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部