期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于强化学习的两时间尺度系统最优跟踪控制
1
作者 邓武丹 李庆奎 《仪表技术与传感器》 CSCD 北大核心 2024年第9期92-98,共7页
针对两时间尺度系统的最优跟踪控制问题,提出了一种基于奇异摄动理论与强化学习技术的方法。首先,通过研究奇异摄动理论,将系统分解为快和慢2个子系统,解决了系统存在的奇异摄动参数问题。其次,将系统的跟踪问题分解为慢子系统的线性二... 针对两时间尺度系统的最优跟踪控制问题,提出了一种基于奇异摄动理论与强化学习技术的方法。首先,通过研究奇异摄动理论,将系统分解为快和慢2个子系统,解决了系统存在的奇异摄动参数问题。其次,将系统的跟踪问题分解为慢子系统的线性二次型跟踪(linear quadratic tracking,LQT)问题和快子系统的线性二次型调节(linear quadratic regulator,LQR)问题,进而利用策略Q-学习分别为2个子系统设计控制器求解算法。仿真结果表明所提方法能实现系统的最优跟踪性能。 展开更多
关键词 两时间尺度系统 奇异摄动 Q-学习 最优跟踪控制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部