期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于安全强化学习的不确定二阶系统模型参考跟踪控制 被引量:1
1
作者 胡一帆 刘克新 +1 位作者 付俊杰 温广辉 《控制工程》 CSCD 北大核心 2024年第1期80-87,共8页
针对带有不确定性动态的二阶系统模型参考轨迹跟踪控制问题,设计了一种基于鲁棒控制障碍函数的安全强化学习算法。该算法能在学习跟踪控制器的过程中保证系统避障。首先,对具有安全约束的轨迹跟踪控制强化学习问题进行建模。其次,利用... 针对带有不确定性动态的二阶系统模型参考轨迹跟踪控制问题,设计了一种基于鲁棒控制障碍函数的安全强化学习算法。该算法能在学习跟踪控制器的过程中保证系统避障。首先,对具有安全约束的轨迹跟踪控制强化学习问题进行建模。其次,利用高斯过程模型对未知系统动力学的估计,得到鲁棒的避障控制障碍函数条件,在该条件下得到概率意义下的系统安全性保证。最后,提出基于鲁棒控制障碍函数的安全强化学习算法,得到最优模型参考轨迹跟踪控制律。仿真结果验证了所提算法的有效性。 展开更多
关键词 安全强化学习 避障 鲁棒控制障碍函数 不确定系统 跟踪控制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部