期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
元强化学习在AUV多任务快速自适应控制的应用
1
作者 徐春晖 杨士霖 +1 位作者 徐德胜 方田 《舰船科学技术》 北大核心 2025年第5期89-96,共8页
为解决基于深度强化学习的AUV跟踪控制器在面临新任务时需从零开始训练、训练速度慢、稳定性差等问题,设计一种基于元强化学习的AUV多任务快速自适应控制算法——R-SAC(Reptile-Soft Actor Critic)算法。R-SAC算法将元学习与强化学习相... 为解决基于深度强化学习的AUV跟踪控制器在面临新任务时需从零开始训练、训练速度慢、稳定性差等问题,设计一种基于元强化学习的AUV多任务快速自适应控制算法——R-SAC(Reptile-Soft Actor Critic)算法。R-SAC算法将元学习与强化学习相结合,结合水下机器人运动学及动力学方程对跟踪任务进行建模,利用RSAC算法在训练阶段为AUV跟踪控制器获得一组最优初始值模型参数,使模型在面临不同的任务时,基于该组参数进行训练时能够快速收敛,实现快速自适应不同任务。仿真结果表明,所提出的方法与随机初始化强化学习控制器相比,收敛速度最低提高了1.6倍,跟踪误差保持在2.8%以内。 展开更多
关键词 AUV 元强化学习 最优初始值模型参数 快速收敛
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部