期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于事后筛选经验回放的机器人深度强化学习跟踪控制
1
作者 易佳豪 王福杰 +2 位作者 胡锦涛 李醒 罗俊轩 《计算机应用研究》 北大核心 2025年第3期834-839,共6页
针对机械臂轨迹跟踪问题,提出了一种结合事后筛选经验回放(selective hindsight experience replay,SHER)的深度强化学习(deep reinforcement learning,DRL)控制方法。此算法将SHER与深度确定性策略(deep deterministic policy gradient... 针对机械臂轨迹跟踪问题,提出了一种结合事后筛选经验回放(selective hindsight experience replay,SHER)的深度强化学习(deep reinforcement learning,DRL)控制方法。此算法将SHER与深度确定性策略(deep deterministic policy gradient,DDPG)结合进行机械臂的轨迹跟踪控制。SHER算法将智能体探索的经验进行随机抽取,然后筛选有用经验修改奖励函数,通过提高对正确动作的奖励评分加强对智能体正确动作的正反馈强度从而提高智能体探索效率。为了验证方法的有效性,通过欧拉-拉格朗日建模二自由度机械臂并在具有干扰的复杂环境下进行仿真实验对比。实验结果表明,所提算法在机械臂轨迹跟踪任务中收敛速度以及收敛稳定性与对比算法相比最优,并且训练出来的模型与对比算法相比在轨迹跟踪任务中表现最好,验证了算法的有效性。 展开更多
关键词 事后筛选经验回放 深度确定性策略 深度强化学习 轨迹跟踪 机械臂 经验池优化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部