期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的飞行机械臂视觉抓取研究
1
作者 王宁 毛鹏军 +1 位作者 倪培龙 杨孟杰 《组合机床与自动化加工技术》 北大核心 2025年第9期34-39,43,共7页
为了解决传统深度确定性策略梯度算法(DDPG)在旋翼飞行机械臂抓取物体过程中机械臂学习效率低、收敛速度慢,导致旋翼飞行机械臂抓取成功率较低的问题,提出了一种HER-DDPG算法。首先基于ROS平台搭建旋翼飞行机械臂的实验环境,然后利用改... 为了解决传统深度确定性策略梯度算法(DDPG)在旋翼飞行机械臂抓取物体过程中机械臂学习效率低、收敛速度慢,导致旋翼飞行机械臂抓取成功率较低的问题,提出了一种HER-DDPG算法。首先基于ROS平台搭建旋翼飞行机械臂的实验环境,然后利用改进的YOLOv8n目标检测算法和反向投影法获取抓取物体的三维位置,最后将DDPG算法、HER-TD3算法和设计的HER-DDPG算法加入仿真环境对飞行机械臂进行抓取训练。HER-DDPG算法先利用事后经验回放算法(HER)将实际未成功的经验重新解释为成功的的经验,增加了有用经验的数量,然后再用DDPG算法对飞行机械臂进行训练。实验结果表明,利用DDPG算法对飞行机械臂进行训练,学习效率较低,收敛速度较慢,抓取成功率为65.2%,利用HER-TD3算法对飞行机械臂进行训练,学习效率较低,收敛速度较快,抓取成功率为79.5%,而利用HER-DDPG算法对飞行机械臂进行训练,学习效率高,收敛速度快,抓取成功率为80.4%,较DDPG算法上升了15.2%。 展开更多
关键词 深度确定性策略梯度算法 旋翼飞行机械臂抓取 HER-TD3 HER-DDPG ROS
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部