-
题名基于深度强化学习的飞行机械臂视觉抓取研究
- 1
-
-
作者
王宁
毛鹏军
倪培龙
杨孟杰
-
机构
河南科技大学机电工程学院
-
出处
《组合机床与自动化加工技术》
北大核心
2025年第9期34-39,43,共7页
-
基金
河南省重大科技专项项目(181100110100)
洛阳市核心技术攻关项目(2101018A)。
-
文摘
为了解决传统深度确定性策略梯度算法(DDPG)在旋翼飞行机械臂抓取物体过程中机械臂学习效率低、收敛速度慢,导致旋翼飞行机械臂抓取成功率较低的问题,提出了一种HER-DDPG算法。首先基于ROS平台搭建旋翼飞行机械臂的实验环境,然后利用改进的YOLOv8n目标检测算法和反向投影法获取抓取物体的三维位置,最后将DDPG算法、HER-TD3算法和设计的HER-DDPG算法加入仿真环境对飞行机械臂进行抓取训练。HER-DDPG算法先利用事后经验回放算法(HER)将实际未成功的经验重新解释为成功的的经验,增加了有用经验的数量,然后再用DDPG算法对飞行机械臂进行训练。实验结果表明,利用DDPG算法对飞行机械臂进行训练,学习效率较低,收敛速度较慢,抓取成功率为65.2%,利用HER-TD3算法对飞行机械臂进行训练,学习效率较低,收敛速度较快,抓取成功率为79.5%,而利用HER-DDPG算法对飞行机械臂进行训练,学习效率高,收敛速度快,抓取成功率为80.4%,较DDPG算法上升了15.2%。
-
关键词
深度确定性策略梯度算法
旋翼飞行机械臂抓取
HER-TD3
HER-DDPG
ROS
-
Keywords
deep deterministic policy gradient algorithm
rotor flying manipulator grasping
HER-TD3
HER-DDPG
ROS
-
分类号
TH165
[机械工程—机械制造及自动化]
TG659
[金属学及工艺—金属切削加工及机床]
-