-
题名结构化环境中UR3机械臂对于移动物体的抓取研究
- 1
-
-
作者
罗国庆
袁庆霓
曲鹏举
吴兴杰
-
机构
贵州大学现代制造技术教育部重点实验室
-
出处
《计算机工程与应用》
北大核心
2025年第16期106-115,共10页
-
基金
国家自然科学基金(52065010,52165063)
贵州省科技厅项目([2022]G140,[2022]K024,[2023]G094,[2023]G125,[2024]K154)
+1 种基金
贵州省科技局创新项目(筑科合同[2024]-1-1)
贵州大学研究生科技竞赛培育项目(YKJP202306)。
-
文摘
针对在结构化环境下机械臂移动抓取自主决策能力不足、环境适应性低、学习效率低以及机械臂协同作业中的协调性和路径规划等问题,将双重回放缓存机制(double replay buffer,DRB)与强化学习柔性动作-评价(soft actor-critic,SAC)算法融合,提出基于DRB-SAC(soft actor-critic with double replay buffer)的深度强化学习移动物体机械臂抓取方法。首先搭建移动物体机械臂抓取系统。然后提出改进的深度强化学习控制策略DRB-SAC。该策略通过马尔可夫决策过程模型构建,定义动作空间和状态空间提供操作和观察环境的框架,确定机械臂控制任务的目标和约束条件,设计训练策略和奖励函数,利用深度神经网络来拟合动作价值函数和策略函数,实现机械臂移动自适应抓取智能决策,并引入双重回放缓存机制进一步增强了算法的稳定性和泛化能力。最后进行仿真和物理实验对比分析,结果表明该方法具有很好的收敛性,在探索环境奖励、抓取动作的完成程度方面具有优越性。
-
关键词
强化学习
移动物体抓取
双重回放缓存机制
CoppeliaSim仿真
-
Keywords
reinforcement learning
moving object grasp
double replay buffer
Coppeliasim simulation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-