期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
结构化环境中UR3机械臂对于移动物体的抓取研究
1
作者 罗国庆 袁庆霓 +1 位作者 曲鹏举 吴兴杰 《计算机工程与应用》 北大核心 2025年第16期106-115,共10页
针对在结构化环境下机械臂移动抓取自主决策能力不足、环境适应性低、学习效率低以及机械臂协同作业中的协调性和路径规划等问题,将双重回放缓存机制(double replay buffer,DRB)与强化学习柔性动作-评价(soft actor-critic,SAC)算法融合... 针对在结构化环境下机械臂移动抓取自主决策能力不足、环境适应性低、学习效率低以及机械臂协同作业中的协调性和路径规划等问题,将双重回放缓存机制(double replay buffer,DRB)与强化学习柔性动作-评价(soft actor-critic,SAC)算法融合,提出基于DRB-SAC(soft actor-critic with double replay buffer)的深度强化学习移动物体机械臂抓取方法。首先搭建移动物体机械臂抓取系统。然后提出改进的深度强化学习控制策略DRB-SAC。该策略通过马尔可夫决策过程模型构建,定义动作空间和状态空间提供操作和观察环境的框架,确定机械臂控制任务的目标和约束条件,设计训练策略和奖励函数,利用深度神经网络来拟合动作价值函数和策略函数,实现机械臂移动自适应抓取智能决策,并引入双重回放缓存机制进一步增强了算法的稳定性和泛化能力。最后进行仿真和物理实验对比分析,结果表明该方法具有很好的收敛性,在探索环境奖励、抓取动作的完成程度方面具有优越性。 展开更多
关键词 强化学习 移动物体抓取 双重回放缓存机制 CoppeliaSim仿真
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部