期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的机械臂容错控制方法 被引量:9
1
作者 李铭浩 张华 +2 位作者 刘满禄 李新茂 周祺杰 《传感器与微系统》 CSCD 2020年第1期53-55,59,共4页
针对机械臂突发单关节故障的情况,提出一种基于深度强化学习的机械臂容错控制方法。在建立环境模型和奖罚机制的基础上,针对机械臂正常运行和故障运行的情况,使用无模型的强化学习算法进行离线训练。在Rviz中建立机械臂模型并使用上述... 针对机械臂突发单关节故障的情况,提出一种基于深度强化学习的机械臂容错控制方法。在建立环境模型和奖罚机制的基础上,针对机械臂正常运行和故障运行的情况,使用无模型的强化学习算法进行离线训练。在Rviz中建立机械臂模型并使用上述网络进行在线控制。实验证明:该算法可以有效完成机械臂的正常控制和容错控制。 展开更多
关键词 机械臂关节故障 容错控制 深度神经网络 强化学习
在线阅读 下载PDF
基于深度强化学习的固体放射性废物抓取方法研究 被引量:3
2
作者 周祺杰 刘满禄 +1 位作者 李新茂 张华 《计算机应用研究》 CSCD 北大核心 2020年第11期3363-3367,共5页
针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法。该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进... 针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法。该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进行交互并获得回报奖励,回报奖励由机械臂动作执行结果和放射性区域内放射性活度的高低构成,根据Q值的大小得到机械臂的最佳抓取位置。用V-REP软件对UR5机械臂建立仿真模型,在仿真环境中完成不同类型固体放射性废物抓取的训练与测试。仿真结果表明,固体废物在松散放置时该方法可使机械臂抓取成功率大于90%,在紧密放置时抓取成功率大于65%,机械臂不会受到废物堆叠的影响,并且会优先抓取放射性区域内具有高放射性活度的物体。 展开更多
关键词 固体放射性废物 深度强化学习 机械臂抓取 回报奖励
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部