期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习的机械臂运动控制研究
1
作者
王文龙
张帆
《农业装备与车辆工程》
2023年第9期46-51,共6页
为解决传统机械臂控制方法编码复杂、适应环境能力较差等问题,利用深度强化学习主动探索未知环境的特点对机械臂运动控制进行研究。致力于提高机械臂对环境的适应能力,降低环境对机械臂控制的干扰,采用分布式策略梯度算法,并重置奖励函...
为解决传统机械臂控制方法编码复杂、适应环境能力较差等问题,利用深度强化学习主动探索未知环境的特点对机械臂运动控制进行研究。致力于提高机械臂对环境的适应能力,降低环境对机械臂控制的干扰,采用分布式策略梯度算法,并重置奖励函数,与深度确定性策略梯度算法进行对比试验,极大地减少了算法训练时间,提高了机械臂在仿真环境中所能达到的最大奖励值,使末端执行机构快速、准确地到达目标位置。
展开更多
关键词
机械臂运动控制
深度强化学习
分布式策略梯度算法
重置奖励函数
在线阅读
下载PDF
职称材料
题名
基于深度强化学习的机械臂运动控制研究
1
作者
王文龙
张帆
机构
上海工程技术大学机械与汽车工程学院
出处
《农业装备与车辆工程》
2023年第9期46-51,共6页
基金
上海市科委生物医药领域科技支撑计划资助(17441901200)。
文摘
为解决传统机械臂控制方法编码复杂、适应环境能力较差等问题,利用深度强化学习主动探索未知环境的特点对机械臂运动控制进行研究。致力于提高机械臂对环境的适应能力,降低环境对机械臂控制的干扰,采用分布式策略梯度算法,并重置奖励函数,与深度确定性策略梯度算法进行对比试验,极大地减少了算法训练时间,提高了机械臂在仿真环境中所能达到的最大奖励值,使末端执行机构快速、准确地到达目标位置。
关键词
机械臂运动控制
深度强化学习
分布式策略梯度算法
重置奖励函数
Keywords
manipulator motion control
deep reinforcement learning
distributed strategy gradient algorithm
reset reward function
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习的机械臂运动控制研究
王文龙
张帆
《农业装备与车辆工程》
2023
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部