期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进DQN算法的移动机器人路径规划
1
作者
于效民
王欣
+1 位作者
吴迪
刘雪莲
《计算机应用与软件》
北大核心
2025年第6期335-341,共7页
移动机器人在动态未知复杂环境中进行路径规划时,需要保证机器人的实时性。针对DQN算法在移动机器人路径规划中存在的过估计问题以及收敛速度慢的问题,提出一种C-RD3QN算法(Combination-Residual Dueling Double DQN)。该算法在D3QN算...
移动机器人在动态未知复杂环境中进行路径规划时,需要保证机器人的实时性。针对DQN算法在移动机器人路径规划中存在的过估计问题以及收敛速度慢的问题,提出一种C-RD3QN算法(Combination-Residual Dueling Double DQN)。该算法在D3QN算法基础上,将卷积层修改为残差网络结构,使用竞争网络结构中的动作优势函数来估计动作值函数,将状态值函数与奖励值结合,使机器人达到更快的收敛速度。经过仿真实验对比分析,表明C-RD3QN算法能够进行更优的路径规划。
展开更多
关键词
深度强化学习
机器人路径规划
残差网络结构
奖励值重构
在线阅读
下载PDF
职称材料
题名
基于改进DQN算法的移动机器人路径规划
1
作者
于效民
王欣
吴迪
刘雪莲
机构
大连理
工大
学机械工程学院
大连理
工大
学计算机科学与技术学院
大连理工大学成都研究院
出处
《计算机应用与软件》
北大核心
2025年第6期335-341,共7页
基金
国家工信部、卫健委的5G+医疗健康应用试点项目(面向5G的智能搬运机器人应用试点)。
文摘
移动机器人在动态未知复杂环境中进行路径规划时,需要保证机器人的实时性。针对DQN算法在移动机器人路径规划中存在的过估计问题以及收敛速度慢的问题,提出一种C-RD3QN算法(Combination-Residual Dueling Double DQN)。该算法在D3QN算法基础上,将卷积层修改为残差网络结构,使用竞争网络结构中的动作优势函数来估计动作值函数,将状态值函数与奖励值结合,使机器人达到更快的收敛速度。经过仿真实验对比分析,表明C-RD3QN算法能够进行更优的路径规划。
关键词
深度强化学习
机器人路径规划
残差网络结构
奖励值重构
Keywords
Deep reinforcement learning
Robot path planning
Residual network structure
Reward value reconstruction
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进DQN算法的移动机器人路径规划
于效民
王欣
吴迪
刘雪莲
《计算机应用与软件》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部