期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Transformer-DCGAR-SAC的移动机器人路径规划
被引量:
1
1
作者
张文科
李宏涛
+1 位作者
王科平
杨艺
《传感器与微系统》
北大核心
2025年第5期152-158,共7页
为提升移动机器人在静态或动态场景下处理环境信息的能力及基于随机性策略的动作选取机制,通过深入探讨随机性策略梯度算法,提出了一种基于Transformer的双重Critic网络引导的动作选择机制-柔性策略-评估(Transformer DCGAR-SAC)算法的...
为提升移动机器人在静态或动态场景下处理环境信息的能力及基于随机性策略的动作选取机制,通过深入探讨随机性策略梯度算法,提出了一种基于Transformer的双重Critic网络引导的动作选择机制-柔性策略-评估(Transformer DCGAR-SAC)算法的移动机器人路径规划方法。首先,利用了Transformer的高效序列处理能力可以捕捉环境动态变化的特点,将Transformer模型与SAC算法的随机性策略网络融合。随后,提出一种基于双重Critic网络引导的动作选择机制。该机制引入了V网络,并与Q网络共同评估价值差异,指导动作根据相对价值进行选择,减小偏向过估计动作的风险。在仿真实验方面,与两种随机性策略算法进行了对比,所提算法在样本利用率和成功率等多个关键指标上优于其他算法。此外,在真实场景中进行算法的实车实验,并成功在真实场景下实现了路径规划,验证了算法的可行性和有效性。
展开更多
关键词
动态场景
路径规划
深度强化学习
TRANSFORMER
动作选择机制
在线阅读
下载PDF
职称材料
题名
基于Transformer-DCGAR-SAC的移动机器人路径规划
被引量:
1
1
作者
张文科
李宏涛
王科平
杨艺
机构
焦作煤业集团赵固(新乡)能源有限责任公司
平高集团有限公司
河南理工大学电气工程与自动化学院
出处
《传感器与微系统》
北大核心
2025年第5期152-158,共7页
基金
河南省科技攻关项目(232102210040)。
文摘
为提升移动机器人在静态或动态场景下处理环境信息的能力及基于随机性策略的动作选取机制,通过深入探讨随机性策略梯度算法,提出了一种基于Transformer的双重Critic网络引导的动作选择机制-柔性策略-评估(Transformer DCGAR-SAC)算法的移动机器人路径规划方法。首先,利用了Transformer的高效序列处理能力可以捕捉环境动态变化的特点,将Transformer模型与SAC算法的随机性策略网络融合。随后,提出一种基于双重Critic网络引导的动作选择机制。该机制引入了V网络,并与Q网络共同评估价值差异,指导动作根据相对价值进行选择,减小偏向过估计动作的风险。在仿真实验方面,与两种随机性策略算法进行了对比,所提算法在样本利用率和成功率等多个关键指标上优于其他算法。此外,在真实场景中进行算法的实车实验,并成功在真实场景下实现了路径规划,验证了算法的可行性和有效性。
关键词
动态场景
路径规划
深度强化学习
TRANSFORMER
动作选择机制
Keywords
dynamic scenarios
path planning
deep reinforcement learning
Transformer
action selection mech-anism
分类号
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Transformer-DCGAR-SAC的移动机器人路径规划
张文科
李宏涛
王科平
杨艺
《传感器与微系统》
北大核心
2025
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部