基于强化学习方法的RRT全局路径规划算法被引量：2

RRT Global Path Planning Algorithm Based on Reinforcement Learning Method

在线阅读下载PDF

导出

摘要针对强化学习运用于局部路径规划时目标方向不明确易陷入局部最优的情况以及快速探索随机树(RRT)算法规划路径复杂、冗余点多等问题,提出一种融合RRT算法与强化学习(RL)思想的全局路径规划算法。首先,通过RRT全局路径规划算法弱化、减少强化学习算法易于陷入局部最优的问题,并且在一定程度上可以减少规划迭代时间;其次,采用强化学习算法的最大回报奖励机制强化RRT算法在路径规划过程中选择子节点时的目的性,避免过多随机点。实验结果表明,所提算法有效弱化了局部最优所带来的绕远影响,路径长度缩短33.3,凹、凸地形有效节点占比分别提高36.0%和39.6%,侧面反映冗余点数量减少,验证了该算法的可行性。 Aiming at the situation that reinforcement learning to local path planning is not clear about the target direction and easy to fall into local optimality,and the rapidly-exploring random tree(RRT)algorithm has complex planning paths and lots of redundant points,a global path planning integrating RRT algorithm and reinforcement learning(RL)ideas has been proposed.Firstly,the RRT global path planning algorithm is used to weaken and reduce the RL algorithm to avoid falling into the problem of local optimum,which can reduce the planning iteration time to some extent.Secondly,the maximum reward mechanism of the reinforcement learning algorithm is used to strengthen the purpose of the RRT algorithm when selecting child nodes in the path planning process,so as to avoid too many random points.The experimental results suggest that the proposed algorithm weakens the influence of local optimization,shortens the path length by 33.3,increases the proportion of effective nodes in uneven and convex terrain by 36.0%and 39.6%,respectively,reflecting the reduction of redundant points on the side,which verifies the feasibility of the algorithm.

作者罗国攀张国良杨敏豪 LUO Guopan;ZHANG Guoliang;YANG Minhao(School of Automation and Information Engineering,Sichuan University of Science&Engineering,Yibin 644000,China;Artificial Intelligence Key Laboratory of Sichuan Province,Yibin 644000,China)

机构地区四川轻化工大学自动化与信息工程学院人工智能四川省重点实验室

出处《四川轻化工大学学报（自然科学版）》 CAS 2024年第2期57-63,共7页 Journal of Sichuan University of Science & Engineering(Natural Science Edition)

基金四川省应用基础研究项目(2019YJ00413)。

关键词强化学习快速探索随机树回报奖励机制全局路径规划 reinforcement learning rapidly-exploring random tree reward mechanism global path planning

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

作者简介通信作者:张国良(1970-),男,教授,博士,研究方向为先进控制理论、组合导航以及机器人技术,(E-mail)zhgl@sohu.com。

引文网络
相关文献

参考文献16

1邹启杰,刘世慧,张跃,侯英鹂.基于强化学习的快速探索随机树特殊环境中路径重规划算法[J].控制理论与应用,2020,37(8):1737-1748. 被引量：29
2桂林,武小悦.部分可观测马尔可夫决策过程算法综述[J].系统工程与电子技术,2008,30(6):1058-1064. 被引量：12
3陶茂林,隋春平.小型车式移动机器人转向机构的设计与优化[J].机械设计与制造,2017(11):105-108. 被引量：5
4唐小兵,沈成武,陈定方.结构损伤识别的柔度曲率法[J].武汉理工大学学报,2001,23(8):18-20. 被引量：52
5杜传胜,高焕兵,侯宇翔,汪子健.同根双向扩展的贪心RRT路径规划算法[J].计算机工程与应用,2023,59(21):312-318. 被引量：9
6张腾龙,李擎.基于B-RRT^(*)FND算法的移动机器人路径规划[J].控制与决策,2023,38(11):3121-3127. 被引量：6
7罗国攀,张国良,徐佳宝.基于SPE-ICM的移动机器人内在动机避障规划[J].电子测量与仪器学报,2023,37(2):21-27. 被引量：3
8刘恩海,高文斌,孔瑞平,刘贝野,董瑶,陈媛媛.改进的RRT路径规划算法[J].计算机工程与设计,2019,40(8):2253-2258. 被引量：53
9支琛博,张爱军,杜新阳,彭鹏.改进A*算法的移动机器人全局路径规划研究[J].计算机仿真,2023,40(2):486-491. 被引量：14
10王豪,赵学军,袁修久.基于改进自适应遗传算法的机器人路径规划[J].电光与控制,2022,29(5):72-76. 被引量：32

二级参考文献268

1刘军,冯硕,任建华.移动机器人路径动态规划有向D~*算法[J].浙江大学学报（工学版）,2020,54(2):291-300. 被引量：31
2闻朝中,李智.粒子群算法在配电网络无功补偿优化中的应用[J].武汉工业学院学报,2004,23(1):18-21. 被引量：39
3朱庆保,张玉兰.基于栅格法的机器人路径规划蚁群算法[J].机器人,2005,27(2):132-136. 被引量：124
4戴博,肖晓明,蔡自兴.移动机器人路径规划技术的研究现状与展望[J].控制工程,2005,12(3):198-202. 被引量：75
5朱庆保.复杂环境下的机器人路径规划蚂蚁算法[J].自动化学报,2006,32(4):586-593. 被引量：46
6沈晶,顾国昌,刘海波.未知动态环境中基于分层强化学习的移动机器人路径规划[J].机器人,2006,28(5):544-547. 被引量：15
7Boutilier C, Dean T, Hank S. Decision theoretic planning: structural assumptions and computational leverage[J]. Journal of Artificial Intelligence Research, 1999, 11 : 1 - 49.
8Astrom K J. Optimal control of Markov decision processes with incomplete state estimation[J]. Journal of Mathematical Analysis and Application, 1965, 10:174 - 205.
9Eagle J. The optimal search for a moving target when the search path is constrained[J]. Operations Research, 1984, 32: 1107- 1115.
10Sondik E J. The optimal control of partially observable Markov processes over the infinite horizon: discounted case[J]. Operations Research, 1978, 26:282 - 304.

共引文献798

1刘军,冯硕,任建华.移动机器人路径动态规划有向D~*算法[J].浙江大学学报（工学版）,2020,54(2):291-300. 被引量：31
2黄鲁,周非同.基于路径优化D^*Lite算法的移动机器人路径规划[J].控制与决策,2020,35(4):877-884. 被引量：25
3赵倩楠,黄宜庆.融合A^(*)蚁群和动态窗口法的机器人路径规划[J].电子测量与仪器学报,2023,37(2):28-38. 被引量：21
4罗国攀,张国良,徐佳宝.基于SPE-ICM的移动机器人内在动机避障规划[J].电子测量与仪器学报,2023,37(2):21-27. 被引量：3
5李芳娣,邓晓燕,吴伟铭,周依静,陈芯婷.移动机器人复杂角点定位和停车策略研究与实现[J].电子测量技术,2023,46(22):26-31. 被引量：1
6张凡,蔡涛,刘文达,范亚雷.基于改进JPS算法的电站巡检机器人路径规划[J].电子测量技术,2020,43(8):10-16. 被引量：11
7高双,柳春平,张瞳,陈坤.可行状态包络下欠驱动水面船全时可跟踪轨迹规划方法[J].船舶工程,2022,44(S01):459-466. 被引量：1
8郭睿辰,黄涛.无人机蜂群协同任务规划方法研究综述[J].中国公共安全,2024(3):174-177.
9侯丽,桂伟.移动机器人路径规划的仿真辅助教学实践研究[J].网络空间安全,2021,12(5):65-68. 被引量：1
10张丽梅,杜守军.基于柔度的钢桁架结构损伤识别方法[J].振动工程学报,2004,17(z2):983-985. 被引量：2

同被引文献20

1鲍庆勇,李舜酩,沈峘,门秀花.自主移动机器人局部路径规划综述[J].传感器与微系统,2009,28(9):1-4. 被引量：55
2林韩熙,向丹,欧阳剑,兰晓东.移动机器人路径规划算法的研究综述[J].计算机工程与应用,2021,57(18):38-48. 被引量：113
3王梓强,胡晓光,李晓筱,杜卓群.移动机器人全局路径规划算法综述[J].计算机科学,2021,48(10):19-29. 被引量：85
4马新国,马希青.融合改进RRT和Dijkstra算法的机器人动态路径规划[J].组合机床与自动化加工技术,2023(2):5-9. 被引量：31
5胡晓阳,赵杰,武炎明.基于改进RRT-Connect算法的路径规划研究[J].沈阳理工大学学报,2023,42(4):26-30. 被引量：7
6颜双权,胥建成.工业机器人复杂B样条曲线轨迹控制精度补偿[J].机械制造与自动化,2023,52(5):32-35. 被引量：4
7冯迎宾,赵子君,晏佳华.改进RRT算法的四旋翼无人机路径规划方法[J].沈阳理工大学学报,2024,43(1):9-15. 被引量：6
8康振兴.基于路径规划和深度强化学习的机器人避障导航研究[J].计算机应用与软件,2024,41(1):297-303. 被引量：5
9田应仲,段正全.挖掘机器人精细作业的综合轨迹控制策略研究[J].工业控制计算机,2024,37(1):33-35. 被引量：1
10盛松梅,丁荣晖.基于双向LSTM神经网络的机器人机械臂智能轨迹控制系统[J].自动化与仪器仪表,2024(3):206-209. 被引量：3

引证文献2

1李博.基于改进RRTConnect的壁画修复机器人轨迹控制研究[J].自动化与仪器仪表,2025(4):164-167.
2张艳珠,侯亢钧,陈勇,李婷雪,李妍.基于强化学习的改进RRT^(*)路径规划[J].沈阳理工大学学报,2025,44(4):1-6.

1李晓娟,陈涛,韩睿春,刘建璇.不确定采摘环境下改进RRT算法的机械臂路径规划研究[J].中国农机化学报,2024,45(4):193-198. 被引量：2
2张正文,熊小泽,廖桂生,巩朋成,朱鑫潮.一种基于模糊融合规则的CFAR检测器[J].现代雷达,2024,46(2):78-85. 被引量：1
3张华盛,宋树祥,蔡超波.一种高精度流水线ADC系统设计与建模方法[J].国外电子测量技术,2024,43(3):98-105.

四川轻化工大学学报（自然科学版）

2024年第2期

浏览历史

内容加载中请稍等...

基于强化学习方法的RRT全局路径规划算法被引量：2

参考文献16

二级参考文献268

共引文献798

同被引文献20

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于强化学习方法的RRT全局路径规划算法 被引量：2

参考文献16

二级参考文献268

共引文献798

同被引文献20

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于强化学习方法的RRT全局路径规划算法被引量：2