基于强化学习的改进RRT^(*)路径规划

Improved RRT^(*) Path Planning Based on Reinforcement Learning

在线阅读下载PDF

导出

摘要针对RRT^(*)算法在路径规划中面临搜索效率不高、易于陷入局部最优等问题,提出一种结合强化学习的Q-RRT^(*)算法。该算法将Q-Learning算法和RRT^(*)算法相融合,首先引入转角偏向策略增强路径搜索时的导向作用、减少无效节点的生成,提升算法的搜索效率;其次通过动R搜索算法动态地调整搜索半径,进一步优化路径的质量和冗余节点的产生;最后对生成的路径使用三次B样条插值法和冗余节点删除法进一步优化路径质量。在二维和三维环境下的仿真实验结果表明,改进后的Q-RRT^(*)算法和RRT、RRT^(*)和RL-RRT算法相比,路径规划时长平均快39.7%,迭代次数平均减低27.9%,路径长度平均缩短16.3%。 In order to solve the problems of low search efficiency and tendency to fall into local optimum in RRT^(*) path planning,a Q-RRT^(*) algorithm combined with reinforcement learning was proposed,which fused the Q-Learning algorithm and the RRT^(*) algorithm.Firstly,the corner bias strategy was introduced to enhance the guiding effect of path search,reduce the generation of invalid nodes,and improve the search efficiency of the algorithm.Secondly,the search radius was dynamically adjusted by the dynamic R search algorithm to further optimize the quality of the path and the generation of redundant nodes.Finally the cubic B-spline interpolation method and the redundant node deletion method were used to further optimize the path quality of the generated path.Simulation results in 2D and 3D environments show that the improved Q-RRT^(*) algorithm is 39.7%faster on average,27.9%less iteration and 16.3%shorter in path length than RRT,RRT^(*) and RL-RRT algorithms.

作者张艳珠侯亢钧陈勇李婷雪李妍 ZHANG Yanzhu;HOU Kangjun;CHEN Yong;LI Tingxue;LI Yan(Shenyang Ligong University,Shenyang 110159,China)

机构地区沈阳理工大学自动化与电气工程学院

出处《沈阳理工大学学报》 2025年第4期1-6,12,共7页 Journal of Shenyang Ligong University

基金辽宁省教育厅高等学校基本科研项目(LJKZ0245)。

关键词 RRT^(*) 强化学习转角偏向策略动R搜索算法 RRT^(∗) reinforcement learning corner bias strategy dynamic R search algorithm

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

作者简介张艳珠(1971-),女,教授,博士。

引文网络
相关文献

参考文献8

1林韩熙,向丹,欧阳剑,兰晓东.移动机器人路径规划算法的研究综述[J].计算机工程与应用,2021,57(18):38-48. 被引量：113
2鲍庆勇,李舜酩,沈峘,门秀花.自主移动机器人局部路径规划综述[J].传感器与微系统,2009,28(9):1-4. 被引量：55
3王梓强,胡晓光,李晓筱,杜卓群.移动机器人全局路径规划算法综述[J].计算机科学,2021,48(10):19-29. 被引量：85
4马新国,马希青.融合改进RRT和Dijkstra算法的机器人动态路径规划[J].组合机床与自动化加工技术,2023(2):5-9. 被引量：31
5康振兴.基于路径规划和深度强化学习的机器人避障导航研究[J].计算机应用与软件,2024,41(1):297-303. 被引量：5
6胡晓阳,赵杰,武炎明.基于改进RRT-Connect算法的路径规划研究[J].沈阳理工大学学报,2023,42(4):26-30. 被引量：7
7冯迎宾,赵子君,晏佳华.改进RRT算法的四旋翼无人机路径规划方法[J].沈阳理工大学学报,2024,43(1):9-15. 被引量：6
8罗国攀,张国良,杨敏豪.基于强化学习方法的RRT全局路径规划算法[J].四川轻化工大学学报（自然科学版）,2024,37(2):57-63. 被引量：2

二级参考文献130

1罗国攀,张国良,徐佳宝.基于SPE-ICM的移动机器人内在动机避障规划[J].电子测量与仪器学报,2023,37(2):21-27. 被引量：3
2闻朝中,李智.粒子群算法在配电网络无功补偿优化中的应用[J].武汉工业学院学报,2004,23(1):18-21. 被引量：39
3朱庆保,张玉兰.基于栅格法的机器人路径规划蚁群算法[J].机器人,2005,27(2):132-136. 被引量：124
4朱庆保.复杂环境下的机器人路径规划蚂蚁算法[J].自动化学报,2006,32(4):586-593. 被引量：46
5Stentz A. Optional and efficient path planning for partly known environment [ C ]//Proceedings of the IEEE International Conference on Robotics and Automation, 1994.
6Stentz A. The focused D * algorithm for real time replan-ning[C]// Proceedings of the International Joint Conference on Artificial Intelligence, 1995.
7Podsedkowski L, Nowakowski J, Idzikowski M, et al. A new solution for path planning in partially known or unknown environment for nonholonomic mobile robots [ J ]. Robotics and Autonomous Systems ,2001,34 (2) : 145 --152.
8Ye C ,Wang D. A novel navigation method for autonomous mobile vehicles [ J ]. Journal of Intelligent and Robotics Systems, 2001 (32) : 361 --388.
9Lei B, Li F. A fuzzy behavior fusion algorithm for mobile robot real-time path planning in unknown environment [ C ]//Proc of IEEE Intl Conf on Integration Technology,2007:173--178.
10Petru Rusu,Petriu E M, Whalen T E , et al. Behavior-based neuro-fuzzy controller for mobile robot navigation[ J]. IEEE Transaction on Instrument and Measurment,2003,52 ( 4 ) : 1335 -1340.

共引文献277

1赵倩楠,黄宜庆.融合A^(*)蚁群和动态窗口法的机器人路径规划[J].电子测量与仪器学报,2023,37(2):28-38. 被引量：21
2李芳娣,邓晓燕,吴伟铭,周依静,陈芯婷.移动机器人复杂角点定位和停车策略研究与实现[J].电子测量技术,2023,46(22):26-31. 被引量：1
3郭睿辰,黄涛.无人机蜂群协同任务规划方法研究综述[J].中国公共安全,2024(3):174-177.
4潘迁,李伟,张云群,丁毓峰.滚动窗口与蚁群算法结合的机器人路径规划[J].机械制造,2012,50(9):25-28.
5鲍庆勇,李舜酩,沈峘,尚伟燕.基于行为融合的移动机器人自主避障算法[J].传感器与微系统,2010,29(5):70-73. 被引量：4
6杜宇上.基于正态密度函数的滚动窗口路径规划方法[J].科学技术与工程,2010,10(15):3741-3744.
7杜宇上.一种基于模糊逻辑的滚动窗口路径规划方法[J].现代电子技术,2010,33(13):146-148. 被引量：4
8赵维,谢晓方,孙艳丽.自主角色导航技术综述[J].计算机应用与软件,2011,28(7):159-163. 被引量：1
9张广林,胡小梅,柴剑飞,赵磊,俞涛.路径规划算法及其应用综述[J].现代机械,2011(5):85-90. 被引量：130
10蒲兴成,张军,张毅.基于神经网络的改进行为协调控制及其在智能轮椅路径规划中的应用[J].智能系统学报,2011,6(5):456-463. 被引量：6

1温天飞,高宇,王全,杨闯.融合快速遍历随机树和Q强化学习的煤矿轮式机器人路径规划关键技术[J].煤矿安全,2025,56(3):233-241.
2孙馨宇,徐家川,焦学健,周洋,徐晗.基于改进Informed-RRT^(*)的路径规划算法研究[J].电子测量技术,2025,48(6):73-82.
3沈朝萍,蔡鹏,于鹏澎,朱莉凯.融合势场与蚁群算法的平滑无人机航迹规划[J].机械设计与制造,2025(5):186-193.
4徐有杰,李辉.基于强化学习的直流微电网二次电压控制策略[J].机电工程技术,2025,54(7):173-178.
5张辉,苏国用,赵东洋,杨宇豪,何凯.基于改进A^(*)算法的矿用巡检机器人路径规划[J].太原理工大学学报,2025,56(3):559-566.
6王智海.基于改进A^(*)算法的农用小车路径规划研究[J].河北农机,2025(7):25-27.
7孙正阳,杜晔.基于改进萤火虫算法的卫星网络路由优化方法[J].系统工程与电子技术,2025,47(4):1346-1354.

沈阳理工大学学报

2025年第4期

浏览历史

内容加载中请稍等...

基于强化学习的改进RRT^(*)路径规划

参考文献8

二级参考文献130

共引文献277

相关作者

相关机构

相关主题

浏览历史