基于强化学习的六足机器人动态避障研究被引量：8

Study on dynamic obstacle avoidance for hexapod robotbased on reinforcement learning

在线阅读下载PDF

导出

摘要针对局部可观测的非线性动态地震环境下,六足机器人采用传统算法进行动态避障时易出现算法不稳定的情况。运用了基于双重深度Q网络(DDQN)的决策方式,通过传感器数据输入卷积神经网络(CNN)并结合强化学习的策略,下达命令到六足机器人,控制输出决策动作,实现机器人动态避障。将系统的环境反馈与决策控制直接形成闭环,通过最大化机器人与避障环境交互产生的累计奖励回报,更新神经网络权重,形成最优决策策略。通过六足机器人平台实验结果证明:此方法能较好地减少传统深度强化学习算法容易导致过度估计状态动作值和损失函数难以收敛的风险;并且提高了六足机器人进行动态避障的效率和稳定性。 Aiming at the locally observable non-linear dynamic earthquake environment,Hexapod robots are prone to algorithm instability when using traditional algorithms for dynamic obstacle avoidance.Using the decision method based on double deep Q-network(DDQN),the sensor data is input to the convolutional neural network and combined with the strategy of reinforcement learning,and the command is issued to the hexapod robot to control the output decision-making action and realize the robot dynamics avoidance.The environmental feedback of system and decision control are directly formed into a closed loop,and the optimal decision strategy is learned by maximizing the cumulative reward return generated by the interaction between the robot and the obstacle avoidance environment.The experimental results of the hexapod robot platform prove that this method can better reduce the risk that traditional deep reinforcement learning algorithms can easily lead to overestimation and loss functions that are difficult to converge.The efficiency and stability of hexapod robot for dynamic obstacle avoidance are improved.

作者董星宇唐开强傅汇乔留沧海蒋刚 DONG Xingyu;TANG Kaiqiang;FU Huiqiao;LIU Canghai;JIANG Gang(Faculty of Manufacturing Science and Engineering,Southwest University of Science and Technology,Mianyang 621000,China;Department of Control and Systems Engineering,College of Engineering Management,Nanjing University,Nanjing 210093,China;Manufacturing Process Testing Technology Key Laboratory of Ministry of Education,Mianyang 621000,China;College of Nuclear Technology and Automation Engineering,Chengdu University of Technology,Chengdu 610059,China)

机构地区西南科技大学制造科学与工程学院南京大学工程管理学院控制与系统工程系制造过程测试技术省部共建教育部重点实验室成都理工大学核技术与自动化工程学院

出处《传感器与微系统》 CSCD 北大核心 2022年第1期19-23,共5页 Transducer and Microsystem Technologies

基金四川省重大科技专项资助项目(2020ZDZX0019) 四川省科技厅重点研发计划资助项目(19ZDYF1083)。

关键词双重深度Q网络六足机器人动态避障传感器输入 double deep Q-network(DDQN) hexapod robot dynamic obstacle avoidance sensor input

分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置] TP212 [自动化与计算机技术—检测技术与自动化装置]

作者简介董星宇(1995-),男,硕士研究生,研究方向为机器人技术,机器学习;通讯作者:唐开强(1992-),男,博士研究生,研究方向为机器学习,机器人技术;留沧海(1966-),男,博士,教授,主要研究领域为机电一体化,机器人技术等;蒋刚(1978-),男,博士,教授,博士研究生导师,主要研究领域为机器人技术,机电一体化。

引文网络
相关文献

参考文献3

1徐若涵.中国地震救援机器人技术发展现状及趋势[J].机器人产业,2018,0(5):86-93. 被引量：7
2田永永,李梁华.基于速度方向判定的动态窗口法[J].农业装备与车辆工程,2018,56(8):39-42. 被引量：12
3徐坤,丁希仑,李可佳.圆周对称分布六腿机器人三种典型行走步态步长及稳定性分析[J].机器人,2012,34(2):231-241. 被引量：21

二级参考文献19

1韩宝玲,王秋丽,罗庆生.六足仿生步行机器人足端工作空间和灵活度研究[J].机械设计与研究,2006,22(4):10-12. 被引量：22
2Hirose S.Three basic types of locomotion in mobile robots [C]//5th International Conference on Advanced Robotics.Piscataway, NJ,USA:IEEE,1991:12-17.
3Lee T T,Liao C M,Chen T K.On the stabihty properties of hexapod tripod gait[J].IEEE Journal of Robotics and Automation, 1988,4(4):427-434.
4Yang J M,Kim J H.Fault-tolerant locomotion of the hexapod robot[J].IEEE Transactions on Systems,Man,and Cybernetics, Part B,1998,28(1):109-116.
5Yang J M,Kim J H.A strategy of optimal fault tolerant gait for the hexapod robot in crab walking[C]//IEEE International Conference on Robotics and Automation.Piscataway,NJ,USA: IEEE,1998:1695-1700.
6Preumont A,Alexandre P,Ghuys D.Gait analysis and implementation of a six leg walking machine[C]//5th International Conference on Advanced Robotics.Piscataway,NJ,USA: IEEE,1991:941-945.
7Chu S K K,Pang G K H.Comparison between different model of hexapod robot in fault-tolerant gait[J].IEEE Transactions on Systems,Man,and Cybernetics,Part A,2002,32(6):752-756.
8Wang Z Y,Ding X L,Rovetta A.Analysis of typical locomotion of a symmetric hexapod robot[J].Robotica,2009,28(6): 893-907.
9Kamikawa K,Arai T,Inoue K,et al.Omni-directional gait of multi-legged rescue robot[C]//IEEE International Conference on Robotics & Automation.Piscataway,NJ,USA:IEEE,2004: 2171-2176.
10Roy S S,Singh A K,Pratihar D K,et al.Analysis of sixlegged walking robots[C]//National Conference on Machines and Mechanisms.2009:259-265.

共引文献37

1侯泽宇,李明骐,马祎萌,赵俊敏,李红双.一种仿生螳螂救援机器人设计[J].机械设计,2023,40(S02):77-81. 被引量：2
2尤波,于桂鑫.六足机器人足端动力学建模仿真分析[J].黑龙江大学工程学报,2013,4(3):86-91. 被引量：2
3尤波,刘宇飞,高海波,罗智勇.六边形六足机器人障碍自识别步态规划[J].哈尔滨理工大学学报,2013,18(5):42-46. 被引量：5
4ZHUANG HongChao,GAO HaiBo,DENG ZongQuan,DING Liang,LIU Zhen.A review of heavy-duty legged robots[J].Science China(Technological Sciences),2014,57(2):298-314. 被引量：21
5熊金刚,肖志强,刘光挺,戴展华,郭建,麦杨杰.蜘蛛机器人的结构设计与运动步态仿真分析[J].机械制造,2019,57(1):7-10. 被引量：2
6胡重阳,梅涛,刘彦伟,吴晅,张勇杰,孙少明.仿生六足机器人机构设计及控制方法研究[J].机械科学与技术,2014,33(11):1621-1626. 被引量：9
7王洪斌,李程,王跃灵,刘鹏飞.基于Arduino和蓝牙技术的六足机器人控制系统设计[J].黑龙江大学自然科学学报,2015,32(4):533-537. 被引量：21
8李满宏,张明路,张建华,张小俊.六足机器人关键技术综述[J].机械设计,2015,32(10):1-8. 被引量：60
9徐坤,郑羿,丁希仑.六轮腿式机器人结构设计与运动模式分析[J].北京航空航天大学学报,2016,42(1):59-71. 被引量：36
10张春,杨明金,陈建,蒋猛,马永昌,冀杰.带有自锁式关节的农业六足机器人能耗优化模型及验证[J].农业工程学报,2016,32(18):73-83. 被引量：5

同被引文献69

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020,2(4):361-371. 被引量：4
2迟旭,李花,费继友.基于改进A^(*)算法与动态窗口法融合的机器人随机避障方法研究[J].仪器仪表学报,2021,42(3):132-140. 被引量：100
3张继明,张淳,胡金双.内高压胀形设备的伺服控制[J].机械设计,2021,38(S01):313-316. 被引量：4
4孙远敬,王帅,李鑫,郭鹰.未知环境下基于VFH+物理仿真耦合模型的机器人避障[J].辽宁工程技术大学学报（自然科学版）,2021,40(5):460-465. 被引量：6
5温兆麟,陈爱国.舰船过驳6自由度波浪补偿机器人仿真研究[J].重庆交通大学学报（自然科学版）,2012,31(5):1091-1094. 被引量：1
6刘静,赵晓光,谭民.腿式机器人的研究综述[J].机器人,2006,28(1):81-88. 被引量：74
7石琳,罗庆生,韩宝玲,黄麟.仿生六足机器人稳定性的仿生实验研究(英文)[J].系统仿真学报,2008,20(19):5384-5387. 被引量：4
8李福东,李金良,于岩,樊炳辉.一种基于CPG的两足机器人步态生成方法[J].山东科技大学学报（自然科学版）,2011,30(3):95-100. 被引量：3
9刘宇飞,丁亮,高海波,刘振,胡艳明,何玉庆,邓宗全.基于激光测距的月球探测重载六足机器人自主避障控制[J].宇航学报,2018,39(12):1381-1390. 被引量：16
10李光,杨韵.基于RBF神经网络的柔性机械臂位置控制[J].湖南工业大学学报,2014,28(3):41-46. 被引量：8

引证文献8

1李昔学,庹先国,蒋刚,黄寅森,范孝冬.基于地形感知的六足机器人运动控制方法[J].通信与信息技术,2023(3):11-15. 被引量：2
2洪子祺,许文波,吕晨,欧阳权,王志胜.基于遗传算法优化的深度强化学习-PI空气舵伺服系统控制策略[J].机电工程,2023,40(7):1071-1078. 被引量：5
3刘天成,卢振利,陈勇,单长考,刘燕,赵宇,PENCIC Marko,CAVIC Maja,ROUMIANA Ilieva,MARJAN Mernik.基于CPG的六足机器人运动控制方法研究综述[J].高技术通讯,2023,33(7):762-771. 被引量：3
4朱继伟,张隆源,王冀,罗佳宁,李伟.基于DRL和轨迹优化的多机器人导航和编队维护[J].传感器与微系统,2023,42(9):129-132. 被引量：2
5王鑫鹏,傅汇乔,邓归洲,唐开强,陈春林,留沧海.基于DRL和自由步态的六足机器人运动规划研究[J].系统仿真学报,2024,36(2):373-384. 被引量：1
6王鸿铭,赵艳忠.改进粒子群算法的机器人避障偏差控制方法[J].机械设计与制造,2024(6):294-299. 被引量：2
7孙江龙,马丛俊,郑秀娟,郭斌,佃松宜.基于数字孪生的六足机器人高性能交互系统设计[J].传感器与微系统,2024,43(9):91-94. 被引量：2
8杨杰,谭礼健,宋群,王东.图像LK光流金字塔与帧间差分法的机器人视觉避障[J].中国工程机械学报,2024,22(5):690-694.

二级引证文献17

1徐琬婷,梅源,周欣悦.一款基于STM32单片机的六足巡检机器人设计[J].西昌学院学报（自然科学版）,2023,37(4):34-41. 被引量：2
2丁汝妍,李欢,莫欣岳,吴灿,李昕雨.基于贝叶斯估计和群体智能的无人机轨迹优化[J].计算机技术与发展,2024,34(5):141-148. 被引量：2
3虞炳文,蔡红维,丁思炜,翁应健,徐涛.基于成本控制的测控设备选择性维护策略研究[J].计算机测量与控制,2024,32(7):140-146.
4袁俊球,王迪,邓中诚,张茜颖.改进自适应遗传算法下余热锅炉过热蒸汽温度控制方法[J].工业加热,2024,53(10):35-38. 被引量：2
5张建康,刘富文,郭冠辰,张帅,宋学官,孙田,李子陆.基于多保真代理模型的塔机臂架结构优化[J].机电工程,2024,41(11):1967-1976. 被引量：1
6李园园,雷斌,王喜红.多货箱机器人任务调度优化研究[J].机电工程技术,2025,54(2):100-105.
7杨洪涛,田杭州,金磊,姜西祥,秦鹏飞.基于遗传果蝇混合算法的双无刷直流伺服电机控制优化研究[J].机电工程技术,2025,54(5):80-86. 被引量：1
8张智超,张家铭,周丽丽.基于类脑计算控制和肌电信号反馈的仿生智能协同系统[J].自动化技术与应用,2025,44(3):176-179.
9王现龙,张萌,李波.数字孪生的气动机械手系统设计[J].液压与气动,2025,49(4):11-21.
10李玉亮,孙荣磊.基于ACO-SA算法的变电站巡检机器人自主避障研究[J].电气技术与经济,2025(4):1-3.

1孙至喆,贾巍杨.生态伦理学视野下的工业用地再利用景观设计研究[J].景观设计,2021(4):36-43. 被引量：3
2王辞晓,李心怡,董艳.具身视域下的学生反馈素养研究——互联网时代供给关系的再认识[J].远程教育杂志,2021,39(6):95-102. 被引量：9
3高振海,闫相同,高菲,孙天骏.仿驾驶员DDPG汽车纵向自动驾驶决策方法[J].汽车工程,2021,43(12):1737-1744. 被引量：13
4秦飞,宗序平.数据分析技术在变量施肥系统设计中的应用[J].农机化研究,2022,44(3):171-175. 被引量：1
5黄国柳,李应宏,王贵山,何学敏.一起500kV主变压器油位异常的分析及处理[J].电气开关,2021,59(6):86-89. 被引量：4
6陈赵伟,王程,戴建国,朱建辉,许善珍.AMT及其控制技术研究综述[J].淮阴工学院学报,2021,30(5):64-69. 被引量：1
7王浩远,梁煜,张为.融合多分辨率表征的实时烟雾分割算法[J].浙江大学学报（工学版）,2021,55(12):2334-2341. 被引量：3
8刘旭江,包道日娜,刘嘉文,刘东,吴胜胜.伞形风力机输出特性研究[J].太阳能学报,2021,42(12):267-274. 被引量：3
9张艳玲,莫廷钰,李松涛,张妍,李擎.演化博弈与资源配置综述[J].工程科学学报,2022,44(3):402-410. 被引量：4
10俞凯耀,金波.火电机组跳闸原因分析及处理[J].电工技术,2021(23):176-177.

传感器与微系统

2022年第1期

浏览历史

内容加载中请稍等...

基于强化学习的六足机器人动态避障研究被引量：8

参考文献3

二级参考文献19

共引文献37

同被引文献69

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于强化学习的六足机器人动态避障研究 被引量：8

参考文献3

二级参考文献19

共引文献37

同被引文献69

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于强化学习的六足机器人动态避障研究被引量：8