基于增强学习的六足机器人自由步态规划被引量：12

Free Gait Planning for a Hexapod Robot Based on Reinforcement Learning

导出

摘要为解决六足机器人步态规划问题,实现特定地形上机器人自由步态的优化学习,基于机器人单足步距的离散化处理,融合CPG模型的时间节拍原理与反射模型的空间规则约束机制,构建六足机器人离散化步态模型。通过机器人稳定性分析与步态规划策略研究,将复杂的步态规划问题转化为以振荡周期为时间间隔的位置状态间的排序问题,从新的视角提出了一种六足机器人自由步态规划的基本框架与方法。在此基础上,模仿生物步态的学习行为,基于步态序列的离散化处理,构建了基于增强学习的步态模型,并以机器人平均稳定裕量为优化目标,通过制定步态离散单元间动态转换概率的调整策略,提出了基于增强学习的自由步态规划方法。样机试验显示,自由步态规划方法与基于增强学习的自由步态规划方法均可规划出相对符合生物步态行为特征的稳定自由步态,且后者可利用步态历史信息实现特定地形上自由步态的优化学习。 In order to solve the problem of gait planning for hexapod robots and achieve the optimization and learning of free gaits on specific terrains,a discrete gait model is built based on the discretization of strides and the fusion of CPG mode and reflect model.Through the analysis of robot stability and the study of gait planning strategies,the complex gait planning problem is transformed into the reorder problem of states with the interval of oscillation period.Inspired by this idea,a free gait planning method is proposed from a new perspective.Then a gait model based on reinforcement learning is constructed based on the discretization of gait sequences to imitate the learning behaviour of biological gaits.And using the average stability margin as performance index,a free gait planning method based on reinforcement learning is proposed by developing the adjustment strategies of dynamic conversion probabilities between discrete gait units.The prototype gait experiment results show that both the free gait planning method and the free gait planning method based on reinforcement learning can generate free gaits in line with the laws of biological movements,and the free gait planning method based on reinforcement learning can achieve the optimization and learning of free gaits on specific terrains using gait history information.

作者李满宏张明路张建华田颖马艳悦 LI Manhong;ZHANG Minglu;ZHANG Jianhua;TIAN Ying;MA Yanyue(School of Mechanical Engineering,Hebei University of Technology,Tianjin 300130)

机构地区河北工业大学机械工程学院

出处《机械工程学报》 EI CAS CSCD 北大核心 2019年第5期36-44,共9页 Journal of Mechanical Engineering

基金国家自然科学基金(61803142 61473113 61503119) 河北省自然科学基金(F2018202210) 河北省高等学校科学技术研究(QN2017047)资助项目

关键词六足机器人自由步态步态规划增强学习离散化 hexapod robot free gait gait planning reinforcement learning discretization

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

作者简介李满宏,男,1987年出生,博士,讲师。主要研究方向为六足机器人步态规划与运动控制。E-mail:lmh9181219@163.com.cn;张明路,男,1964年出生,博士,教授,博士研究生导师。主要研究方向为智能机器人技术。E-mail:zhangml@hebut.edu.cn;张建华,男,1979年出生,博士,教授,博士研究生导师。主要研究方向为机器人柔性控制与安全作业方法。E-mail:jhzhang@hebut.edu.cn;通信作者:田颖,女,1987年出生,博士,讲师。主要研究方向为机器人动力学与运动控制。E-mail:flyserelo@126.com.cn;马艳悦,男,1993年出生,硕士研究生。主要研究方向为机器人关节柔性控制方法。E-mail:Mayuanyue@hebut.edu.cn.

引文网络
相关文献

参考文献12

1黄博,姚玉峰,孙立宁.基于中枢神经模式的四足机器人步态控制[J].机械工程学报,2010,46(7):1-6. 被引量：10
2He Zhang Yubin Liu Jie Zhao Jie Chen Jihong Yan.Development of a Bionic Hexapod Robot for Walking on Unstructured Terrain[J].Journal of Bionic Engineering,2014,11(2):176-187. 被引量：26
3王刚,张立勋,王立权.仿蟹机器人交错等相位波形步态研究[J].机器人,2011,33(2):237-243. 被引量：11
4李满宏,张建华,张小俊,张明路.基于马尔可夫决策过程的六足机器人自由步态规划[J].机器人,2015,37(5):529-537. 被引量：9
5甄伟鲲,康熙,张新生,戴建生.一种新型四足变胞爬行机器人的步态规划研究[J].机械工程学报,2016,52(11):26-33. 被引量：25
6李满宏,张明路,张建华,张小俊.基于离散化的六足机器人自由步态生成算法[J].机械工程学报,2016,52(3):18-25. 被引量：9
7孟健,李贻斌,柴汇,李彬.连续不规则台阶环境四足机器人步态规划与控制[J].机器人,2015,37(1):85-93. 被引量：13
8XU Yilin,GAO Feng,PAN Yang,CHAI Xun.Method for Six-Legged Robot Stepping on Obstacles by Indirect Force Estimation[J].Chinese Journal of Mechanical Engineering,2016,29(4):669-679. 被引量：16
9丁希仑,王志英,Alberto ROVETTA.六边形对称分布六腿机器人的典型步态及其运动性能分析[J].机器人,2010,32(6):759-765. 被引量：19
10张帅帅,荣学文,李贻斌,李彬.崎岖地形环境下四足机器人的静步态规划方法[J].吉林大学学报（工学版）,2016,46(4):1287-1296. 被引量：17

二级参考文献121

1黄麟,韩宝玲,罗庆生,徐嘉.仿生六足机器人步态规划策略实验研究[J].华中科技大学学报（自然科学版）,2007,35(12):72-75. 被引量：20
2田娜,丁希仑,戴建生.一种新型的变结构轮/腿式探测车机构设计与分析[J].机械设计与研究,2004,20(z1):268-270. 被引量：14
3Qi Deng, Shigang Wang, Qinghua Liang, Jinqiu Mo School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai 200240 P. R. China.The Effect of Body Pitching on Leg-Spring Behavior in Quadruped Running[J].Journal of Bionic Engineering,2010,7(3):219-227. 被引量：4
4丁希仑,徐坤.一种新型变结构轮腿式机器人的设计与分析[J].中南大学学报（自然科学版）,2009,40(S1):91-101. 被引量：26
5XU Kun,DING Xilun.Typical Gait Analysis of a Six-legged Robot in the Context of Metamorphic Mechanism Theory[J].Chinese Journal of Mechanical Engineering,2013,26(4):771-783. 被引量：14
6潘少鹏,施家栋,王建中,盛沙.基于重心侧向摆动的四足机器人爬行步态优化[J].机械科学与技术,2015,34(6):821-826. 被引量：7
7戴建生,丁希仑,邹慧君.变胞原理和变胞机构类型[J].机械工程学报,2005,41(6):7-12. 被引量：98
8王新杰,李培根,陈学东,陈宏娟.四足步行机器人关节位姿和稳定性研究[J].中国机械工程,2005,16(17):1561-1566. 被引量：17
9卢振利,马书根,李斌,王越超.基于循环抑制CPG模型的蛇形机器人控制器[J].机械工程学报,2006,42(5):137-143. 被引量：10
10韩宝玲,王秋丽,罗庆生.六足仿生步行机器人足端工作空间和灵活度研究[J].机械设计与研究,2006,22(4):10-12. 被引量：22

共引文献149

1任冠佼,陈伟海,陈斌,王建华.基于双四杆机构的蟑螂机器人设计与分析[J].机械工程学报,2011,47(11):14-22. 被引量：7
2徐坤,丁希仑,李可佳.圆周对称分布六腿机器人三种典型行走步态步长及稳定性分析[J].机器人,2012,34(2):231-241. 被引量：21
3王颖,张定国.基于中枢模式发生器控制的电刺激步行康复系统设计与实验[J].中国生物医学工程学报,2012,31(4):558-565. 被引量：2
4孙玉香,曹会彬,冯勇,葛运建.具有拨土功能的轮腿一体化机器人结构设计[J].智能系统学报,2012,7(5):409-413.
5王立权,王海龙,陈曦.仿蟹机器人行走稳定性判定方法[J].高技术通讯,2013,23(2):167-173. 被引量：6
6张晓冬,李建桥,邹猛,张锐,李因武.中华绒螯蟹平面运动三维观测和动力学分析[J].农业工程学报,2013,29(17):30-37. 被引量：3
7刘冬琛,王军政,汪首坤,彭辉.基于速度矢量的电动并联式轮足机器人全方位步态切换方法[J].机械工程学报,2019,55(1):17-24. 被引量：5
8王汝贵,袁吉伟,戴建生.仿生爬树机器人髋关节运动精度可靠性分析与优化[J].机械设计与研究,2019,35(1):53-60. 被引量：12
9XU Kun,DING Xilun.Gait Analysis of a Radial Symmetrical Hexapod Robot Based on Parallel Mechanisms[J].Chinese Journal of Mechanical Engineering,2014,27(5):867-879. 被引量：7
10胡重阳,梅涛,刘彦伟,吴晅,张勇杰,孙少明.仿生六足机器人机构设计及控制方法研究[J].机械科学与技术,2014,33(11):1621-1626. 被引量：9

同被引文献91

1岑海堂,陈五一.仿生学概念及其演变[J].机械设计,2007,24(7):1-2. 被引量：43
2孙宇,项志宇,刘济林.未知室外环境下移动机器人的三维场景重建[J].浙江大学学报（工学版）,2007,41(12):1949-1954. 被引量：8
3毛勇,李实,王家廞,贾培发,杨泽红,丘振.基于再励学习的被动动态步行机器人[J].清华大学学报（自然科学版）,2008,48(1):92-96. 被引量：6
4蒋晋东,郭伟,查富生,李满天,孙立宁,王东岩.六足生物的反射运动机理实验研究[J].制造业自动化,2009,31(9):14-17. 被引量：1
5郭丽峰,陈恳,赵旦谱,吴丹,刘宗政,宾洋.一种轮腿式变结构移动机器人研究[J].制造业自动化,2009,31(10):1-6. 被引量：20
6张铭钧,刘晓白,徐建安,储定慧,闫娜.海龟柔性前肢仿生推进研究[J].机器人,2011,33(2):229-236. 被引量：10
7丁良宏,王润孝,冯华山,李军.浅析BigDog四足机器人[J].中国机械工程,2012,23(5):505-514. 被引量：76
8蔡鹤皋.机器人将是21世纪技术发展的热点[J].中国机械工程,2000,11(1):58-60. 被引量：43
9李子乐.草坪在城市园林绿化中的作用[J].现代园艺,2012,35(20):180-180. 被引量：5
10曾锦锋,陈晨,杨蒙爱.基于阿克曼转向原理的四轮转向机构设计[J].轻工机械,2013,31(3):13-16. 被引量：32

引证文献12

1王伟,储泽楠.六足机器人的步态规划研究[J].计算机时代,2019,0(12):8-11. 被引量：3
2余丽娟,傅汇乔,胡勇,谢晓轩.基于深度学习的六足机器人梅花桩行走步态研究[J].科技视界,2020,0(8):60-62.
3王修文,汪首坤,王军政,陈志华,徐康,刘道和.基于异形Stewart平台的电动并联式六轮足机器人[J].机械工程学报,2020,56(13):84-92. 被引量：14
4朱晓庆,陈璐,冉登宇,钱义肇,王明超,别桐.基于奖励引导的六足机器人自主步态学习[J].北京工业大学学报,2021,47(2):120-126. 被引量：2
5祝志芳,郭小龙,熊高翔,曾宇露,王欢.基于仿生学的草坪落叶清理装置的设计与试制[J].南昌工程学院学报,2021,40(1):72-76.
6张明路,王哲,李满宏,张建华,陈俊杰.基于足端位置的六足机器人漫游地形感知与表征[J].机械工程学报,2021,57(19):48-60. 被引量：6
7丛佩超,冯新杰,刘俊杰.一种低驱动自由度高越障能力的轮腿式机器人设计[J].机械设计,2021,38(12):89-97. 被引量：5
8丁杨,张明路,焦鑫,李满宏.关节电机驱动六足机器人仿生结构设计与柔顺运动控制[J].工程设计学报,2023,30(2):154-163. 被引量：10
9余善好.基于线性组合函数的移动机器人步态PID控制方法[J].齐齐哈尔大学学报（自然科学版）,2023,39(5):14-19. 被引量：1
10芮宏斌,王天赐,厍龙林,段凯文,李耒,郭旋,彭家璇.受海龟爬行与山羊行走启发的四足仿生移动机器人多步态规划及动力学分析[J].工程设计学报,2024,31(3):309-318. 被引量：1

二级引证文献42

1侯泽宇,李明骐,马祎萌,赵俊敏,李红双.一种仿生螳螂救援机器人设计[J].机械设计,2023,40(S02):77-81. 被引量：2
2余丽娟,傅汇乔,胡勇,谢晓轩.基于深度学习的六足机器人梅花桩行走步态研究[J].科技视界,2020,0(8):60-62.
3白裕,冀强,高旭杰.基于TRIZ理论的六足机器人优化设计与研究[J].内蒙古工业大学学报（自然科学版）,2020,39(3):192-199. 被引量：5
4包泽仁,王立涛,赖炜亮,吴灿宏,谢为雄.基于MALTLAB的四自由度机械腿运动特性分析[J].广州航海学院学报,2020,28(4):59-63. 被引量：1
5李君科.半轮足式机器人的设计及研究[J].现代电子技术,2021,44(18):172-176. 被引量：3
6雷涛,徐康,汪首坤,王军政,刘冬琛,刘鹏涛.并联六轮腿机器人机身平稳性控制方法研究[J].机械工程学报,2021,57(21):34-44. 被引量：8
7丛佩超,冯新杰,刘俊杰.一种低驱动自由度高越障能力的轮腿式机器人设计[J].机械设计,2021,38(12):89-97. 被引量：5
8王雨佳,夏宏博.基于嵌入式的教育机器人设计[J].自动化与仪器仪表,2022(2):120-124. 被引量：1
9刘科,冯立艳,蔡玉强.球磨机盖开闭机器人设计[J].南方农机,2022,53(7):118-122. 被引量：1
10王春臻,李瑞琴,柴超,王志浩,樊文龙.混联双平台错动式六足机器人步态分析及轨迹规划[J].机械传动,2023,47(4):90-97. 被引量：4

1邱立新.倾听,那是岁月的风口[J].中国火炬,2019,0(2):54-54.
2柳景博,赵佳慧,罗志强.多跳HF无线电信号海平面反射模型[J].电子世界,2019,0(5):29-29.
3熊一帆,曹雏清,周克栋.六足机器人爬楼步态与仿真[J].兵工自动化,2019,38(3):74-79. 被引量：2
4苏天辰.浅析加强网络空间国防建设的战略意义[J].法制博览,2017(33):246-246. 被引量：2
5刘汉迪,贾文川.基于CPG的四足机器人运动控制[J].计量与测试技术,2017,44(9):113-115. 被引量：2
6蒋儒浩,王玉琳,刘冀,徐清遥.空间四足爬行机器人设计及步态规划[J].组合机床与自动化加工技术,2019(4):1-5. 被引量：6
7丁宇,杜玉晓,黄修平,卢冠雄,曾春苗,王洽蓬,牛浩阳.预规划的实时步态控制算法[J].自动化与信息工程,2019,40(1):30-33.
8李艳萍,马荣慧,石群,黄莉,孟亚萍,王琛雅.多功能肌力训练辅具在老年脑卒中偏瘫患者早期康复中的应用[J].中西医结合心血管病电子杂志,2019,7(12):28-29. 被引量：3
9成军强,张羽,于晓东,于磊,梁小强.出口印度非对称空气弹簧的研制[J].铁道车辆,2019,57(3):23-26.
10杨缨.舰船大数据网络干扰信息高效识别方法[J].舰船科学技术,2019,41(6):142-144. 被引量：1

机械工程学报

2019年第5期

浏览历史

内容加载中请稍等...

基于增强学习的六足机器人自由步态规划被引量：12

参考文献12

二级参考文献121

共引文献149

同被引文献91

引证文献12

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于增强学习的六足机器人自由步态规划 被引量：12

参考文献12

二级参考文献121

共引文献149

同被引文献91

引证文献12

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于增强学习的六足机器人自由步态规划被引量：12