深度强化学习下的管道气动软体机器人控制

Pipe pneumatic soft robot control based on deep reinforcement learning

在线阅读下载PDF

导出

摘要在复杂的管道环境中,与刚性机器人相比,软体机器人更适合执行操作任务。然而,由于具有无限自由度和非线性变形的特点,软体机器人的控制是一个较大的挑战。根据管道气动软体机器人变形方式进行动力学建模,提出一种结合预测奖励技术的深度确定性策略梯度(predictive reward-deep deterministic policy gradient,PR-DDPG)算法,将其应用于管道气动软体机器人的连续运动控制,为其动态的弯曲运动控制问题设计自主运动控制器。实验结果表明:PR-DDPG算法能够有效控制管道气动软体机器人在三维空间中进行自主连续运动,且可控制其前端到达目标点与目标方向。与深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法相比,PR-DDPG算法的收敛时间减少了约17%,奖励值提高了约20%,提高了管道气动软体机器人的连续运动控制性能。 In complex pipeline environments,soft robots are more suitable for operational tasks compared to rigid robots.However,due to their infinite degrees of freedom and nonlinear deformation characteristics,the control of soft robots posed a significant challenge.To address the dynamic bending motion control of pipe pneumatic soft,a dynamic model was developed based on their deformation characteristics,and a predictive reward-deep deterministic policy gradient(PR-DDPG)algorithm was proposed.This algorithm was applied to achieve continuous motion control,enabling the design of an autonomous motion controller for dynamic bending.The experimental results demonstrate that the PR-DDPG algorithm effectively controls the autonomous continuous motion of pipe pneumatic soft in three-dimensional space,allowing their front ends to reach target positions and orientations.Compared with the deep deterministic policy gradient(DDPG)algorithm,the convergence time of PR-DDPG is reduced by approximately 17%,and the reward value is improved by about 20%.The PR-DDPG algorithm improves the continuous motion control capabilities of pipe pneumatic soft.

作者江雨霏朱其新 JIANG Yufei;ZHU Qixin(School of Electronic and Information Engineering,Suzhou University of Science and Technology,Suzhou 215009,Jiangsu,China;School of Mechanical Engineering,Suzhou University of Science and Technology,Suzhou 215009,Jiangsu,China;Jiangsu Province Intelligent Coexisting-Cooperative-Cognitive Robot Engineering Research Center,Suzhou 215009,Jiangsu,China;Suzhou Key Laboratory of Coexisting-Cooperative-Cognitive Robot Technology,Suzhou 215009,Jiangsu,China)

机构地区苏州科技大学电子与信息工程学院苏州科技大学机械工程学院江苏省智能共融机器人工程研究中心苏州市共融机器人技术重点实验室

出处《西安工程大学学报》 2025年第2期65-74,共10页 Journal of Xi’an Polytechnic University

基金国家自然科学基金项目(51875380,62063010,51375323) 苏州市科技发展计划(关键核心技术“揭榜挂帅”)项目(SYG2024148) 苏州市科技计划(基础研究)项目(SJC2023002)。

关键词管道软体机器人运动控制深度强化学习深度确定性策略梯度算法 pipeline soft robot motion control deep reinforcement learning depth deterministic policy gradient algorithm

分类号 TH22 [机械工程—机械制造及自动化]

作者简介第一作者:江雨霏(1998-),女,硕士研究生;通信作者:朱其新(1971-),男,教授,研究方向为伺服控制、机器人、控制理论及应用。E-mail:bob21cn@163.com。

引文网络
相关文献

参考文献13

1徐健,惠楠,苏泽斌.基于BAS-PID算法的介电弹性体执行器控制研究[J].西安工程大学学报,2021,35(4):84-89. 被引量：4
2赵江波,龚思进,马世成,王军政.液压四足机器人单腿的分数阶虚拟模型控制[J].北京理工大学学报,2022,42(3):304-311. 被引量：5
3余文曌,陈晓东,徐海祥.基于事件触发的水下机器人无模型悬停控制[J].华中科技大学学报（自然科学版）,2023,51(11):30-37. 被引量：2
4陈元科,马飞越,向国菲,马丛俊,陈磊,倪辉,佃松宜.用于丝驱动连续体机器人的实用运动学研究[J].计算机应用研究,2021,38(10):3085-3088. 被引量：5
5刘文博,王韫,朵有宁,段金曦,陈星雨,李磊,刘昱辰,文力.基于柔性传感的软体机器人交互研究进展[J].机器人,2024,46(2):195-218. 被引量：4
6张艳霞,赵辉.软体机器人用柔性泵的有限元分析与工艺优化[J].机床与液压,2022,50(16):98-103. 被引量：2
7梅栋,赵鑫,唐刚强,赵春,李博,骆敏舟,王延杰.软体机器人建模与控制技术研究进展[J].机器人,2024,46(2):234-256. 被引量：7
8吴孟丽,吕东洋,林玉飞,王旭浩,陈莫.一种复合驱动并联机构的设计与运动学分析[J].机械设计,2024,41(5):121-130. 被引量：1
9刘超敏.基于机器学习的采摘机器人控制系统研究[J].农机化研究,2024,46(9):253-256. 被引量：3
10宋倩,蓝俊欢,罗富贵,李明珍.基于强化学习的智能车避障决策算法[J].电子设计工程,2024,32(12):181-186. 被引量：2

二级参考文献104

1李振璧,贾汉坤,李学洋.切换系统有限时间稳定的事件触发滑模控制[J].华中科技大学学报（自然科学版）,2020,48(2):109-114. 被引量：4
2邓中亮,刘延旭,胡恩文.天牛须搜索的锚节点布设优化算法[J].北京邮电大学学报,2019,42(6):58-63. 被引量：6
3陈少斌,蒋静坪.基于神经网络和粒子群优化算法的移动机器人动态避障路径规划[J].系统仿真技术,2006(4):192-197. 被引量：9
4谢红,王涛,沈越锋,汪旭红,何斌,程黎明.基于粒子群优化方法的同心管连续型机器人运动学算法[J].机械科学与技术,2015,34(1):1-7. 被引量：3
5郭莹,徐国华,徐筱龙,肖治琥.水下自主作业系统轨迹跟踪与动力定位[J].中国造船,2009,50(1):92-100. 被引量：5
6胡海燕,王鹏飞,孙立宁,赵勃,李满天.线驱动连续型机器人的运动学分析与仿真[J].机械工程学报,2010,46(19):1-8. 被引量：67
7宫金超,李晓明.基于粒子群优化算法的小型足球机器人路径规划[J].机电工程,2010,27(12):116-120. 被引量：10
8渠元菊,郝永平,邵伟平.单缸柱塞计量泵的参数化变型设计研究[J].组合机床与自动化加工技术,2012(4):40-43. 被引量：2
9王娟,吴宪祥,郭宝龙.基于改进粒子群优化算法的移动机器人路径规划[J].计算机工程与应用,2012,48(15):240-244. 被引量：20
10贾翠玲,徐明娜,王利利,刘海亮.基于混合细菌觅食和蚁群算法的机器人路径规划研究[J].制造业自动化,2013,35(8):65-69. 被引量：5

共引文献35

1孟超,杨昊.重复-模糊PI控制的三电平有源电力滤波器[J].计算机测量与控制,2022,30(5):97-102. 被引量：2
2王涵.动作捕捉系统在软体机械臂中的应用[J].自动化应用,2022(3):94-96.
3罗胤,常玉红,赵颖,王庆华,尤兰,姚丽娟.计及电网频率稳定的抽水蓄能电站控制策略研究[J].智慧电力,2022,50(11):97-103. 被引量：8
4王超隆,杨熙鑫,官源林.介电高弹聚合物运动轨迹跟踪控制研究[J].青岛大学学报（工程技术版）,2023,38(2):46-52. 被引量：1
5裘应驰.仿生蛇形新能源汽车自动充电装置研制[J].电子制作,2023,31(7):80-83.
6王爽,任晗,李桢,郭超,李单青,张向慧.基于绳驱动的多段柔性连续体机械臂的运动学与实验研究[J].科学技术与工程,2023,23(19):8249-8255. 被引量：3
7黄浩然,赵云伟,刘晓敏,张维懿.自供气无缆式软体执行器设计与实验[J].机床与液压,2023,51(15):122-126.
8朱晓庆,陈江涛,张思远,刘鑫源,阮晓钢.基于深度仲裁策略的四足机器人步态学习[J].北京理工大学学报,2023,43(11):1197-1204. 被引量：2
9宋玉旺,李江天,滕鹏,吴硕,张致豪,孟非.一种基于柔性腿部与主动腰部的仿猫四足机器人设计方法[J].科学技术与工程,2023,23(31):13448-13456. 被引量：3
10邱建铭.AI强化学习算法在陶瓷雕刻机器设备中的应用研究[J].自动化与仪器仪表,2023(12):192-196.

1吴昊男,李莹莹,张永刚,王雪飞.基于碳纳米材料的薄膜柔性驱动器研究进展[J].广东化工,2024,51(22):96-98.
2尹宏飞,吕跃东,宋晓娟.模块化气动软体爬行机器人的设计与分析[J].机械传动,2025,49(1):64-73.
3Evan Ackerman.波士顿动力与丰田研究院合作研究机器人[J].科技纵览,2025(1):9-9.
4张钧萍,方刚,周佳,周湛淞,牛力强.汽车覆盖件用金属板材的抗凹性能[J].锻压技术,2024,49(11):23-29.
5Xiao MA,Shen-Yi ZHAO,Zhao-Heng YIN,Wu-Jun LI.Clustered Reinforcement Learning[J].Frontiers of Computer Science,2025,19(4):43-57.
6王雄壮.基于MPC和ESO的软体执行器轨迹跟踪控制[J].数字制造科学,2024(4):272-277.
7Jiale LIAO,Keke MA,Conghui WANG,Xiong CHEN,Chunqi AI.Advances in Research of VR Treatment on Adolescent Bipolar Disorder and Brain Energy Metabolism by PET/CT[J].Medicinal Plant,2025,16(2):81-83.
8SHENWeigang.Observation of the Application Effect of Behavior Reform Incentive Theory in Hospital Management[J].外文科技期刊数据库(文摘版)医药卫生,2022(6):185-188.
9Fujing Yao,Guohui Tian,Yuhao Wang,Ning Yang.Active Object Detection Based on PPO Learning Algorithm with Decision Knowledge Guidance[J].Machine Intelligence Research,2025,22(2):386-396.
10丁希仑,陈一同,王成才,徐坤.空间机器人操作技术研究现状与展望[J].航空学报,2025,46(6):266-294.

西安工程大学学报

2025年第2期

浏览历史

内容加载中请稍等...

深度强化学习下的管道气动软体机器人控制

参考文献13

二级参考文献104

共引文献35

相关作者

相关机构

相关主题

浏览历史