期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向海洋牧场资源评估的多水下机器人编队控制方法
1
作者 金兆一 宋婧菡 +5 位作者 虞逸凡 王馨 陆春 杨志庆 李智军 林远山 《大连海洋大学学报》 北大核心 2025年第2期318-329,共12页
为解决现有的编队控制方法大多依赖精确的多水下机器人运动学或者动力学模型,设计了一种基于多智能体深度确定性策略梯度(MADDPG)的多水下机器人编队控制方法。首先,将N个水下机器人划分为1个领航者和N-1个跟随者,并构建基于领航者-跟... 为解决现有的编队控制方法大多依赖精确的多水下机器人运动学或者动力学模型,设计了一种基于多智能体深度确定性策略梯度(MADDPG)的多水下机器人编队控制方法。首先,将N个水下机器人划分为1个领航者和N-1个跟随者,并构建基于领航者-跟随者架构的马尔可夫决策过程(MDP)模型,对多水下机器人的编队控制进行建模;然后,利用机器人自身的位置和速度信息及其他机器人之间的相对位置信息作为观测,并通过机器人的受力来表达其动作;最后,通过领航者与目标位置的距离、跟随者与领航者的距离、跟随者之间的距离等信息构建奖励函数,兼顾个体和系统层级的奖励。结果表明,基于该方法所习得的多水下机器人编队控制策略能够产生类似生物集群的协同运动模式,在编队稳定性和路径优化方面优于其他深度强化学习算法。研究表明,该策略无须精确的运动学或动力学建模,具备行为灵活、分布式执行能力强以及良好的泛化能力,是一种有效的多水下机器人编队控制方法。 展开更多
关键词 多水下机器 编队控制 领航者跟随者架构 深度强化学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部