-
题名基于深度强化学习的异构智能体编队避障控制方法
- 1
-
-
作者
虞逸凡
岳圣智
徐俊
宋婧菡
林远山
-
机构
大连海洋大学信息工程学院
大连海洋大学设施渔业教育部重点实验室
-
出处
《现代电子技术》
北大核心
2024年第15期102-108,共7页
-
基金
广西重点研发计划(桂科AB23075150)
设施渔业教育部重点实验室开放课题(202219)
+1 种基金
辽宁省应用基础计划项目(2022JH2/101300187)
2023中央财政对辽宁渔业补助项目。
-
文摘
针对在编队避障控制中智能体个体的异构性和多任务的复杂性问题,提出一种基于深度强化学习的异构智能体编队避障控制方法。首先,为了克服智能体个体的异构性,详细描述了领航者和跟随者智能体各自采用的局部观测表示;其次,根据智能体的相应任务,设计了编队、避障和导航三种复合的综合奖励函数,以实现更加灵活和高效的编队避障控制;最后,设计了融合注意力机制的行动者-评论家网络,用于联合训练领航者和跟随者的运动策略,从而使智能体能够逐步优化综合策略,以应对复杂的交互信息。数值仿真实验结果显示,文中提出的方法使得智能体能有效完成各自的任务,与其他强化学习算法相比,能够更迅速、更精确地使智能体学习到最优的运动策略,并在未来应用于复杂环境中,具有潜在的前景和价值。
-
关键词
编队避障控制
异构性
多任务
领航者-跟随者
深度强化学习
综合奖励函数
注意力机制
运动策略
-
Keywords
formation obstacle avoidance control
heterogeneity
multi-tasking
leader-follower
deep reinforcement learning
composite reward function
attention mechanism
motion strategy
-
分类号
TN911.1-34
[电子电信—通信与信息系统]
TP181
[自动化与计算机技术—控制理论与控制工程]
TP183
[自动化与计算机技术—控制理论与控制工程]
-