-
题名基于分层强化学习的多无人机协同围捕方法
- 1
-
-
作者
孙懿豪
闫超
相晓嘉
唐邓清
周晗
姜杰
-
机构
国防科技大学智能科学学院
中国运载火箭技术研究院
-
出处
《控制理论与应用》
北大核心
2025年第1期96-108,共13页
-
基金
国家自然科学基金项目(62403240)
江苏省自然科学基金项目(BK20241396)
湖南省研究生科研创新项目(CX20240114)资助.
-
文摘
针对复杂障碍环境下的动态目标围捕问题,本文提出一种基于分层强化学习的多无人机协同围捕方法.该方法包含两个层级的学习过程:底层的子策略学习和高层的子策略切换.具体而言,将协同围捕任务分解为导航避障和导航避碰两个子任务,独立学习相应的底层子策略,分别赋予无人机协同围捕目标时所需的避障与避碰技能.在此基础上,设计带有切换惩罚的稀疏回报函数训练高层的子策略切换模块,避免了对人工定义规则的依赖,实现了底层技能的自动组合.数值仿真与软件在环实验结果表明,所提方法能够显著降低围捕策略的学习难度,相较于基线方法具有最高的围捕成功率.
-
关键词
分层强化学习
避障
避碰
多无人机围捕
-
Keywords
hierarchical reinforcement learning
obstacle avoidance
collision avoidance
multi-UAV pursuit
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
V279
[航空宇航科学与技术—飞行器设计]
-