期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于分层强化学习的多无人机协同围捕方法
1
作者 孙懿豪 闫超 +3 位作者 相晓嘉 唐邓清 周晗 姜杰 《控制理论与应用》 北大核心 2025年第1期96-108,共13页
针对复杂障碍环境下的动态目标围捕问题,本文提出一种基于分层强化学习的多无人机协同围捕方法.该方法包含两个层级的学习过程:底层的子策略学习和高层的子策略切换.具体而言,将协同围捕任务分解为导航避障和导航避碰两个子任务,独立学... 针对复杂障碍环境下的动态目标围捕问题,本文提出一种基于分层强化学习的多无人机协同围捕方法.该方法包含两个层级的学习过程:底层的子策略学习和高层的子策略切换.具体而言,将协同围捕任务分解为导航避障和导航避碰两个子任务,独立学习相应的底层子策略,分别赋予无人机协同围捕目标时所需的避障与避碰技能.在此基础上,设计带有切换惩罚的稀疏回报函数训练高层的子策略切换模块,避免了对人工定义规则的依赖,实现了底层技能的自动组合.数值仿真与软件在环实验结果表明,所提方法能够显著降低围捕策略的学习难度,相较于基线方法具有最高的围捕成功率. 展开更多
关键词 分层强化学习 避障 避碰 多无人机围捕
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部