-
题名基于MADDPG的多无人机协同任务决策
被引量:30
- 1
-
-
作者
李波
越凯强
甘志刚
高佩忻
-
机构
西北工业大学电子信息学院
-
出处
《宇航学报》
EI
CAS
CSCD
北大核心
2021年第6期757-765,共9页
-
基金
国家自然科学基金(61573285,62003267)
陕西省自然科学基金(2020JQ-220)
+1 种基金
航空科学基金(2017ZC53021)
数据链技术重点实验室开放基金(CLDL-20182101)。
-
文摘
针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。
-
关键词
无人机
任务决策
深度强化学习
策略梯度
多智能体
-
Keywords
UAV
Task decision-making
Deep reinforcement learning
Policy gradient
Multi-agent
-
分类号
TJ0114
[兵器科学与技术—兵器发射理论与技术]
-