期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于MADDPG的多无人机协同任务决策 被引量:30
1
作者 李波 越凯强 +1 位作者 甘志刚 高佩忻 《宇航学报》 EI CAS CSCD 北大核心 2021年第6期757-765,共9页
针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,... 针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。 展开更多
关键词 无人机 任务决策 深度强化学习 策略梯度 多智能体
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部