期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于MADDPG的多无人战车协同突防决策方法研究
1
作者 殷宇维 王凡 +1 位作者 丁录顺 边金宁 《指挥控制与仿真》 2025年第3期40-49,共10页
针对多无人战车陆上突防作战时如何根据实时态势进行协同智能决策这一问题,结合多智能体无人战车突防作战过程建立马尔可夫(MDP)模型,并基于多智能体深度确定性策略梯度算法(Multi-agent Deep Deterministic Policy Gradient,MADDPG)提... 针对多无人战车陆上突防作战时如何根据实时态势进行协同智能决策这一问题,结合多智能体无人战车突防作战过程建立马尔可夫(MDP)模型,并基于多智能体深度确定性策略梯度算法(Multi-agent Deep Deterministic Policy Gradient,MADDPG)提出多无人战车协同突防决策方法。针对多智能体决策时智能体策略变化互相影响的问题,通过在算法的AC结构中引入自注意力机制,使每个智能体进行决策和策略评估时更加关注那些对其影响较大的智能体;并采用自注意力机制计算每个智能体的回报权值,按照每个智能体自身贡献进行回报分配,提升了战车间的协同性;最后通过在想定环境中进行实验,验证了多战车协同突防决策方法的有效性。 展开更多
关键词 深度强化学习 多无人战车协同突防 多智能体深度确定性策略梯度 自注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部