期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种空中近距离多机自主博弈决策方法研究
1
作者 霍琳 王楚迪 李泽铎 《兵器装备工程学报》 北大核心 2025年第S1期193-199,共7页
针对空中近距离多机自主博弈训练过程中对手的构建以及选择问题,本文提出一种新的自主博弈决策方法以提升决策效率及性能。主要是结合优先级虚构自博弈(priority fictitious self-play,PFSP)和多智能体近端策略优化(multi-agent proxima... 针对空中近距离多机自主博弈训练过程中对手的构建以及选择问题,本文提出一种新的自主博弈决策方法以提升决策效率及性能。主要是结合优先级虚构自博弈(priority fictitious self-play,PFSP)和多智能体近端策略优化(multi-agent proximal policy optimization,MAPPO)的方法,采用F-16模型构建了高保真的2v2空中对抗场景。通过虚拟对抗场景实施了一系列对比仿真实验,结果显示,PFSP-MAPPO算法在多智能体协同决策任务中展现出卓越的策略性能,验证了所提方法的有效性与优越性。 展开更多
关键词 多智能体 协同决策 博弈对抗 自主决策 强化学习 mappo算法
在线阅读 下载PDF
基于多智能体强化学习的防空编队部署方法 被引量:2
2
作者 简泽民 申国伟 +1 位作者 刘莉 王美琪 《电光与控制》 CSCD 北大核心 2024年第12期91-97,共7页
针对防空编队智能部署方法无法同时兼顾区域掩护和目标掩护、人为制定复杂规则难以求解、算法执行效率较低的问题,提出一种基于独立多智能体近端策略优化(IN-MAPPO)的防空编队部署方法。设计独立的行动者-评论家网络,以适应火力单元的... 针对防空编队智能部署方法无法同时兼顾区域掩护和目标掩护、人为制定复杂规则难以求解、算法执行效率较低的问题,提出一种基于独立多智能体近端策略优化(IN-MAPPO)的防空编队部署方法。设计独立的行动者-评论家网络,以适应火力单元的不同角色,通过集中式价值函数和奖励函数促进火力单元协同合作完成混合部署任务,提高编队的抗击能力和整体部署性能。实验结果表明:IN-MAPPO方法能够依据智能体的角色完成混合部署任务,提高远程火力单元的抗击能力,比其他MAPPO算法减少了13.7%的训练时间;与现有智能算法相比,火力单元覆盖面积提升了4.2%,有效掩护宽度提升了12.3%,算法的执行效率提高了95.9%。 展开更多
关键词 区域掩护 目标掩护 独立参数 IN-mappo算法
在线阅读 下载PDF
基于多智能体深度强化学习的无人机路径规划 被引量:10
3
作者 司鹏搏 吴兵 +2 位作者 杨睿哲 李萌 孙艳华 《北京工业大学学报》 CAS CSCD 北大核心 2023年第4期449-458,共10页
为解决多无人机(unmanned aerial vehicle, UAV)在复杂环境下的路径规划问题,提出一个多智能体深度强化学习UAV路径规划框架.该框架首先将路径规划问题建模为部分可观测马尔可夫过程,采用近端策略优化算法将其扩展至多智能体,通过设计UA... 为解决多无人机(unmanned aerial vehicle, UAV)在复杂环境下的路径规划问题,提出一个多智能体深度强化学习UAV路径规划框架.该框架首先将路径规划问题建模为部分可观测马尔可夫过程,采用近端策略优化算法将其扩展至多智能体,通过设计UAV的状态观测空间、动作空间及奖赏函数等实现多UAV无障碍路径规划;其次,为适应UAV搭载的有限计算资源条件,进一步提出基于网络剪枝的多智能体近端策略优化(network pruning-based multi-agent proximal policy optimization, NP-MAPPO)算法,提高了训练效率.仿真结果验证了提出的多UAV路径规划框架在各参数配置下的有效性及NP-MAPPO算法在训练时间上的优越性. 展开更多
关键词 无人机(unmanned aerial vehicle UAV) 复杂环境 路径规划 马尔可夫决策过程 多智能体近端策略优化算法(multi-agent proximal policy optimization mappo) 网络剪枝(network pruning NP)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部