检索结果-维普期刊中文期刊服务平台

一种空中近距离多机自主博弈决策方法研究: 1; 作者霍琳王楚迪李泽铎《兵器装备工程学报》北大核心 2025年第S1期193-199,共7页; 针对空中近距离多机自主博弈训练过程中对手的构建以及选择问题,本文提出一种新的自主博弈决策方法以提升决策效率及性能。主要是结合优先级虚构自博弈(priority fictitious self-play,PFSP)和多智能体近端策略优化(multi-agent proxima... 展开更多; 关键词多智能体协同决策博弈对抗自主决策强化学习 mappo算法; 在线阅读下载PDF 职称材料

基于多智能体强化学习的防空编队部署方法被引量：2: 2; 作者简泽民申国伟 +1 位作者刘莉王美琪《电光与控制》 CSCD 北大核心 2024年第12期91-97,共7页; 针对防空编队智能部署方法无法同时兼顾区域掩护和目标掩护、人为制定复杂规则难以求解、算法执行效率较低的问题,提出一种基于独立多智能体近端策略优化(IN-MAPPO)的防空编队部署方法。设计独立的行动者-评论家网络,以适应火力单元的... 展开更多; 关键词区域掩护目标掩护独立参数 IN-mappo算法; 在线阅读下载PDF 职称材料

基于多智能体深度强化学习的无人机路径规划被引量：10: 3; 作者司鹏搏吴兵 +2 位作者杨睿哲李萌孙艳华《北京工业大学学报》 CAS CSCD 北大核心 2023年第4期449-458,共10页; 为解决多无人机(unmanned aerial vehicle, UAV)在复杂环境下的路径规划问题,提出一个多智能体深度强化学习UAV路径规划框架.该框架首先将路径规划问题建模为部分可观测马尔可夫过程,采用近端策略优化算法将其扩展至多智能体,通过设计UA... 展开更多; 关键词无人机(unmanned aerial vehicle UAV) 复杂环境路径规划马尔可夫决策过程多智能体近端策略优化算法(multi-agent proximal policy optimization mappo) 网络剪枝(network pruning NP); 在线阅读下载PDF 职称材料