期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
远海多智能体空中对抗深度强化学习环境模型构建
1
作者 张原 王江南 +1 位作者 王伟 李璇 《航空兵器》 北大核心 2025年第3期48-56,共9页
深度强化学习系统环境模型的优劣决定其能否高效准确地学习训练出好的决策。本文结合远海环境和多智能体空中对抗任务特点,构建了远海空中对抗多智能体深度强化学习训练环境。其中,基于JSBSim及可扩展的雷达和火控系统模型构建了兼顾实... 深度强化学习系统环境模型的优劣决定其能否高效准确地学习训练出好的决策。本文结合远海环境和多智能体空中对抗任务特点,构建了远海空中对抗多智能体深度强化学习训练环境。其中,基于JSBSim及可扩展的雷达和火控系统模型构建了兼顾实际和仿真性能的智能体模型;遴选18维状态空间和7维动作空间,构造了包含主线和10个子目标的多元奖励体系,解决了稀疏奖励引导性差、维度空间高诱使算法难以收敛等问题,并通过仿真验证了环境的合规性、对深度强化学习经典算法的有效性,以及对主流训练框架的兼容性。 展开更多
关键词 远海远域 空中对抗 多智能体 深度强化学习 JSBSim 训练环境模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部