-
题名伴随压制干扰与组网雷达功率分配的深度博弈研究
被引量:5
- 1
-
-
作者
王跃东
顾以静
梁彦
王增福
张会霞
-
机构
西北工业大学自动化学院
信息融合技术教育部重点实验室
-
出处
《雷达学报(中英文)》
EI
CSCD
北大核心
2023年第3期642-656,共15页
-
基金
国家自然科学基金(61873205)。
-
文摘
传统的组网雷达功率分配一般在干扰模型给定的情况下进行优化,而干扰机资源优化是在雷达功率分配方式给定情况下,这样的研究缺乏博弈和交互。考虑到日益严重的雷达和干扰机相互博弈的作战场景,该文提出了伴随压制干扰下组网雷达功率分配深度博弈问题,其中智能化的目标压制干扰采用深度强化学习(DRL)训练。首先在该问题中干扰机和组网雷达被映射为两个智能体,根据干扰模型和雷达检测模型建立了压制干扰下组网雷达的目标检测模型和最大化目标检测概率优化目标函数。在组网雷达智能体方面,由近端策略优化(PPO)策略网络生成雷达功率分配向量;在干扰机智能体方面,设计了混合策略网络来同时生成波束选择动作和功率分配动作;引入领域知识构建更加有效的奖励函数,目标检测模型、等功率分配策略和贪婪干扰功率分配策略3种领域知识分别用于生成组网雷达智能体和干扰机智能体的导向奖励,从而提高智能体的学习效率和性能。最后采用交替训练方法来学习两个智能体的策略网络参数。实验结果表明;当干扰机采用基于DRL的资源分配策略时,采用基于DRL的组网雷达功率分配在目标检测概率和运行速度两种指标上明显优于基于粒子群的组网雷达功率分配和基于人工鱼群的组网雷达功率分配。
-
关键词
雷达资源管理
伴随压制干扰
深度强化学习
检测概率
深度博弈
领域知识辅助学习
-
Keywords
Radar resource management
Escort suppression jamming
Deep Reinforcement Learning(DRL)
Detection probability
Deep game
Domain knowledge assisted learning
-
分类号
TN974
[电子电信—信号与信息处理]
-