-
题名一种半监督学习潜艇规避防御智能决策方法
被引量:2
- 1
-
-
作者
杨静
吴金平
刘剑
王永洁
董汉权
-
机构
海军潜艇学院
-
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2024年第10期3474-3487,共14页
-
文摘
潜艇水下作战行动中,受到水下弱可观测环境影响,获取的目标信息呈现稀疏特性。机动规避是潜艇水下防御的重要战术方法,现有机动规避参数仿真与优化方法在建模时不可避免引入观测误差,缺乏对态势演变的应对手段,且由于军事专家的稀缺性,获取军事专家标签的战术对抗样本代价十分昂贵。针对上述困难提出一种基于自编码与主动Q学习策略结合的半监督学习智能决策方法。通过引入对比预测编码自编码器,最大化时序输入与上下文间互信息熵,提高对稀疏时序输入的表征能力。将表征输入与主动强化学习任务相结合,降低智能体的标签需求率,提高规避决策时对环境反馈的能力。基于3 a采集的指挥员战法研练复盘数据构建上帝视角、红方视角数据集。实验结果表明:所提算法与不采用稀疏时序自编码器的算法消融实验,在完全信息、红方视角条件下决策精度分别达到98%、78%,而标签需求率仅为4%、44%;相比于经典的时序分类算法决策精度提高了14%、9%,与有监督算法相比在标签需求率降低为原来的24%~44%条件下,决策精度误差与有监督算法仅差1%,说明所提算法在保证决策精度的同时可大幅降低标签需求量,从而为少量样本条件下的军事智能决策提供一种通用的技术框架。
-
关键词
潜艇规避防御
标签稀疏
主动q学习
自编码
智能决策
-
Keywords
submarine evasion defense
sparse labels
active q-learning
self coding
intelligent decision-making
-
分类号
TJ301
[兵器科学与技术—火炮、自动武器与弹药工程]
-