-
题名基于深度强化学习的导弹规避决策训练研究
被引量:8
- 1
-
-
作者
范鑫磊
李栋
张尉
王景志
郭金文
-
机构
光电控制技术重点实验室
中国航空工业集团公司洛阳电光设备研究所
陆军装备部航空军事代表局驻洛阳地区航空军事代表室
中航工业沈阳飞机设计研究所
中国人民解放军
-
出处
《电光与控制》
CSCD
北大核心
2021年第1期81-85,共5页
-
基金
航空科学基金(2019ZC013004)。
-
文摘
针对载机面对敌方来袭导弹自主规避问题,采取一种基于改进的DDPG算法的深度强化学习方法进行训练学习,在奖励函数中,除考虑规避性能外,还分别针对本机的高度保持、速度保持,以及来袭导弹的相对高度变化、接近速度变化建立奖励模型。最后,基于飞机模型进行了训练仿真测试分析,通过仿真可以看出,训练所得结果可以有效实现针对来袭导弹的规避决策,所设计的奖励函数和输入参数也可以起到相应正确的作用,并且结果具备一定的泛化能力。
-
关键词
导弹
自主规避决策
改进的DDPG算法
训练仿真测试
-
Keywords
missile
autonomous evasion decision-making
improved DDPG algorithm
training simulation test
-
分类号
V37
[航空宇航科学与技术—航空宇航推进理论与工程]
-