基于多目标优化与强化学习的空战机动决策被引量：21

Maneuvering decision in air combat based on multi-objective optimization and reinforcement learning

在线阅读下载PDF

导出

摘要为了解决无人机自主空战中的机动决策问题,提出了一种将优化思想与机器学习相结合的机动决策模型。采用多目标优化方法作为决策模型核心,既解决了传统优化方法需要为多个优化目标设置权重的困难,又提高了决策模型的可拓展性;同时在多目标优化的基础上通过强化学习方法训练评价网络进行辅助决策,解决了决策模型在对抗时博弈性不足的缺点。为了测试决策模型的性能,以近距空战为背景,设计了3组仿真实验分别验证多目标优化方法的可行性、辅助决策网络的有效性以及决策模型的总体性能,仿真结果表明,决策模型可以对有机动的敌机进行有效的实时机动对抗。 To solve the problem of maneuvering decision in the autonomous air combat of unmanned com- bat aerial vehicle,the existing research achievements are analyzed and a maneuvering decision model that combines optimization idea with machine learning is proposed.The multi-objective optimization method is used as the core of decision model,which solves the problem of setting weight for multiple optimization targets and" improves the extensibility of decision model.On the basis of multi-objective optimization,an evaluation net- work is trained by reinforcement learning and used for auxiliary decision-making to enhance the antagonism of decision model.In order to test the performance of decision model,with the background of short-range air combat,three simulation experiments are designed to test the feasibility of multi-objective optimization meth- od,the effectiveness of auxiliary decision network and the overall performance of decision model.The simula- tion results show that the maneuvering decision model can be used in real-time confrontation with the maneuve- ring enemy aircraft.

作者杜海文崔明朗韩统魏政磊唐传林田野 DU Haiwen;CUI Minglang;HAN Tong;WEI Zhenglei;TANG Chuanlin;TIAN Ye(College of Aeronautics and Astronautics,Air Force Engineering University,Xi'an 710038,China;Unit94782of PLA,Hangzhou 310004,China;College of Physics and Information Engineering,Fuzhou University,Fuzhou 350108,China)

机构地区空军工程大学航空工程学院 [ 福州大学物理与信息工程学院

出处《北京航空航天大学学报》 EI CAS CSCD 北大核心 2018年第11期2247-2256,共10页 Journal of Beijing University of Aeronautics and Astronautics

基金国家自然科学基金(61601505) 陕西省自然科学基金(2017JM6078)~~

关键词自主空战机动决策多目标优化强化学习神经网络 autonomous air combat maneuvering decision multi-objective optimization reinforcement learning neural network

分类号 V279 [航空宇航科学与技术—飞行器设计]

作者简介通信作者.杜海文,男,硕士,教授,硕士生导师。主要研究方向:机载武器系统应用工程,E—mail:18191856512@163.com;崔明朗,男,硕士研究生。主要研究方向:无人飞行器武器作战系统与技术;韩统,男,博士,副教授,硕士生导师。主要研究方向:机载武器系统应用工程。

引文网络
相关文献

参考文献12

1HUANG Changqiang,DONG Kangsheng,HUANG Hanqiao,TANG Shangqin,ZHANG Zhuoran.Autonomous air combat maneuver decision using Bayesian inference and moving horizon optimization[J].Journal of Systems Engineering and Electronics,2018,29(1):86-97. 被引量：61
2马耀飞,龚光红,彭晓源.基于强化学习的航空兵认知行为模型[J].北京航空航天大学学报,2010,36(4):379-383. 被引量：14
3朱可钦,董彦非.空战机动动作库设计方式研究[J].航空计算技术,2001,31(4):50-52. 被引量：27
4左家亮,杨任农,张滢,李中林,邬蒙.基于启发式强化学习的空战机动智能决策[J].航空学报,2017,38(10):212-225. 被引量：55
5张彬超,寇雅楠,邬蒙,左家亮.基于深度置信网络的近距空战态势评估[J].北京航空航天大学学报,2017,43(7):1450-1459. 被引量：21
6冯超,景小宁,李秋妮,姚鹏.基于隐马尔可夫模型的空战决策点理论研究[J].北京航空航天大学学报,2017,43(3):615-626. 被引量：12
7钟友武,柳嘉润,杨凌宇,申功璋.自主近距空战中机动动作库及其综合控制系统[J].航空学报,2008,29(B05):114-121. 被引量：24
8钟友武,柳嘉润,申功璋.自主近距空战中敌机的战术动作识别方法[J].北京航空航天大学学报,2007,33(9):1056-1059. 被引量：13
9张涛,于雷,周中良,王琳.基于混合算法的空战机动决策[J].系统工程与电子技术,2013,35(7):1445-1450. 被引量：29
10黄长强,唐上钦.从“阿法狗”到“阿法鹰”——论无人作战飞机智能自主空战技术[J].指挥与控制学报,2016,2(3):261-264. 被引量：19

二级参考文献75

1傅莉,王晓光.无人战机近距空战微分对策建模研究[J].兵工学报,2012,33(10):1210-1216. 被引量：20
2谢川,倪世宏,张宗麟,王彦鸿.一种基于知识的特技飞行动作快速识别方法[J].计算机工程,2004,30(12):116-118. 被引量：16
3王向华,覃征,刘宇,史哲文.径向基神经网络解决威胁排序问题[J].系统仿真学报,2004,16(7):1576-1579. 被引量：30
4梁学政.双机空战的仿真与分析[J].火力与指挥控制,1994,19(4):8-15. 被引量：7
5柳嘉润,申功璋.基于逆动力学和在线参数辨识的飞机姿态控制[J].北京航空航天大学学报,2005,31(2):111-115. 被引量：9
6杨俊,谢寿生.基于模糊支持向量机的飞机飞行动作识别[J].航空学报,2005,26(6):738-742. 被引量：26
7史建国,高晓光,李相民.基于离散模糊动态贝叶斯网络的空战态势评估及仿真[J].系统仿真学报,2006,18(5):1093-1096. 被引量：29
8王宏伦.多机空战模拟系统研究[M].西安:西北工业大学,1995..
9朱宝鎏朱荣昌等.作战飞机效能评估[M].北京:航空工业出版社,1993..
10[6]Austin F.. Automated maneuvering decisions for air-to-air combat[J]. AIAA Paper 87-2393, 1987, 659-669.

共引文献233

1张涛,余利,姚剑峰,冯朕,郭玥彤.基于改进多目标差分灰狼算法的配电网无功优化[J].信息与控制,2020,49(1):78-86. 被引量：21
2李传良,童奇,王超哲,许丹丹,杨安元,黄鹤松,尚海龙,李韬锐.目标机飞行参数对面源红外诱饵干扰效能影响[J].红外与激光工程,2020,49(S01):128-136. 被引量：2
3董一群,艾剑良.自主空战技术中的机动决策:进展与展望[J].航空学报,2020(S02):4-12. 被引量：14
4傅莉,王晓光.无人战机近距空战微分对策建模研究[J].兵工学报,2012,33(10):1210-1216. 被引量：20
5李世鹏,高正红.飞机机动指令生成器设计及蛇形机动仿真[J].飞行力学,2005,23(2):19-22. 被引量：10
6李世鹏,高正红.飞机空战仿真中机动指令生成器设计[J].西北工业大学学报,2005,23(4):448-451. 被引量：6
7梁鸿飞,范广才,董彦非.空战战法训练系统目标机飞行轨迹实现[J].计算机仿真,2005,22(12):32-34. 被引量：5
8董彦非,汪凯.对抗性智能空战目标机设计与实现[J].飞行力学,2006,24(2):13-17. 被引量：1
9钟友武,柳嘉润,申功璋.自主近距空战中敌机的战术动作识别方法[J].北京航空航天大学学报,2007,33(9):1056-1059. 被引量：13
10钟友武,柳嘉润,杨凌宇,申功璋.自主近距空战中机动动作库及其综合控制系统[J].航空学报,2008,29(B05):114-121. 被引量：24

同被引文献157

1张彦铎,闵锋.基于人工神经网络的强化学习在机器人足球中的应用[J].哈尔滨工业大学学报,2004,36(7):859-861. 被引量：7
2林海.能量法及其试飞方法研究[J].飞行力学,1993,11(4):63-68. 被引量：2
3孙成智,陈关龙,林忠钦,张卫刚.基于数值模拟的变压边力优化设计[J].上海交通大学学报,2004,38(7):1086-1090. 被引量：12
4周志强,赵国锋.飞机能量机动性及其计算[J].飞行力学,1995,13(1):33-37. 被引量：2
5赵志忠,高正红,刘行伟,赵富成.用攻击点推移速率评估一对一超视距空战效能[J].系统仿真学报,2005,17(12):2855-2857. 被引量：6
6徐勇凌.收敛转弯试飞方法评述[J].飞行力学,1996,14(4):73-77. 被引量：1
7王美仙,李明,张子军.飞行器控制律设计方法发展综述[J].飞行力学,2007,25(2):1-4. 被引量：29
8李建勋,佟明安,金德琨.协商微分对策理论及其在多机空战分析中的应用[J].系统工程理论与实践,1997,17(6):68-72. 被引量：14
9Zhong Lin,Tong Ming'an,Zhong Wei,Zhang Shengyun.Sequential maneuvering decisions based on multi-stage influence diagram in air combat[J].Journal of Systems Engineering and Electronics,2007,18(3):551-555. 被引量：7
10柳嘉润,钟友武,张磊,申功璋.自主空战决策的试探机动方法及仿真研究[J].系统仿真学报,2008,20(5):1238-1242. 被引量：5

引证文献21

1韩统,崔明朗,张伟,陈国明,王骁飞.多无人机协同空战机动决策[J].兵器装备工程学报,2020,41(4):117-123. 被引量：14
2张新艳,郭鹏,余建波.应用深度强化学习的压边力优化控制[J].哈尔滨工业大学学报,2020,52(7):20-28. 被引量：5
3陈斌,王江,王阳.战斗机嵌入式训练系统中的智能虚拟陪练[J].航空学报,2020,41(6):359-373. 被引量：13
4嵇慧明,余敏建,乔新航,杨海燕,张帅文.改进BAS-TIMS算法在空战机动决策中的应用[J].国防科技大学学报,2020,42(4):123-133. 被引量：8
5张宏鹏,黄长强,轩永波,唐上钦.基于深度神经网络的无人作战飞机自主空战机动决策[J].兵工学报,2020,41(8):1613-1622. 被引量：24
6李樾,韩维,仲维国.有人机/无人机协同系统航迹控制关键技术浅析[J].无人系统技术,2020,3(4):22-28. 被引量：6
7魏焕新,张宏国.深度神经网络结合蚁群算法的躲避攻击多目标对抗方法[J].计算机应用与软件,2020,37(11):292-298. 被引量：2
8张宏鹏,黄长强,唐上钦,轩永波.基于卷积神经网络的无人作战飞机飞行轨迹实时预测[J].兵工学报,2020,41(9):1894-1903. 被引量：23
9谢建峰,杨啟明,戴树岭,王婉扬,张建东.基于强化遗传算法的无人机空战机动决策研究[J].西北工业大学学报,2020,38(6):1330-1338. 被引量：13
10王杰,丁达理,陈诚,洪杰峰.导弹攻击状态评估下的UCAV试探机动决策[J].哈尔滨工业大学学报,2021,53(6):118-127. 被引量：4

二级引证文献125

1王伟达,赵东阳.无人直升机空海潜跨域协同作战体系构建与应用[J].中国电子科学研究院学报,2022,17(12):1141-1146. 被引量：1
2马金毅,王灿,薛涛,艾剑良,董一群.空战格斗飞行机动数据库建立及应用[J].航空学报,2023,44(S01):39-47.
3谢建峰,杨啟明,戴树岭,王婉扬,张建东.基于强化遗传算法的无人机空战机动决策研究[J].西北工业大学学报,2020,38(6):1330-1338. 被引量：13
4王涛.火星探测陆空协同无人系统的研究发展分析[J].无人系统技术,2020,3(5):1-8. 被引量：4
5高昂,董志明,李亮,段莉,郭齐胜.面向LVC训练的蓝方虚拟实体近距空战决策建模[J].系统工程与电子技术,2021,43(6):1606-1617. 被引量：4
6吴宜珈,赖俊,陈希亮,曹雷,徐鹏.强化学习算法在超视距空战辅助决策上的应用研究[J].航空兵器,2021,28(2):55-61. 被引量：14
7周新民,吴佳晖,贾圣德,王文林.无人机空战决策技术研究进展[J].国防科技,2021,42(3):33-41. 被引量：12
8施伟,冯旸赫,程光权,黄红蓝,黄金才,刘忠,贺威.基于深度强化学习的多机协同空战方法研究[J].自动化学报,2021,47(7):1610-1623. 被引量：59
9王伟平,张尤君,董超,李秋鹏,郑策,陈焱琨,郑兵.海洋无人系统跨域协同观测技术进展[J].无人系统技术,2021,4(4):14-21. 被引量：13
10蒋磊,王龙,李十全,王大鹏,田钟炎,石峻嵘.基于正交试验的侧围外板拉延成形工艺参数优化研究[J].汽车工艺与材料,2021(9):42-50. 被引量：7

1黄长强,赵克新,韩邦杰,魏政磊.一种近似动态规划的无人机机动决策方法[J].电子与信息学报,2018,40(10):2447-2452. 被引量：33
2丁林静,杨啟明.基于强化学习的无人机空战机动决策[J].航空电子技术,2018,49(2):29-35. 被引量：14
3Lixin WANG,Youguang GUO,Qi ZHANG,Ting YUE.Suggestion for aircraft flying qualities requirements of a short-range air combat mission[J].Chinese Journal of Aeronautics,2017,30(3):881-897. 被引量：8
4马志强,崔黎丽,佘岚,杨峰.药学专业物理化学双语教学体系中存在的问题及对策[J].科教文汇,2018(34):40-41. 被引量：2
5刘东亮,查春林.航空兵旅作战效能评估方法研究[J].军事运筹与系统工程,2018,32(2):30-35. 被引量：7
6李居伟,谢力波,刘钧贤.反潜巡逻机使用航空自导深弹攻潜效能及方法研究[J].数字海洋与水下攻防,2018,1(2):34-37. 被引量：3
7李雯香,夏力,蒋乔峰,周游.太湖流域“一河一策”行动计划编制重点分析[J].绿色科技,2018,20(22):139-140. 被引量：2
8陆锦辉,许涛,张兴龙.SRI—VC2120RM船舶主动力监控系统研制与应用[J].中国科技成果,2018,19(21):55-56.
9阮洪.后现代主义对高职课堂有效教学的影响[J].科技视界,2018(30):168-169.
10侯芳.面向知识员工的预置群体二元式绩效评价方法[J].系统管理学报,2018,27(6):1133-1141. 被引量：5

北京航空航天大学学报

2018年第11期

浏览历史

内容加载中请稍等...

基于多目标优化与强化学习的空战机动决策被引量：21

参考文献12

二级参考文献75

共引文献233

同被引文献157

引证文献21

二级引证文献125

相关作者

相关机构

相关主题

浏览历史

基于多目标优化与强化学习的空战机动决策 被引量：21

参考文献12

二级参考文献75

共引文献233

同被引文献157

引证文献21

二级引证文献125

相关作者

相关机构

相关主题

浏览历史

基于多目标优化与强化学习的空战机动决策被引量：21