期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
UAV maneuvering decision-making algorithm based on deep reinforcement learning under the guidance of expert experience
1
作者 ZHAN Guang ZHANG Kun +1 位作者 LI Ke piao haiyin 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第3期644-665,共22页
Autonomous umanned aerial vehicle(UAV) manipulation is necessary for the defense department to execute tactical missions given by commanders in the future unmanned battlefield. A large amount of research has been devo... Autonomous umanned aerial vehicle(UAV) manipulation is necessary for the defense department to execute tactical missions given by commanders in the future unmanned battlefield. A large amount of research has been devoted to improving the autonomous decision-making ability of UAV in an interactive environment, where finding the optimal maneuvering decisionmaking policy became one of the key issues for enabling the intelligence of UAV. In this paper, we propose a maneuvering decision-making algorithm for autonomous air-delivery based on deep reinforcement learning under the guidance of expert experience. Specifically, we refine the guidance towards area and guidance towards specific point tasks for the air-delivery process based on the traditional air-to-surface fire control methods.Moreover, we construct the UAV maneuvering decision-making model based on Markov decision processes(MDPs). Specifically, we present a reward shaping method for the guidance towards area and guidance towards specific point tasks using potential-based function and expert-guided advice. The proposed algorithm could accelerate the convergence of the maneuvering decision-making policy and increase the stability of the policy in terms of the output during the later stage of training process. The effectiveness of the proposed maneuvering decision-making policy is illustrated by the curves of training parameters and extensive experimental results for testing the trained policy. 展开更多
关键词 unmanned aerial vehicle(UAV) maneuvering decision-making autonomous air-delivery deep reinforcement learning reward shaping expert experience
在线阅读 下载PDF
自动化飞行训练评估中的战机机动动作识别 被引量:15
2
作者 孟光磊 张慧敏 +2 位作者 朴海音 梁宵 周铭哲 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2020年第7期1267-1274,共8页
针对战机飞行员自动化飞行训练评估对于机动动作的在线识别需求,提出了一种改进的基于动态贝叶斯网络的机动动作识别方法。首先,分析了仪表、简单特技和复杂特技飞行科目的机动动作特征。然后,根据战机飞行过程中机动动作与特征参数的... 针对战机飞行员自动化飞行训练评估对于机动动作的在线识别需求,提出了一种改进的基于动态贝叶斯网络的机动动作识别方法。首先,分析了仪表、简单特技和复杂特技飞行科目的机动动作特征。然后,根据战机飞行过程中机动动作与特征参数的因果关系,建立了机动动作识别动态贝叶斯网络模型,克服了传统方法需要滚转角信息,在实际飞行训练中难以通过雷达探测实时获取的缺点。同时,通过设计模型在线调用机制,有效降低了计算复杂度。实验结果表明,所提方法对于战机机动动作识别率高、实时性好,能够满足在线应用需求。 展开更多
关键词 机动动作识别 动态贝叶斯网络 飞行训练评估 在线识别 在线调用机制
在线阅读 下载PDF
基于协同战术识别的双机编队威胁评估方法 被引量:13
3
作者 孟光磊 周铭哲 +1 位作者 朴海音 张慧敏 《系统工程与电子技术》 EI CSCD 北大核心 2020年第10期2285-2293,共9页
双机组成编队采用协同战术攻击目标是多机协同空战的一种主要形式。针对蓝方为双机编队的超视距空战威胁评估问题,提出了一种基于协同战术识别的威胁评估方法。首先,根据双机编队协同战术的分析、双机的空间占位与机动特性信息,采用动... 双机组成编队采用协同战术攻击目标是多机协同空战的一种主要形式。针对蓝方为双机编队的超视距空战威胁评估问题,提出了一种基于协同战术识别的威胁评估方法。首先,根据双机编队协同战术的分析、双机的空间占位与机动特性信息,采用动态贝叶斯网络建立目标双机编队协同战术识别模型。然后,根据目标飞行状态信息和目标机动动作识别结果,进行目标轨迹预测。最后,综合空间占位、探测、攻击、协同战术等威胁因子,考虑目标轨迹变化对战场态势演变的影响,建立威胁评估模型。仿真结果表明,所提方法能够准确识别双机编队的协同战术,实现合理化威胁评估。 展开更多
关键词 双机编队协同战术 动态贝叶斯网络 威胁评估模型 目标轨迹预测
在线阅读 下载PDF
近距空战训练中的智能虚拟对手决策与导引方法 被引量:6
4
作者 孟光磊 刘德见 +2 位作者 周铭哲 朴海音 陈耀飞 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第6期937-949,共13页
针对近距空战训练中智能虚拟对手攻防博弈的自主决策与占位导引问题,提出了基于动态贝叶斯网络(DBN)和约束梯度法的智能虚拟对手决策和导引一体化方法。结合空间占位态势、火控攻击区和机动动作识别结果等信息,建立近距空战决策动态贝... 针对近距空战训练中智能虚拟对手攻防博弈的自主决策与占位导引问题,提出了基于动态贝叶斯网络(DBN)和约束梯度法的智能虚拟对手决策和导引一体化方法。结合空间占位态势、火控攻击区和机动动作识别结果等信息,建立近距空战决策动态贝叶斯网络模型,实现根据战场动态环境变化的占位导引指标决策。针对在线识别的各类目标机动动作,建立轨迹预测模型,实现目标轨迹的实时预测。根据占位导引指标和目标预测轨迹,考虑飞行性能约束,采用约束梯度法计算智能虚拟对手的优化占位导引量。实现了近距空战智能虚拟对手空间占位决策与导引量计算的无缝结合。近距空战仿真实验结果表明:所提方法能够实现智能虚拟对手的合理化自主决策和占位导引,克服了传统方法实现机动动作方式固化的问题,具备较好的实时性和优化性。 展开更多
关键词 空战训练 智能虚拟对手 占位导引 机动识别 轨迹预测 动态贝叶斯网络(DBN)
在线阅读 下载PDF
非完备信息下的超视距空战双机协同战术识别 被引量:5
5
作者 孟光磊 张慧敏 +1 位作者 朴海音 周铭哲 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第2期284-294,共11页
针对超视距(BVR)空战过程中,受探测装置性能限制和敌方干扰等原因,导致目标信息易缺失,从而难以实时准确地识别敌方协同空战战术的问题,提出了一种基于动态贝叶斯网络(DBN)与参数学习的超视距空战双机协同战术识别方法。分析了超视距空... 针对超视距(BVR)空战过程中,受探测装置性能限制和敌方干扰等原因,导致目标信息易缺失,从而难以实时准确地识别敌方协同空战战术的问题,提出了一种基于动态贝叶斯网络(DBN)与参数学习的超视距空战双机协同战术识别方法。分析了超视距空战条件下的双机协同战术特征,根据长机和僚机的职能分工、当前态势及机动动作,构建了识别网络模型;为提高模型对双机协同战术的识别概率,采用期望最大参数学习方法优化网络参数;基于自回归模型对缺失目标信息进行修补,提出非完备信息下的双机协同战术识别推理算法。通过开展空战对抗仿真实验,验证了双机协同战术识别方法对于非完备信息下的超视距空战双机协同战术具有较高的识别概率和较好的实时性。 展开更多
关键词 协同空战 战术识别 动态贝叶斯网络 双机协同战术 参数学习
在线阅读 下载PDF
基于深度强化学习的无人机三维场景导航方法研究
6
作者 刘伯凯 殷雪峰 +6 位作者 孙传昱 葛慧林 魏子麒 姜雨彤 朴海音 周东生 杨鑫 《图学学报》 2025年第5期1010-1017,共8页
近年来,无人机产业规模与应用需求不断扩大,实现无人机的自主化和智能化成为了行业内亟待解决的核心问题。无人机导航作为无人机自主控制领域的基础技术,已然成为无人机应用研究的重中之重。目前大多数无人机导航方法依赖于环境信息的重... 近年来,无人机产业规模与应用需求不断扩大,实现无人机的自主化和智能化成为了行业内亟待解决的核心问题。无人机导航作为无人机自主控制领域的基础技术,已然成为无人机应用研究的重中之重。目前大多数无人机导航方法依赖于环境信息的重建,消耗过多的计算和内存,无法满足日益复杂的场景与实时性要求。因此,基于深度学习卓越的表征学习能力与强化学习的自主学习决策能力,提出无人机自主导航方法,通过不断自主学习优化决策策略,更好地完成导航任务。首先构造连续性动作空间以及非稀疏性奖励函数,用来引导无人机的学习过程;并设计特征提取模块与决策模块来提高无人机感知能力和决策能力。实验结果表明,在仿真三维场景下,该算法表现出最优的导航避障性能,在所设计的三维场景下导航成功率可达到87%,平均累计奖励收敛值较同期方法提高33%,同时缩短训练时长,提高训练稳定性。 展开更多
关键词 深度强化学习 注意力机制 无人机 导航避障 三维场景
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部