期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于强化学习的飞行器博弈制导方法
1
作者
倪炜霖
刘佳琪
+2 位作者
邵节
刘鹏
梁海朝
《导弹与航天运载技术(中英文)》
北大核心
2025年第1期65-72,共8页
针对飞行器与伴飞防御飞行器协同躲避拦截器攻击的主动反拦截博弈对抗问题,基于深度强化学习算法提出一种飞行器主动防御智能制导方法,该方法具有在目标飞行器机动能力不足情况下博弈成功率较高的特点。针对强化学习训练过程中的稀疏奖...
针对飞行器与伴飞防御飞行器协同躲避拦截器攻击的主动反拦截博弈对抗问题,基于深度强化学习算法提出一种飞行器主动防御智能制导方法,该方法具有在目标飞行器机动能力不足情况下博弈成功率较高的特点。针对强化学习训练过程中的稀疏奖励问题,提出了一种奖励函数塑造方法,提高了强化学习算法收敛效率和训练稳定度。最后,通过数值仿真对所提出方法的有效性进行验证,仿真结果表明,所提出的方法能够实现飞行器博弈对抗成功,且相比于传统博弈制导方法具有更高的博弈成功率。
展开更多
关键词
博弈对抗
深度强化学习
奖励函数塑造
稀疏
奖励
主动反拦截
在线阅读
下载PDF
职称材料
题名
基于强化学习的飞行器博弈制导方法
1
作者
倪炜霖
刘佳琪
邵节
刘鹏
梁海朝
机构
中山大学航空航天学院
北京航天长征飞行器研究所
出处
《导弹与航天运载技术(中英文)》
北大核心
2025年第1期65-72,共8页
基金
国家自然科学基金(No.62003375)。
文摘
针对飞行器与伴飞防御飞行器协同躲避拦截器攻击的主动反拦截博弈对抗问题,基于深度强化学习算法提出一种飞行器主动防御智能制导方法,该方法具有在目标飞行器机动能力不足情况下博弈成功率较高的特点。针对强化学习训练过程中的稀疏奖励问题,提出了一种奖励函数塑造方法,提高了强化学习算法收敛效率和训练稳定度。最后,通过数值仿真对所提出方法的有效性进行验证,仿真结果表明,所提出的方法能够实现飞行器博弈对抗成功,且相比于传统博弈制导方法具有更高的博弈成功率。
关键词
博弈对抗
深度强化学习
奖励函数塑造
稀疏
奖励
主动反拦截
Keywords
game theory
reinforcement learning
reward shaping
sparse reward
active anti-interception
分类号
V11 [航空宇航科学与技术—人机与环境工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于强化学习的飞行器博弈制导方法
倪炜霖
刘佳琪
邵节
刘鹏
梁海朝
《导弹与航天运载技术(中英文)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部