期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
无人机空战的竞争与双重深度强化学习机动对抗决策
被引量:
3
1
作者
欧洋
徐扬
+1 位作者
张金鹏
罗德林
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2022年第6期975-985,共11页
针对一对一无人机(unmanned aerial vehicle,UAV)空战格斗问题,提出了一种基于竞争与双重深度强化学习的机动对抗方法.建立UAV的状态转移机制和态势奖励模型,将空战态势分为4种基本类型,根据贝叶斯推理计算4种态势的概率,动态地选择不...
针对一对一无人机(unmanned aerial vehicle,UAV)空战格斗问题,提出了一种基于竞争与双重深度强化学习的机动对抗方法.建立UAV的状态转移机制和态势奖励模型,将空战态势分为4种基本类型,根据贝叶斯推理计算4种态势的概率,动态地选择不同的权重.在竞争深度Q网络(dueling-DQN)算法和双重深度Q学习网络(double-DQN)算法的基础上结合两者的优点,将网络的输出分为价值函数和优势函数两部分,并通过“双重网络”解耦动作的选择与价值的评估,提出dueling-double-DQN(DDDQN)算法,作为UAV的决策核心,提高了算法的收敛性,改善了Q值被过高估计的问题.仿真结果表明所提出的决策方法的有效性.
展开更多
关键词
无人机
空战决策
强化学习
竞争与双重网络
在线阅读
下载PDF
职称材料
题名
无人机空战的竞争与双重深度强化学习机动对抗决策
被引量:
3
1
作者
欧洋
徐扬
张金鹏
罗德林
机构
厦门大学航空航天学院
西北工业大学民航学院
西北工业大学太仓长三角研究院
中国空空导弹研究院
出处
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2022年第6期975-985,共11页
基金
国家自然科学基金(61673327)
2021年度太仓市基础研究计划项目(TC2021JC28)
+1 种基金
中央高校基本科研业务费专项(G2021KY05116)
2021年西北工业大学太仓长三角研究院产业发展引导培育项目(CY20210202)。
文摘
针对一对一无人机(unmanned aerial vehicle,UAV)空战格斗问题,提出了一种基于竞争与双重深度强化学习的机动对抗方法.建立UAV的状态转移机制和态势奖励模型,将空战态势分为4种基本类型,根据贝叶斯推理计算4种态势的概率,动态地选择不同的权重.在竞争深度Q网络(dueling-DQN)算法和双重深度Q学习网络(double-DQN)算法的基础上结合两者的优点,将网络的输出分为价值函数和优势函数两部分,并通过“双重网络”解耦动作的选择与价值的评估,提出dueling-double-DQN(DDDQN)算法,作为UAV的决策核心,提高了算法的收敛性,改善了Q值被过高估计的问题.仿真结果表明所提出的决策方法的有效性.
关键词
无人机
空战决策
强化学习
竞争与双重网络
Keywords
unmanned aerial vehicles
air combat decision
reinforcement learning
dueling-double network
分类号
V212 [航空宇航科学与技术—航空宇航推进理论与工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
无人机空战的竞争与双重深度强化学习机动对抗决策
欧洋
徐扬
张金鹏
罗德林
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2022
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部