期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习的无人艇集群博弈对抗
被引量:
5
1
作者
苏震
张钊
+2 位作者
陈聪
刘殿勇
梁霄
《兵器装备工程学报》
CAS
CSCD
北大核心
2022年第9期9-14,共6页
开展基于深度强化学习的无人艇集群动态博弈对抗中的协同围捕决策研究。建立受距离和相对角度影响的无人艇围捕环境模型,利用基于策略网络和双评价网络的深度强化学习方法求解围捕策略,立足协同围捕任务,基于距离和相对角度设计引导型...
开展基于深度强化学习的无人艇集群动态博弈对抗中的协同围捕决策研究。建立受距离和相对角度影响的无人艇围捕环境模型,利用基于策略网络和双评价网络的深度强化学习方法求解围捕策略,立足协同围捕任务,基于距离和相对角度设计引导型奖励函数,避免奖励稀疏。仿真结果表明,基于深度强化学习的红方无人艇集群能够对蓝方无人艇进行有效的协同围捕。研究成果可为无人艇集群博弈对抗演练提供参考。
展开更多
关键词
无人艇集群
博弈对抗
深度强化学习
协同围捕
在线阅读
下载PDF
职称材料
题名
基于深度强化学习的无人艇集群博弈对抗
被引量:
5
1
作者
苏震
张钊
陈聪
刘殿勇
梁霄
机构
珠海云洲智能科技股份有限公司工业发展部
大连海事大学船舶与海洋工程学院
出处
《兵器装备工程学报》
CAS
CSCD
北大核心
2022年第9期9-14,共6页
基金
国家自然科学基金项目(52271302)。
文摘
开展基于深度强化学习的无人艇集群动态博弈对抗中的协同围捕决策研究。建立受距离和相对角度影响的无人艇围捕环境模型,利用基于策略网络和双评价网络的深度强化学习方法求解围捕策略,立足协同围捕任务,基于距离和相对角度设计引导型奖励函数,避免奖励稀疏。仿真结果表明,基于深度强化学习的红方无人艇集群能够对蓝方无人艇进行有效的协同围捕。研究成果可为无人艇集群博弈对抗演练提供参考。
关键词
无人艇集群
博弈对抗
深度强化学习
协同围捕
Keywords
USV swarm
game confrontation
deep reinforcement learning
coordinated hunting
分类号
TP24 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习的无人艇集群博弈对抗
苏震
张钊
陈聪
刘殿勇
梁霄
《兵器装备工程学报》
CAS
CSCD
北大核心
2022
5
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部