期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合三支多属性决策与SAC的兵棋推演智能决策技术
被引量:
2
1
作者
彭莉莎
孙宇祥
+1 位作者
薛宇凡
周献中
《系统工程与电子技术》
EI
CSCD
北大核心
2024年第7期2310-2322,共13页
近年来,将深度强化学习技术用于兵棋推演的智能对抗策略生成受到广泛关注。针对强化学习决策模型采样率低、训练收敛慢以及智能体博弈胜率低的问题,提出一种融合三支多属性决策(three-way multiple attribute decision making,TWMADM)...
近年来,将深度强化学习技术用于兵棋推演的智能对抗策略生成受到广泛关注。针对强化学习决策模型采样率低、训练收敛慢以及智能体博弈胜率低的问题,提出一种融合三支多属性决策(three-way multiple attribute decision making,TWMADM)与强化学习的智能决策技术。基于经典软表演者-批评家(soft actor-critic,SAC)算法开发兵棋智能体,利用TWMADM方法评估对方算子的威胁情况,并将该威胁评估结果以先验知识的形式引入到SAC算法中规划战术决策。在典型兵棋推演系统中开展博弈对抗实验,结果显示所提算法可有效加快训练收敛速度,提升智能体的对抗策略生成效率和博弈胜率。
展开更多
关键词
兵棋推演
三支多属性决策
软表演者-批评家
强化学习
智能决策
在线阅读
下载PDF
职称材料
题名
融合三支多属性决策与SAC的兵棋推演智能决策技术
被引量:
2
1
作者
彭莉莎
孙宇祥
薛宇凡
周献中
机构
南京大学工程管理学院
浙江财经大学信息技术与人工智能学院
南京大学智能装备新技术研究中心
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2024年第7期2310-2322,共13页
基金
国家自然科学青年基金(62306135)
教育部青年基金(23YJC630156)
+1 种基金
江苏省青年基金(BK20230783)
南京大学技术创新基金(SC-2023-039)资助课题。
文摘
近年来,将深度强化学习技术用于兵棋推演的智能对抗策略生成受到广泛关注。针对强化学习决策模型采样率低、训练收敛慢以及智能体博弈胜率低的问题,提出一种融合三支多属性决策(three-way multiple attribute decision making,TWMADM)与强化学习的智能决策技术。基于经典软表演者-批评家(soft actor-critic,SAC)算法开发兵棋智能体,利用TWMADM方法评估对方算子的威胁情况,并将该威胁评估结果以先验知识的形式引入到SAC算法中规划战术决策。在典型兵棋推演系统中开展博弈对抗实验,结果显示所提算法可有效加快训练收敛速度,提升智能体的对抗策略生成效率和博弈胜率。
关键词
兵棋推演
三支多属性决策
软表演者-批评家
强化学习
智能决策
Keywords
wargame
three
-
way multiple attribute decision making(TWMADM)
soft actor
-
critic(SAC)
reinforcement learning(RL)
intelligent decision
分类号
TN95 [电子电信—信号与信息处理]
TP181 [自动化与计算机技术—控制理论与控制工程]
E91 [军事]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合三支多属性决策与SAC的兵棋推演智能决策技术
彭莉莎
孙宇祥
薛宇凡
周献中
《系统工程与电子技术》
EI
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部