期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合三支多属性决策与SAC的兵棋推演智能决策技术 被引量:2
1
作者 彭莉莎 孙宇祥 +1 位作者 薛宇凡 周献中 《系统工程与电子技术》 EI CSCD 北大核心 2024年第7期2310-2322,共13页
近年来,将深度强化学习技术用于兵棋推演的智能对抗策略生成受到广泛关注。针对强化学习决策模型采样率低、训练收敛慢以及智能体博弈胜率低的问题,提出一种融合三支多属性决策(three-way multiple attribute decision making,TWMADM)... 近年来,将深度强化学习技术用于兵棋推演的智能对抗策略生成受到广泛关注。针对强化学习决策模型采样率低、训练收敛慢以及智能体博弈胜率低的问题,提出一种融合三支多属性决策(three-way multiple attribute decision making,TWMADM)与强化学习的智能决策技术。基于经典软表演者-批评家(soft actor-critic,SAC)算法开发兵棋智能体,利用TWMADM方法评估对方算子的威胁情况,并将该威胁评估结果以先验知识的形式引入到SAC算法中规划战术决策。在典型兵棋推演系统中开展博弈对抗实验,结果显示所提算法可有效加快训练收敛速度,提升智能体的对抗策略生成效率和博弈胜率。 展开更多
关键词 兵棋推演 三支多属性决策 软表演者-批评家 强化学习 智能决策
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部