期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
非完美信息博弈综述:对抗求解方法与对比分析 被引量:1
1
作者 余超 刘宗凯 +2 位作者 胡超豪 黄凯奇 张俊格 《计算机学报》 EI CAS CSCD 北大核心 2024年第9期2211-2246,共36页
当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模... 当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模多智能体在私有信息下的博弈行为,能够刻画相较完美信息博弈更广泛的决策过程,在现实世界中具有广泛应用,例如金融贸易、商业谈判、军事对抗等.近年来,非完美信息博弈求解研究取得了突破性进展,涌现出以遗憾最小化(Regret Minimization)和最佳响应(Best Response)为核心技术的两大类离线求解方法.前者通过反省智能体过往决策以使自身策略向均衡点改进,成功解决了以德州扑克为代表的经典非完美信息博弈.后者通过特定应对方式针对对手决策以使自身策略向均衡点改进,在例如星际争霸、DOTA等大型实时战略游戏AI训练中发挥着关键作用.此外,一系列在线求解方法能够进一步实时优化离线算法求解所得的蓝图策略,使其在实时对局中得到进一步改进,成为求解非完美信息博弈的关键技术.本文将从非完美信息博弈的概念和特点切入,全面介绍这三类方法的基本原理、发展脉络和改进技巧,深入对比不同方法间的优缺点并展望未来研究方向.希望通过对非完美信息博弈求解这一研究领域的全方位细致梳理,能够进一步推动博弈智能技术向前发展,为迈向通用人工智能赋能. 展开更多
关键词 非完美信息博弈 遗憾最小化 最佳响应 在线求解 强化学习
在线阅读 下载PDF
一种融合注意力机制的德扑计算机博弈决策模型
2
作者 张小川 梁渝卓 +2 位作者 彭丽蓉 钱毅 刘莉莉 《重庆理工大学学报(自然科学)》 北大核心 2025年第8期85-89,共5页
德州扑克是一种状态空间庞大的非完美信息博弈游戏,传统的决策模型依赖于人类先验知识,为此,以深度强化学习框架为基础,在零先验知识情况下,构造了一种德州扑克AI,较好地克服了神经虚拟自博弈(neural fictitious self play)算法的泛化... 德州扑克是一种状态空间庞大的非完美信息博弈游戏,传统的决策模型依赖于人类先验知识,为此,以深度强化学习框架为基础,在零先验知识情况下,构造了一种德州扑克AI,较好地克服了神经虚拟自博弈(neural fictitious self play)算法的泛化能力差,通过不断与其他AI进行对弈,不断更新神经网络参数、持续提升决策精度。为进一步加快模型收敛速度、提高博弈能力,再引入注意力机制,赋予对手历史下注、弃牌等博弈动作权重知识,帮助德州扑克AI更好地分析对手打牌风格。实验数据表明:在与其他AI的对战结果中,德州扑克AI在5000局对战中,击败了先验知识型AI和使用CFR算法的AI、使用NFSP算法的AI,证明本文中的德州扑克AI有效性、先进性较好。 展开更多
关键词 非完美信息博弈 德州扑克 深度强化学习 注意力机制
在线阅读 下载PDF
一种大众麻将计算机博弈的胡牌方法研究 被引量:8
3
作者 彭丽蓉 赵海璐 +2 位作者 甘春晏 刘洁 陈俊宇 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第12期127-133,共7页
麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法... 麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法。为此,首先分析麻将的大众规则;其次,基于各种牌型和持有牌点数,提出一种胡牌距离概念,以最短胡牌距离为标准,作为玩家的决策依据;最后,依据已知公开的出牌和玩家手上牌张信息,融合先验知识后,进一步计算每种出牌行为的期望胜率,从而获得出牌行为评估值,作为玩家的决策依据。实验结果表明:利用维持最短胡牌距离为核心的快速胡牌方法,在有限牌对局数下,比如在中国计算机博弈锦标赛中此局数设定为10000局,依据设计的智能体,能取得46.85%以上的牌局胜利,该值远高于仅仅使用纯粹经验方法的数值。 展开更多
关键词 计算机博弈 非完美信息博弈 麻将博弈 胡牌方法 胡牌距离
在线阅读 下载PDF
改进深度神经网络在爱恩斯坦棋中的应用研究 被引量:1
4
作者 蔡彪 徐昕怡 +1 位作者 谢婷 胡洋成 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期108-114,共7页
爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,... 爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,使其能精确地评估各种棋盘状态,生成有效的游戏策略。通过结合改进的残差神经网络和蒙特卡洛树搜索,提取棋局特征并进行局面评估,动态生成策略和进行决策。结合强化学习,以期望胜率为准则,通过自我对弈不断优化权重,改进策略生成效果。实验结果表明:改进的深度学习方法优于全国计算机博弈大赛冠军组算法,进一步验证了深度学习方法在爱恩斯坦棋随机性完美信息博弈中的有效性和可行性。 展开更多
关键词 计算机博弈 非完美信息博弈 爱恩斯坦棋 深度神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部