检索结果-维普期刊中文期刊服务平台

非完美信息博弈综述:对抗求解方法与对比分析被引量：1: 1; 作者余超刘宗凯 +2 位作者胡超豪黄凯奇张俊格《计算机学报》 EI CAS CSCD 北大核心 2024年第9期2211-2246,共36页; 当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模... 展开更多; 关键词非完美信息博弈遗憾最小化最佳响应在线求解强化学习; 在线阅读下载PDF 职称材料

一种融合注意力机制的德扑计算机博弈决策模型: 2; 作者张小川梁渝卓 +2 位作者彭丽蓉钱毅刘莉莉《重庆理工大学学报(自然科学)》北大核心 2025年第8期85-89,共5页; 德州扑克是一种状态空间庞大的非完美信息博弈游戏,传统的决策模型依赖于人类先验知识,为此,以深度强化学习框架为基础,在零先验知识情况下,构造了一种德州扑克AI,较好地克服了神经虚拟自博弈(neural fictitious self play)算法的泛化... 展开更多; 关键词非完美信息博弈德州扑克深度强化学习注意力机制; 在线阅读下载PDF 职称材料

一种大众麻将计算机博弈的胡牌方法研究被引量：8: 3; 作者彭丽蓉赵海璐 +2 位作者甘春晏刘洁陈俊宇《重庆理工大学学报（自然科学）》 CAS 北大核心 2021年第12期127-133,共7页; 麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法... 展开更多; 关键词计算机博弈非完美信息博弈麻将博弈胡牌方法胡牌距离; 在线阅读下载PDF 职称材料

改进深度神经网络在爱恩斯坦棋中的应用研究被引量：1: 4; 作者蔡彪徐昕怡 +1 位作者谢婷胡洋成《重庆理工大学学报（自然科学）》 CAS 北大核心 2024年第5期108-114,共7页; 爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,... 展开更多; 关键词计算机博弈非完美信息博弈爱恩斯坦棋深度神经网络; 在线阅读下载PDF 职称材料

题名非完美信息博弈综述:对抗求解方法与对比分析被引量：1: 1; 作者余超刘宗凯胡超豪黄凯奇张俊格; 机构中山大学计算机学院中国科学院自动化研究所智能系统与工程研究中心; 出处《计算机学报》 EI CAS CSCD 北大核心 2024年第9期2211-2246,共36页; 基金国家自然科学基金面上项目(No.62076259) 广东省自然科学基金(No.2023A1515012946) +2 种基金中国科学院青年促进会项目资助.; 文摘当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模多智能体在私有信息下的博弈行为,能够刻画相较完美信息博弈更广泛的决策过程,在现实世界中具有广泛应用,例如金融贸易、商业谈判、军事对抗等.近年来,非完美信息博弈求解研究取得了突破性进展,涌现出以遗憾最小化(Regret Minimization)和最佳响应(Best Response)为核心技术的两大类离线求解方法.前者通过反省智能体过往决策以使自身策略向均衡点改进,成功解决了以德州扑克为代表的经典非完美信息博弈.后者通过特定应对方式针对对手决策以使自身策略向均衡点改进,在例如星际争霸、DOTA等大型实时战略游戏AI训练中发挥着关键作用.此外,一系列在线求解方法能够进一步实时优化离线算法求解所得的蓝图策略,使其在实时对局中得到进一步改进,成为求解非完美信息博弈的关键技术.本文将从非完美信息博弈的概念和特点切入,全面介绍这三类方法的基本原理、发展脉络和改进技巧,深入对比不同方法间的优缺点并展望未来研究方向.希望通过对非完美信息博弈求解这一研究领域的全方位细致梳理,能够进一步推动博弈智能技术向前发展,为迈向通用人工智能赋能.; 关键词非完美信息博弈遗憾最小化最佳响应在线求解强化学习; Keywords imperfect information game regret minimization best response safe search reinforcement learning; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名一种融合注意力机制的德扑计算机博弈决策模型: 2; 作者张小川梁渝卓彭丽蓉钱毅刘莉莉; 机构重庆理工大学两江人工智能学院重庆工业职业技术学院人工智能与大数据学院重庆理工大学人工智能系统研究所; 出处《重庆理工大学学报(自然科学)》北大核心 2025年第8期85-89,共5页; 基金国家自然科学基金项目(60443004) 重庆市技术创新与应用发展专项项目(cstc2021jscx-dxwtBX0019)。; 文摘德州扑克是一种状态空间庞大的非完美信息博弈游戏,传统的决策模型依赖于人类先验知识,为此,以深度强化学习框架为基础,在零先验知识情况下,构造了一种德州扑克AI,较好地克服了神经虚拟自博弈(neural fictitious self play)算法的泛化能力差,通过不断与其他AI进行对弈,不断更新神经网络参数、持续提升决策精度。为进一步加快模型收敛速度、提高博弈能力,再引入注意力机制,赋予对手历史下注、弃牌等博弈动作权重知识,帮助德州扑克AI更好地分析对手打牌风格。实验数据表明:在与其他AI的对战结果中,德州扑克AI在5000局对战中,击败了先验知识型AI和使用CFR算法的AI、使用NFSP算法的AI,证明本文中的德州扑克AI有效性、先进性较好。; 关键词非完美信息博弈德州扑克深度强化学习注意力机制; Keywords non-perfect information games Texas Hold’em poker deep reinforcement learning attention mechanisms; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名一种大众麻将计算机博弈的胡牌方法研究被引量：8: 3; 作者彭丽蓉赵海璐甘春晏刘洁陈俊宇; 机构重庆理工大学人工智能系统研究所重庆工业职业技术学院人工智能与大数据学院; 出处《重庆理工大学学报（自然科学）》 CAS 北大核心 2021年第12期127-133,共7页; 基金国家自然科学基金项目(60443004)。; 文摘麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法。为此,首先分析麻将的大众规则;其次,基于各种牌型和持有牌点数,提出一种胡牌距离概念,以最短胡牌距离为标准,作为玩家的决策依据;最后,依据已知公开的出牌和玩家手上牌张信息,融合先验知识后,进一步计算每种出牌行为的期望胜率,从而获得出牌行为评估值,作为玩家的决策依据。实验结果表明:利用维持最短胡牌距离为核心的快速胡牌方法,在有限牌对局数下,比如在中国计算机博弈锦标赛中此局数设定为10000局,依据设计的智能体,能取得46.85%以上的牌局胜利,该值远高于仅仅使用纯粹经验方法的数值。; 关键词计算机博弈非完美信息博弈麻将博弈胡牌方法胡牌距离; Keywords computer game imperfect-information game Mahjong hu method hu distance; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名改进深度神经网络在爱恩斯坦棋中的应用研究被引量：1: 4; 作者蔡彪徐昕怡谢婷胡洋成; 机构成都理工大学成都理工大学宜宾校区成都理工大学计算机网络与安全学院; 出处《重庆理工大学学报（自然科学）》 CAS 北大核心 2024年第5期108-114,共7页; 基金国家自然科学基金项目(2019JDR0117)。; 文摘爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,使其能精确地评估各种棋盘状态,生成有效的游戏策略。通过结合改进的残差神经网络和蒙特卡洛树搜索,提取棋局特征并进行局面评估,动态生成策略和进行决策。结合强化学习,以期望胜率为准则,通过自我对弈不断优化权重,改进策略生成效果。实验结果表明:改进的深度学习方法优于全国计算机博弈大赛冠军组算法,进一步验证了深度学习方法在爱恩斯坦棋随机性完美信息博弈中的有效性和可行性。; 关键词计算机博弈非完美信息博弈爱恩斯坦棋深度神经网络; Keywords computer games imperfect information games Einstein Chess deep neural network; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	非完美信息博弈综述:对抗求解方法与对比分析	余超刘宗凯胡超豪黄凯奇张俊格	《计算机学报》 EI CAS CSCD 北大核心	2024	1	在线阅读下载PDF 职称材料
2	一种融合注意力机制的德扑计算机博弈决策模型	张小川梁渝卓彭丽蓉钱毅刘莉莉	《重庆理工大学学报(自然科学)》北大核心	2025	0	在线阅读下载PDF 职称材料
3	一种大众麻将计算机博弈的胡牌方法研究	彭丽蓉赵海璐甘春晏刘洁陈俊宇	《重庆理工大学学报（自然科学）》 CAS 北大核心	2021	8	在线阅读下载PDF 职称材料
4	改进深度神经网络在爱恩斯坦棋中的应用研究	蔡彪徐昕怡谢婷胡洋成	《重庆理工大学学报（自然科学）》 CAS 北大核心	2024	1	在线阅读下载PDF 职称材料