期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
非完美信息博弈综述:对抗求解方法与对比分析 被引量:1
1
作者 余超 刘宗凯 +2 位作者 胡超豪 黄凯奇 张俊格 《计算机学报》 EI CAS CSCD 北大核心 2024年第9期2211-2246,共36页
当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模... 当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模多智能体在私有信息下的博弈行为,能够刻画相较完美信息博弈更广泛的决策过程,在现实世界中具有广泛应用,例如金融贸易、商业谈判、军事对抗等.近年来,非完美信息博弈求解研究取得了突破性进展,涌现出以遗憾最小化(Regret Minimization)和最佳响应(Best Response)为核心技术的两大类离线求解方法.前者通过反省智能体过往决策以使自身策略向均衡点改进,成功解决了以德州扑克为代表的经典非完美信息博弈.后者通过特定应对方式针对对手决策以使自身策略向均衡点改进,在例如星际争霸、DOTA等大型实时战略游戏AI训练中发挥着关键作用.此外,一系列在线求解方法能够进一步实时优化离线算法求解所得的蓝图策略,使其在实时对局中得到进一步改进,成为求解非完美信息博弈的关键技术.本文将从非完美信息博弈的概念和特点切入,全面介绍这三类方法的基本原理、发展脉络和改进技巧,深入对比不同方法间的优缺点并展望未来研究方向.希望通过对非完美信息博弈求解这一研究领域的全方位细致梳理,能够进一步推动博弈智能技术向前发展,为迈向通用人工智能赋能. 展开更多
关键词 完美信息博弈 遗憾最小化 最佳响应 在线求解 强化学习
在线阅读 下载PDF
一种基于不完美信息博弈的多冲突域信道分配算法 被引量:2
2
作者 戴昊峰 何世彪 +2 位作者 谭冕 郑鹏宇 张晖 《电信科学》 北大核心 2014年第5期112-119,共8页
无线网络中信道分配的好坏将极大地影响网络整体性能,为了解决和优化此问题,提出了一种基于不完美信息博弈的信道分配算法。假设网络场景为多跳Ad Hoc网络,因此对其采用多冲突域建模更符合实际。算法通过不断循环改变各用户无线电的信... 无线网络中信道分配的好坏将极大地影响网络整体性能,为了解决和优化此问题,提出了一种基于不完美信息博弈的信道分配算法。假设网络场景为多跳Ad Hoc网络,因此对其采用多冲突域建模更符合实际。算法通过不断循环改变各用户无线电的信道试图接近纳什均衡点,仿真结果表明算法能够使信道分配策略接近纳什均衡信道分配,同时相比单冲突域情况在多冲突域中更能最大化信道使用率。 展开更多
关键词 无线AD HOC网络 信道分配 多冲突域 完美信息博弈
在线阅读 下载PDF
不完美信息博弈中对手模型的研究 被引量:2
3
作者 吴天栋 石英 《河南科技大学学报(自然科学版)》 CAS 北大核心 2019年第1期54-59,109,共7页
针对传统的显式建模方法依赖大量数据样本的问题,提出了策略自扩展算法,通过样本数据的自扩展来提高建模效率。同时,为了提高对手模型的准确度,结合隐式建模和隐式子策略建模的方法,提出了子策略发现算法。以勒杜克(Leduc)扑克博弈为实... 针对传统的显式建模方法依赖大量数据样本的问题,提出了策略自扩展算法,通过样本数据的自扩展来提高建模效率。同时,为了提高对手模型的准确度,结合隐式建模和隐式子策略建模的方法,提出了子策略发现算法。以勒杜克(Leduc)扑克博弈为实验对象,对比研究了2种传统方法和本文提出的2种算法。实验结果表明:策略自扩展算法提高了显式建模的效率和模型准确性。在利用对手弱点获取收益方面,策略自扩展算法比显式建模方法提升了84. 4%,子策略发现算法比隐式建模方法提升了128. 6%。 展开更多
关键词 完美信息博弈 对手模型 策略自扩展 隐式建模
在线阅读 下载PDF
一种融合注意力机制的德扑计算机博弈决策模型
4
作者 张小川 梁渝卓 +2 位作者 彭丽蓉 钱毅 刘莉莉 《重庆理工大学学报(自然科学)》 北大核心 2025年第8期85-89,共5页
德州扑克是一种状态空间庞大的非完美信息博弈游戏,传统的决策模型依赖于人类先验知识,为此,以深度强化学习框架为基础,在零先验知识情况下,构造了一种德州扑克AI,较好地克服了神经虚拟自博弈(neural fictitious self play)算法的泛化... 德州扑克是一种状态空间庞大的非完美信息博弈游戏,传统的决策模型依赖于人类先验知识,为此,以深度强化学习框架为基础,在零先验知识情况下,构造了一种德州扑克AI,较好地克服了神经虚拟自博弈(neural fictitious self play)算法的泛化能力差,通过不断与其他AI进行对弈,不断更新神经网络参数、持续提升决策精度。为进一步加快模型收敛速度、提高博弈能力,再引入注意力机制,赋予对手历史下注、弃牌等博弈动作权重知识,帮助德州扑克AI更好地分析对手打牌风格。实验数据表明:在与其他AI的对战结果中,德州扑克AI在5000局对战中,击败了先验知识型AI和使用CFR算法的AI、使用NFSP算法的AI,证明本文中的德州扑克AI有效性、先进性较好。 展开更多
关键词 完美信息博弈 德州扑克 深度强化学习 注意力机制
在线阅读 下载PDF
爱恩斯坦棋博弈的图神经网络算法研究
5
作者 王志明 胡洋成 +2 位作者 蔡彪 陈宣儒 李欣蕊 《重庆理工大学学报(自然科学)》 北大核心 2025年第8期111-117,共7页
目前传统卷积网络在爱恩斯坦棋中的运用已颇显成效,但存在着训练速度慢,在浅层次的卷积中无法关注到全局信息的缺点,通过改进深度学习算法和使用GNN取代卷积神经网络(CNN),发现可以显著提升模型性能。研究方法包括将爱恩斯坦棋的棋盘和... 目前传统卷积网络在爱恩斯坦棋中的运用已颇显成效,但存在着训练速度慢,在浅层次的卷积中无法关注到全局信息的缺点,通过改进深度学习算法和使用GNN取代卷积神经网络(CNN),发现可以显著提升模型性能。研究方法包括将爱恩斯坦棋的棋盘和移动规则表示为图结构,构建GNN以在较浅层次中捕捉局部与全局特征。同时结合蒙特卡洛树搜索(monte carlo tree search,MCTS),通过神经网络的策略头和价值头,提供行动决策和局势评估。实验中,将改进后的GNN算法与传统CNN算法在多轮自对弈中进行对比,结果显示,GNN在局势预测、策略控制及训练效率方面均优于CNN,随着训练次数的增加,该方法在效率提升方面表现出更显著的优势。GNN的应用提升了爱恩斯坦棋博弈模型的效率与策略能力,为进一步探索GNN在完美信息博弈中的潜在价值提供了理论支持和实践基础。 展开更多
关键词 图神经网络 爱恩斯坦棋 计算机博弈 完美信息博弈
在线阅读 下载PDF
预测信息披露制度的有效性及其选择:基于博弈的视角 被引量:7
6
作者 谢仍明 唐跃军 《南开经济研究》 CSSCI 北大核心 2013年第4期42-58,共17页
预测信息所起的作用要远远大于历史信息,而对预测信息实行强制性披露还是自愿性披露决定着企业管理层的披露行为,从而决定了投资者所获预测信息的数量和质量,最终将影响证券市场的效率。本文在对博弈报酬进行严格论证的基础上,分别建立... 预测信息所起的作用要远远大于历史信息,而对预测信息实行强制性披露还是自愿性披露决定着企业管理层的披露行为,从而决定了投资者所获预测信息的数量和质量,最终将影响证券市场的效率。本文在对博弈报酬进行严格论证的基础上,分别建立并求解了强制性预测信息披露制度和自愿性预测信息披露制度下的不完美信息博弈模型,计算并比较了两种信息披露制度下的弱完美贝叶斯纳什均衡所对应的社会福利值,从而找出了较为有效的信息披露制度。研究结果表明,强制性预测信息披露制度能打破由信息不对称所导致的恶性循环,并能对管理者构成有效的威慑。因此,强制性预测信息披露制度比自愿性预测信息披露制度更能增进社会福利,因而更为可取。 展开更多
关键词 预测信息披露 完美信息博弈 完美贝叶斯纳什均衡 社会福利
在线阅读 下载PDF
一种大众麻将计算机博弈的快速出牌方法 被引量:3
7
作者 张小川 严明珠 +2 位作者 涂飞 陈俊宇 魏乐天 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期102-107,共6页
麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何... 麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何在对弈中快速出牌就成为主要问题。针对以上问题,对出牌动作进行研究,以启发式快速出牌为思路,提出了面向敌方胡牌牌张的蒙特卡洛评估法,将启发式快速出牌方法和蒙特卡洛评估法相结合,对每张手牌进行估值计算,通过估值分数决定每轮出牌牌张。以历史出牌次数为分界点,以此分界将博弈过程时序化为前后2个决策时段,前段采用启发式快速出牌方法,后段采用蒙特卡洛评估法。通过前后时段法分层递进决策处理过程,给出最佳出牌着法,能有效减少出牌的决策时间并降低点炮率。采用所提方法的程序在中国计算机博弈锦标赛中获得了一等奖,证明了该方法的有效性。 展开更多
关键词 计算机博弈 完美信息博弈 麻将 启发式快速出牌 蒙特卡洛评估法
在线阅读 下载PDF
从信息不对称条件下的房地产市场博弈看政府的调控决策 被引量:2
8
作者 刘红军 贾玉福 陈峰云 《统计与决策》 CSSCI 北大核心 2008年第24期52-53,共2页
房地产市场的发展是一个动态变化的过程,国家政策的调控也随市场的变化而变化,文章针对房地产市场中的交易主体——开发商与购房者之间的博弈建立完全但不完美信息动态博弈模型,分析影响房地产市场健康发展的主要因素,洞悉房地产市场发... 房地产市场的发展是一个动态变化的过程,国家政策的调控也随市场的变化而变化,文章针对房地产市场中的交易主体——开发商与购房者之间的博弈建立完全但不完美信息动态博弈模型,分析影响房地产市场健康发展的主要因素,洞悉房地产市场发展的当前状态,从政府发挥调控职能的角度提出了对房地产市场健康发展的调控决策的一些建议。 展开更多
关键词 信息不对称 完美信息动态博弈 贝叶斯均衡 调控决策
在线阅读 下载PDF
期货市场的简单博弈分析 被引量:3
9
作者 刘慧宏 糜仲春 赵亚彬 《运筹与管理》 CSCD 2003年第5期85-88,共4页
本文是对多空双方各存在一个大户的简单期货市场进行博弈分析,讨论了大户和散户的博弈行为,得出在完全信息、不完全信息和不完美信息条件下的博弈情况及其均衡结果,以此为基础推出期货市场投资者结成联盟,成立投资基金是一种趋向。
关键词 期货市场 博弈分析 博弈均衡 完全信息博弈 不完全信息博弈 完美信息博弈 Harsanyi转换
在线阅读 下载PDF
一种大众麻将计算机博弈的胡牌方法研究 被引量:8
10
作者 彭丽蓉 赵海璐 +2 位作者 甘春晏 刘洁 陈俊宇 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第12期127-133,共7页
麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法... 麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法。为此,首先分析麻将的大众规则;其次,基于各种牌型和持有牌点数,提出一种胡牌距离概念,以最短胡牌距离为标准,作为玩家的决策依据;最后,依据已知公开的出牌和玩家手上牌张信息,融合先验知识后,进一步计算每种出牌行为的期望胜率,从而获得出牌行为评估值,作为玩家的决策依据。实验结果表明:利用维持最短胡牌距离为核心的快速胡牌方法,在有限牌对局数下,比如在中国计算机博弈锦标赛中此局数设定为10000局,依据设计的智能体,能取得46.85%以上的牌局胜利,该值远高于仅仅使用纯粹经验方法的数值。 展开更多
关键词 计算机博弈 完美信息博弈 麻将博弈 胡牌方法 胡牌距离
在线阅读 下载PDF
资源型产业并购重组中的博弈分析 被引量:1
11
作者 李红 史春芬 《中南大学学报(社会科学版)》 CSSCI 2011年第3期21-25,共5页
在资源紧缺的背景下,通过兼并重组来提高产业集中度,提升产品附加值,对加强资源型产业的市场竞争力及地区可持续发展能力都具有重要意义。在市场经济环境中,兼并重组可以被看作是博弈过程。为了促进企业并购,建立了以大型集团企业为并... 在资源紧缺的背景下,通过兼并重组来提高产业集中度,提升产品附加值,对加强资源型产业的市场竞争力及地区可持续发展能力都具有重要意义。在市场经济环境中,兼并重组可以被看作是博弈过程。为了促进企业并购,建立了以大型集团企业为并购方和地方骨干企业为被并购方作为主要研究对象的不完美信息动态博弈模型,对并购双方的博弈过程进行了深入的分析。结合经验发现,虽然政府参与了资源型产业的重组整合过程,但是并购主体依然有必要详细搜集对方信息,慎重选择并购方案,或者判断是否接受并购方案。经过充分博弈过程的并购,将有利于并购后的企业发展和重组整合战略的全面推广。 展开更多
关键词 资源型产业 企业并购 完美信息动态博弈 完美贝叶斯均衡 大型企业集团 地方骨干企业
在线阅读 下载PDF
城市封闭住宅小区何以开放?——一个“地方政府与业主博弈”的视角 被引量:1
12
作者 彭忠益 王艳 《党政研究》 2017年第2期99-109,共11页
在公共利益和私人利益冲突的情况下已建成的城市封闭住宅小区何以开放成为公众近期关注的热点。已有研究表明城市封闭住宅小区的开放宜采用征收路径,在具体的制度和程序设计上政府要保证民主、公平和正义;并有学者注意到政府与业主之间... 在公共利益和私人利益冲突的情况下已建成的城市封闭住宅小区何以开放成为公众近期关注的热点。已有研究表明城市封闭住宅小区的开放宜采用征收路径,在具体的制度和程序设计上政府要保证民主、公平和正义;并有学者注意到政府与业主之间的信息不畅通会影响其结果。从公共选择理论和业主组织发展的现状分析,可知地方政府与业主之间存在信息不对称的现实。运用不完美信息动态博弈探讨地方政府和业主的策略选择如何影响城市封闭住宅小区的开放,结论是:城市封闭住宅小区的开放与地方政府给予业主征收补偿的形式和数量没有直接关系,与政治型政府的不作为有很大关系;且地方政府的强制执行手段对城市封闭住宅小区的开放效果甚微。 展开更多
关键词 城市封闭住宅小区 地方政府 业主 信息不对称 完美信息动态博弈
在线阅读 下载PDF
改进深度神经网络在爱恩斯坦棋中的应用研究 被引量:1
13
作者 蔡彪 徐昕怡 +1 位作者 谢婷 胡洋成 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期108-114,共7页
爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,... 爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,使其能精确地评估各种棋盘状态,生成有效的游戏策略。通过结合改进的残差神经网络和蒙特卡洛树搜索,提取棋局特征并进行局面评估,动态生成策略和进行决策。结合强化学习,以期望胜率为准则,通过自我对弈不断优化权重,改进策略生成效果。实验结果表明:改进的深度学习方法优于全国计算机博弈大赛冠军组算法,进一步验证了深度学习方法在爱恩斯坦棋随机性完美信息博弈中的有效性和可行性。 展开更多
关键词 计算机博弈 完美信息博弈 爱恩斯坦棋 深度神经网络
在线阅读 下载PDF
一种针对德州扑克AI的对手建模与策略集成框架 被引量:7
14
作者 张蒙 李凯 +3 位作者 吴哲 臧一凡 徐航 兴军亮 《自动化学报》 EI CAS CSCD 北大核心 2022年第4期1004-1017,共14页
以德州扑克游戏为代表的大规模不完美信息博弈是现实世界中常见的一种博弈类型.现有以求解纳什均衡策略为目标的主流德州扑克求解算法存在依赖博弈树模型、算力消耗大、策略过于保守等问题,导致智能体在面对不同对手时无法最大化自身收... 以德州扑克游戏为代表的大规模不完美信息博弈是现实世界中常见的一种博弈类型.现有以求解纳什均衡策略为目标的主流德州扑克求解算法存在依赖博弈树模型、算力消耗大、策略过于保守等问题,导致智能体在面对不同对手时无法最大化自身收益.为解决上述问题,提出一种轻量高效且能快速适应对手策略变化进而剥削对手的不完美信息博弈求解框架.本框架分为智能体离线训练和在线博弈两个阶段.第1阶段基于演化学习思想训练智能体,得到能够剥削不同博弈风格对手的策略神经网络.在第2博弈阶段中,智能体在线建模并适应未知风格对手,利用种群策略集成的方法最大化剥削对手.在两人无限注德州扑克环境中的实验结果表明,本框架在面对动态对手策略时,相比已有方法能够大幅提升博弈性能. 展开更多
关键词 完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成
在线阅读 下载PDF
供应商管理库存中的道德风险分析与契约设计 被引量:2
15
作者 刘海军 陈菊红 《经济问题》 CSSCI 北大核心 2010年第3期61-64,104,共5页
分析了供应商管理库存环境下,除"双重边际效应"以外另一个导致供应链分散决策时零售商订购量下降的因素,即道德风险问题。针对道德风险,采用求解完全且完美信息动态博弈中子博弈完美纳什均衡的一般方法,即逆推归纳法设计了一... 分析了供应商管理库存环境下,除"双重边际效应"以外另一个导致供应链分散决策时零售商订购量下降的因素,即道德风险问题。针对道德风险,采用求解完全且完美信息动态博弈中子博弈完美纳什均衡的一般方法,即逆推归纳法设计了一个数量折扣契约。当参数满足一定关系时,该契约不仅可以有效消除供应商管理库存中的道德风险,而且也使供销双方期望利润实现了帕累托改进,因此该契约不仅是有效的,而且也是可执行的。 展开更多
关键词 供应商管理库存 道德风险 完全且完美信息动态博弈 契约设计
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部