期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
藏族久棋计算机博弈研究综述
1
作者 李霞丽 顾旌世 +2 位作者 高乔 张皓扬 何非凡 《重庆理工大学学报(自然科学)》 北大核心 2025年第8期90-96,共7页
藏族久棋是国家级非物质文化遗产,其博弈研究不仅能够推动人工智能的发展,也有助于促进藏棋文化的保护与传承。久棋的复杂性高于围棋,其博弈分为3个阶段,每个阶段规则不同;其动作与空间复杂度极大,给低资源高效率博弈算法研究带来挑战... 藏族久棋是国家级非物质文化遗产,其博弈研究不仅能够推动人工智能的发展,也有助于促进藏棋文化的保护与传承。久棋的复杂性高于围棋,其博弈分为3个阶段,每个阶段规则不同;其动作与空间复杂度极大,给低资源高效率博弈算法研究带来挑战。研究梳理了当前久棋博弈研究的主要算法,并分析了现有久棋AI的水平。尽管基于专家知识的算法在实际对战中表现较好,但受到专家知识匮乏的限制;而结合知识与数据的深度强化学习算法,虽然在方法上较为先进,但因硬件资源的限制,AI水平提升受限。此外还分析了现有的久棋线上对弈平台,并探讨了当前博弈研究中存在的问题,提出了未来研究的可能方向。 展开更多
关键词 计算博弈 藏族久棋 专家知识 深度强化学习
在线阅读 下载PDF
一种大众麻将计算机博弈的快速出牌方法 被引量:3
2
作者 张小川 严明珠 +2 位作者 涂飞 陈俊宇 魏乐天 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期102-107,共6页
麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何... 麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何在对弈中快速出牌就成为主要问题。针对以上问题,对出牌动作进行研究,以启发式快速出牌为思路,提出了面向敌方胡牌牌张的蒙特卡洛评估法,将启发式快速出牌方法和蒙特卡洛评估法相结合,对每张手牌进行估值计算,通过估值分数决定每轮出牌牌张。以历史出牌次数为分界点,以此分界将博弈过程时序化为前后2个决策时段,前段采用启发式快速出牌方法,后段采用蒙特卡洛评估法。通过前后时段法分层递进决策处理过程,给出最佳出牌着法,能有效减少出牌的决策时间并降低点炮率。采用所提方法的程序在中国计算机博弈锦标赛中获得了一等奖,证明了该方法的有效性。 展开更多
关键词 计算博弈 不完美信息博弈 麻将 启发式快速出牌 蒙特卡洛评估法
在线阅读 下载PDF
多航天器追逃防博弈策略的混合搜索优化方法
3
作者 黄镇垒 韩宏伟 《宇航学报》 北大核心 2025年第8期1565-1578,共14页
随着航天活动的日益频繁和持续多样化,多航天器轨道博弈问题,尤其是考虑多重角色的博弈机动问题有待深入研究。针对多航天器追逃防问题,建立了摄动动力学模型,明确追逃双方在博弈过程中的角色定义,将复杂的博弈问题拆解为轨道拦截和追... 随着航天活动的日益频繁和持续多样化,多航天器轨道博弈问题,尤其是考虑多重角色的博弈机动问题有待深入研究。针对多航天器追逃防问题,建立了摄动动力学模型,明确追逃双方在博弈过程中的角色定义,将复杂的博弈问题拆解为轨道拦截和追逃博弈两个类型的子博弈问题,据此建立回合制的序列博弈模型。针对最优博弈机动策略计算问题,提出一种动作反应搜索-蒙特卡洛树搜索嵌套式搜索的混合优化策略,避免传统算法的回合性不足与维度爆炸问题。在此基础上,提出基于相对位置矢径的机动方向剪枝策略,根据实际场景快速得到有效机动方向,显著提升算法搜索效率。最后进行多航天器追逃防的数值仿真工作,验证了算法有效性与加速策略的计算优势,分析了博弈制胜的关键因素与多星博弈机理。 展开更多
关键词 轨道拦截 追逃博弈 计算博弈 动作反应搜索(ARS) 蒙特卡洛树搜索(MCTS)
在线阅读 下载PDF
爱恩斯坦棋博弈的图神经网络算法研究
4
作者 王志明 胡洋成 +2 位作者 蔡彪 陈宣儒 李欣蕊 《重庆理工大学学报(自然科学)》 北大核心 2025年第8期111-117,共7页
目前传统卷积网络在爱恩斯坦棋中的运用已颇显成效,但存在着训练速度慢,在浅层次的卷积中无法关注到全局信息的缺点,通过改进深度学习算法和使用GNN取代卷积神经网络(CNN),发现可以显著提升模型性能。研究方法包括将爱恩斯坦棋的棋盘和... 目前传统卷积网络在爱恩斯坦棋中的运用已颇显成效,但存在着训练速度慢,在浅层次的卷积中无法关注到全局信息的缺点,通过改进深度学习算法和使用GNN取代卷积神经网络(CNN),发现可以显著提升模型性能。研究方法包括将爱恩斯坦棋的棋盘和移动规则表示为图结构,构建GNN以在较浅层次中捕捉局部与全局特征。同时结合蒙特卡洛树搜索(monte carlo tree search,MCTS),通过神经网络的策略头和价值头,提供行动决策和局势评估。实验中,将改进后的GNN算法与传统CNN算法在多轮自对弈中进行对比,结果显示,GNN在局势预测、策略控制及训练效率方面均优于CNN,随着训练次数的增加,该方法在效率提升方面表现出更显著的优势。GNN的应用提升了爱恩斯坦棋博弈模型的效率与策略能力,为进一步探索GNN在完美信息博弈中的潜在价值提供了理论支持和实践基础。 展开更多
关键词 图神经网络 爱恩斯坦棋 计算博弈 完美信息博弈
在线阅读 下载PDF
基于模型预测Stackelberg主从博弈的导弹制导律
5
作者 杜林泽 周聪 李超勇 《南京航空航天大学学报(自然科学版)》 北大核心 2025年第1期176-185,共10页
随着战术目标智能化水平和机动能力的提高,传统的以比例导引律为代表的开环制导策略已难以满足未来高机动强博弈拦截对抗的战术需求。本文基于模型预测和Stackelberg主从博弈思想,将制导对抗问题转换为博弈优化问题,从而将最优制导指令... 随着战术目标智能化水平和机动能力的提高,传统的以比例导引律为代表的开环制导策略已难以满足未来高机动强博弈拦截对抗的战术需求。本文基于模型预测和Stackelberg主从博弈思想,将制导对抗问题转换为博弈优化问题,从而将最优制导指令的生成变成博弈平衡点的快速搜索问题,并引入有效集法,兼容弹目非线性动力学模型和过程约束,可以保证博弈均衡点的有限次可达,从而保证了指令的实时性。仿真结果表明,与传统制导律相比,本制导律能显著提高在强博弈场景下的拦截精度与成功率。 展开更多
关键词 模型预测控制 STACKELBERG博弈 有效集 计算博弈 末制导律
在线阅读 下载PDF
人水关系的博弈作用机理及计算方法
6
作者 毛翠翠 左其亭 《水电能源科学》 北大核心 2013年第9期155-158,共4页
基于人水关系的国内外博弈论研究现状,通过分析人文系统和水系统的相互作用及博弈论的原理和内涵,从博弈构成要素及博弈类型两方面深入探讨了人水关系的博弈作用机理。在此基础上,提出了人水关系的博弈计算方法及应用思路,主要包括人水... 基于人水关系的国内外博弈论研究现状,通过分析人文系统和水系统的相互作用及博弈论的原理和内涵,从博弈构成要素及博弈类型两方面深入探讨了人水关系的博弈作用机理。在此基础上,提出了人水关系的博弈计算方法及应用思路,主要包括人水博弈策略集合的确定及各个决策的定量化转换、人水博弈支付函数的构建及函数变量计算的思考方向、人水博弈均衡计算的目标及均衡解的求解。为以后的人水关系作用机理及定量化研究奠定了基础。 展开更多
关键词 人水关系 博弈 作用机理 人水博弈 博弈计算
在线阅读 下载PDF
防范秘密攻击的安全计算的博弈论实现 被引量:3
7
作者 罗喜召 钱陪德 +1 位作者 朱艳琴 刘建伟 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2012年第1期70-74,共5页
在博弈论中,惩罚博弈模拟了参与者试图欺骗但又不想被抓住,即安全计算中秘密攻击者的情形。针对密码学的计算博弈模型,本文对Halpern与Rafael提出的能否在计算具有成本的惩罚博弈与具有一定威慑度的防范秘密攻击的安全计算之间建立联系... 在博弈论中,惩罚博弈模拟了参与者试图欺骗但又不想被抓住,即安全计算中秘密攻击者的情形。针对密码学的计算博弈模型,本文对Halpern与Rafael提出的能否在计算具有成本的惩罚博弈与具有一定威慑度的防范秘密攻击的安全计算之间建立联系的问题给出肯定的回答,提出威慑度为1/2的防范秘密攻击的安全是计算博弈中错误可忽略的调解人的通用实现。 展开更多
关键词 纳什均衡 安全计算 通用实现 计算博弈
在线阅读 下载PDF
计算机博弈竞赛与创新人才培养模式改革 被引量:16
8
作者 王亚杰 邱虹坤 +2 位作者 尹航 徐晗 张洁 《实验技术与管理》 CAS 北大核心 2016年第10期10-14,共5页
介绍了计算机博弈在国内外的发展情况,以及计算机博弈竞赛在国内的发展与改革、意义和特点;提出了基于计算机博弈的寓教于乐、寓教于研、以研促教、以赛促学的创新人才培养模式,论述了计算机博弈既是深受师生喜爱的科教项目、也是培养... 介绍了计算机博弈在国内外的发展情况,以及计算机博弈竞赛在国内的发展与改革、意义和特点;提出了基于计算机博弈的寓教于乐、寓教于研、以研促教、以赛促学的创新人才培养模式,论述了计算机博弈既是深受师生喜爱的科教项目、也是培养大学生计算思维能力的落地项目。 展开更多
关键词 计算博弈 创新能力 计算思维 人才培养
在线阅读 下载PDF
计算机博弈的研究与发展 被引量:34
9
作者 王亚杰 邱虹坤 +2 位作者 吴燕燕 李飞 杨周凤 《智能系统学报》 CSCD 北大核心 2016年第6期788-798,共11页
计算机博弈是人工智能领域重要而极具挑战性的研究方向。本文首先回顾了计算机博弈的发展历程,以及国内外的计算机博弈赛事情况,各种竞赛为计算机博弈技术的发展提供了一个技术验证与学术交流的平台。然后介绍了计算机博弈系统的构成,... 计算机博弈是人工智能领域重要而极具挑战性的研究方向。本文首先回顾了计算机博弈的发展历程,以及国内外的计算机博弈赛事情况,各种竞赛为计算机博弈技术的发展提供了一个技术验证与学术交流的平台。然后介绍了计算机博弈系统的构成,一个博弈系统包括博弈平台、博弈树搜索、局面评估、着法生成、机器学习等多方面技术;重点阐述了极大极小搜索、剪枝搜索、蒙特卡罗搜索等常用算法的原理与特点;对局面评估方法和各种优化算法也进行了分析,其中的并行计算、遗传算法和基于神经网络的深度学习算法等都是提升机器智能的有效方法。最后,分析了计算机博弈研究面临的问题,并展望了未来的发展方向与趋势。 展开更多
关键词 人工智能 计算博弈 蒙特卡罗搜索 神经网络 遗传算法 深度学习
在线阅读 下载PDF
中国象棋计算机博弈系统评估函数的自适应遗传算法实现 被引量:16
10
作者 王骄 王涛 +1 位作者 罗艳红 徐心和 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第10期949-952,共4页
使用自适应遗传算法解决中国象棋计算机博弈问题.将博弈问题分解为搜索引擎、走法生成、评估函数和开局库四大模块,然后将自适应遗传算法引入到评估函数中,通过锦标赛算法对评估函数中的参数组合进行自动调整和优化.设计并开发了基于上... 使用自适应遗传算法解决中国象棋计算机博弈问题.将博弈问题分解为搜索引擎、走法生成、评估函数和开局库四大模块,然后将自适应遗传算法引入到评估函数中,通过锦标赛算法对评估函数中的参数组合进行自动调整和优化.设计并开发了基于上述方法的离线自学习系统,实验结果证明提高了程序的棋力. 展开更多
关键词 中国象棋计算博弈 博弈 评估函数 锦标赛算法 自适应遗传算法
在线阅读 下载PDF
中国象棋计算机博弈关键技术分析 被引量:62
11
作者 徐心和 王骄 《小型微型计算机系统》 CSCD 北大核心 2006年第6期961-969,共9页
机器博弈被认为是人工智能领域最具挑战性的研究方向之一.国际象棋的计算机博弈已经有了很长的历史,并且经历了一场波澜壮阔的“搏杀”,“深蓝”计算机的胜利也给人类留下了难以忘怀的记忆.中国象棋计算机博弈的难度绝不亚于国际象棋,... 机器博弈被认为是人工智能领域最具挑战性的研究方向之一.国际象棋的计算机博弈已经有了很长的历史,并且经历了一场波澜壮阔的“搏杀”,“深蓝”计算机的胜利也给人类留下了难以忘怀的记忆.中国象棋计算机博弈的难度绝不亚于国际象棋,不仅涉足学者太少,而且参考资料不多.在国际象棋成熟技术的基础上,结合在中国象棋机器博弈方面的多年实践,总结出一套过程建模、状态表示、着法生成、棋局评估、博弈树搜索、开局库与残局库开发、系统测试与参数优化等核心技术要点,最后提出了当前研究的热点与方向. 展开更多
关键词 人工智能 中国象棋计算博弈 机器博弈过程建模 着法生成 评估函数 博弈树搜索
在线阅读 下载PDF
基于棋型的藏族“久”棋计算机博弈研究 被引量:7
12
作者 李霞丽 吴立成 李永集 《智能系统学报》 CSCD 北大核心 2018年第4期577-583,共7页
"久"棋是藏族人民的传统棋类游戏,游戏过程分为布局阶段和战斗阶段,布局的质量对弈棋结果影响很大。与围棋博弈智能软件战胜人类高手的情况比较,"久"棋博弈研究几乎空白。为了拓宽机器博弈研究的游戏范围,开发具有... "久"棋是藏族人民的传统棋类游戏,游戏过程分为布局阶段和战斗阶段,布局的质量对弈棋结果影响很大。与围棋博弈智能软件战胜人类高手的情况比较,"久"棋博弈研究几乎空白。为了拓宽机器博弈研究的游戏范围,开发具有较高棋力的"久"棋软件,作者开展了基于棋型的"久"棋计算机博弈研究。通过实地考察,在四川阿坝地区采集了约300局有效的"久"棋对弈数据,提取了常见棋型,分别为棋型命名为三角、三子、二子、对角、四子等。在布局阶段,采用模式匹配算法提高棋型的匹配速度。在布局和战斗阶段,基于棋型,设计了具有优先级别的防守、攻击、连子策略。采用C语言开发了"久"棋博弈软件,该软件具有人人对弈、人机对弈、自动录制棋谱等功能。该软件在2016年四川省阿坝县第七届"体彩杯"藏棋比赛中成功开展了人机对弈,但是棋力有待提高。结果表明,基于棋型的攻防策略能够有效地应用于"久"棋计算机博弈。 展开更多
关键词 计算博弈 藏族“久”棋 棋型 攻防策略 模式匹配
在线阅读 下载PDF
计算机博弈中估值算法与博弈训练的研究 被引量:9
13
作者 吕艳辉 宫瑞敏 《计算机工程》 CAS CSCD 2012年第11期163-166,共4页
计算机博弈程序难以处理局面估值问题。为此,结合时间差分算法和反向传播神经网络,设计一种局面估值算法BP-TD(),实现估值函数参数的自动调整。为提高博弈训练的性能,针对开局和中局,提出分阶段设置参数值的策略。以五子棋为应用背景,... 计算机博弈程序难以处理局面估值问题。为此,结合时间差分算法和反向传播神经网络,设计一种局面估值算法BP-TD(),实现估值函数参数的自动调整。为提高博弈训练的性能,针对开局和中局,提出分阶段设置参数值的策略。以五子棋为应用背景,实现博弈系统RenjuTD。实验结果表明,该算法可使程序的博弈水平得到较大提高。 展开更多
关键词 计算博弈 差分学习 反向传播神经网络 估值算法 增强学习 博弈训练
在线阅读 下载PDF
五道棋计算机博弈程序的设计与实现 被引量:5
14
作者 张利群 《计算机工程》 CAS CSCD 北大核心 2010年第10期221-222,225,共3页
针对民间五道棋博弈游戏,设计并实现五道棋计算机博弈程序。介绍程序的功能、设计目标,给出程序中关键问题的处理方法和软件实现方法。经实际应用证明,五道棋计算机博弈程序运行速度快、稳定可靠。该博弈程序的设计与实现对完成其他民... 针对民间五道棋博弈游戏,设计并实现五道棋计算机博弈程序。介绍程序的功能、设计目标,给出程序中关键问题的处理方法和软件实现方法。经实际应用证明,五道棋计算机博弈程序运行速度快、稳定可靠。该博弈程序的设计与实现对完成其他民间棋类的计算机博弈程序具有一定的参考价值。 展开更多
关键词 五道棋 计算博弈 搜索策略 评估函数
在线阅读 下载PDF
中国象棋计算机博弈中的一种数据结构方法 被引量:2
15
作者 周玮 王水涛 孙旸 《计算机工程与应用》 CSCD 北大核心 2006年第35期219-221,共3页
基于人工免疫算法提出了在中国象棋中建立哈希表的实用方法。该方法将棋面表示成一个10×9的矩阵,应用人工免疫算法抗原抗体互识别的形式模型和矩阵奇异值分解与形式模型的关系,得到具有稳定结合的最低结合能量抗原抗体对,根据这一... 基于人工免疫算法提出了在中国象棋中建立哈希表的实用方法。该方法将棋面表示成一个10×9的矩阵,应用人工免疫算法抗原抗体互识别的形式模型和矩阵奇异值分解与形式模型的关系,得到具有稳定结合的最低结合能量抗原抗体对,根据这一抗原抗体对的某些表位和对位的组合得到哈希值,并随机产生10万个不同象棋棋面的样本空间,验证该方法的有效性,得到在样本空间中无冲突的结果。实践表明,该方法有较好的散列哈希值的能力,实现了计算机棋力的实际增长,在计算机象棋对弈以及其它领域的博弈研究中有实际的应用价值。 展开更多
关键词 人工免疫算法 哈希值 抗原抗体表位对位组合 矩阵奇异值分解 中国象棋计算博弈
在线阅读 下载PDF
引入意图的中国象棋计算机博弈系统
16
作者 张小川 陈恋昶 李祖枢 《重庆理工大学学报(自然科学)》 CAS 2010年第10期68-73,共6页
现有的计算机博弈系统中多采用静态棋局评估,结合搜索算法选择着法,尽管利用剪枝等方法提高了博弈速度,但并没有实现机器的推理与自主性决策。针对这个问题,将意图机制引入机器博弈中,实现机器推理与自主决策。阐述了人工情感的重要意义... 现有的计算机博弈系统中多采用静态棋局评估,结合搜索算法选择着法,尽管利用剪枝等方法提高了博弈速度,但并没有实现机器的推理与自主性决策。针对这个问题,将意图机制引入机器博弈中,实现机器推理与自主决策。阐述了人工情感的重要意义,分析了意图对机器智能的重要作用。引入博弈意图,并将意图形式化,构造了一个具有初步情感能力的、有限自治的博弈系统。 展开更多
关键词 意图 人工情感 计算博弈 中国象棋
在线阅读 下载PDF
棋类计算机博弈系统的主要研究方法及在6子棋上的应用 被引量:2
17
作者 张颖 李祖枢 《重庆工学院学报(自然科学版)》 2008年第9期98-102,157,共6页
介绍了棋类计算机博弈发展简史,分析了实现棋类计算机博弈平台的四大模块:走法生成、搜索引擎、评估函数和开局/残局库,以及各模块中的主要技术和研究方法.最后将这些方法应用于6子棋程序的编制中.
关键词 人工智能 计算博弈 评估函数 博弈搜索算法 6子棋
在线阅读 下载PDF
中国象棋计算机博弈开局库研究与设计 被引量:5
18
作者 魏钦刚 王骄 +1 位作者 徐心和 南晓斐 《智能系统学报》 2007年第1期85-89,共5页
开局库是一种为了增强计算机的博弈水平而必不可少的辅助手段,开局阶段的着法采用查询数据库的方式生成,从而避免耗时的搜索、评估和出现战略性错误.研究了中国象棋机器博弈系统中应用开局库的一些技术问题.介绍了开局库的计算机自动生... 开局库是一种为了增强计算机的博弈水平而必不可少的辅助手段,开局阶段的着法采用查询数据库的方式生成,从而避免耗时的搜索、评估和出现战略性错误.研究了中国象棋机器博弈系统中应用开局库的一些技术问题.介绍了开局库的计算机自动生成方法,对统计开局库作了详细的探讨和论述,提出了理想开局库的设计思想以及开局库评估系统的必要性. 展开更多
关键词 计算博弈 开局库 统计开局库 理想开局库
在线阅读 下载PDF
一种大众麻将计算机博弈的胡牌方法研究 被引量:8
19
作者 彭丽蓉 赵海璐 +2 位作者 甘春晏 刘洁 陈俊宇 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第12期127-133,共7页
麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法... 麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法。为此,首先分析麻将的大众规则;其次,基于各种牌型和持有牌点数,提出一种胡牌距离概念,以最短胡牌距离为标准,作为玩家的决策依据;最后,依据已知公开的出牌和玩家手上牌张信息,融合先验知识后,进一步计算每种出牌行为的期望胜率,从而获得出牌行为评估值,作为玩家的决策依据。实验结果表明:利用维持最短胡牌距离为核心的快速胡牌方法,在有限牌对局数下,比如在中国计算机博弈锦标赛中此局数设定为10000局,依据设计的智能体,能取得46.85%以上的牌局胜利,该值远高于仅仅使用纯粹经验方法的数值。 展开更多
关键词 计算博弈 非完美信息博弈 麻将博弈 胡牌方法 胡牌距离
在线阅读 下载PDF
一种棋类计算机博弈强化学习智能体的决策依据解释方法 被引量:4
20
作者 刘贺 张小川 +1 位作者 刁志东 王森 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第12期140-146,共7页
提出一种针对棋类智能体,基于显著图的解释方法,用来解释棋类智能体的决策依据。该解释方法将智能体面对的棋局状态分为落子区域和空白区域,从特征与最终决策的相关性和重要性两方面对棋局落子区域特征进行显著性分析,同时从博弈行为角... 提出一种针对棋类智能体,基于显著图的解释方法,用来解释棋类智能体的决策依据。该解释方法将智能体面对的棋局状态分为落子区域和空白区域,从特征与最终决策的相关性和重要性两方面对棋局落子区域特征进行显著性分析,同时从博弈行为角度出发,分析棋局空白区域特征对于智能体决策的显著性,将两区域的特征显著性进行合并输出,从而较为全面地评估整个棋局特征的显著性。针对基于强化学习的围棋智能体和国际象棋智能体,使用该方法对智能体的决策进行解释性输出,实验结果表明:可以全面地解释智能体的决策依据,验证了该方法的有效性。 展开更多
关键词 计算博弈 强化学习 决策依据 显著图 解释方法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部