期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
包含非数值型属性的交互式遗憾最小化查询
1
作者
王美静
郑吉平
《小型微型计算机系统》
CSCD
北大核心
2024年第3期513-520,共8页
近年来,遗憾最小化查询作为多准则决策的重要工具之一,逐渐成为数据查询的研究热点.遗憾最小化查询中,通过与用户进行交互,不断地学习用户的偏好,可以有效帮助降低查询的遗憾率.然而,已有的研究仅针对具有数值型属性的数据定义遗憾率并...
近年来,遗憾最小化查询作为多准则决策的重要工具之一,逐渐成为数据查询的研究热点.遗憾最小化查询中,通过与用户进行交互,不断地学习用户的偏好,可以有效帮助降低查询的遗憾率.然而,已有的研究仅针对具有数值型属性的数据定义遗憾率并据此进行遗憾最小化查询,当面对包含非数值型属性的数据时,这些方法不再适用.本文提出的遗憾率定义针对包含非数值型属性的数据,并给出新的交互式遗憾最小化查询问题的定义.在此基础上,采用“支配”的概念提出用于预处理的skyline删减算法,利用偏好矩阵帮助学习用户偏好,并提出用于解决交互式遗憾最小化的算法MECR_QS.最后,实验结果表明MECR_QS算法能有效处理包含非数值型属性的交互式遗憾最小化查询.
展开更多
关键词
遗憾最小化
查询
交互
非数值型属性
skyline筛选
在线阅读
下载PDF
职称材料
不完美信息扩展式博弈中在线虚拟遗憾最小化
被引量:
9
2
作者
胡裕靖
高阳
安波
《计算机研究与发展》
EI
CSCD
北大核心
2014年第10期2160-2170,共11页
研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种离线的均衡计算方法——虚拟遗憾最小化方法——将其扩展到在...
研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种离线的均衡计算方法——虚拟遗憾最小化方法——将其扩展到在线博弈的场景中,实现对次优对手弱点的利用.提出了从博弈结果中估计各个信息集的虚拟价值的方法,给出2种估计手段:静态估计法和动态估计法.静态估计法直接从博弈结果的分布中进行估计,并对每个结果给以相等的估计权重;而动态估计法则对新产生的博弈结果给以较高的估计权重,以便快速地适应对手的策略变化.基于2种估计方法,提出在线博弈中虚拟遗憾最小化的算法,并在基于单牌扑克的实验中,与4种在线学习算法(DBBR,MCCFR-os,Q-learning,Sarsa)进行了对比.实验结果显示所提出的算法不仅对较弱对手的利用效果最好,还能在与4种对比算法的比赛中取得最高的胜率.
展开更多
关键词
扩展式博弈
不完美信息
遗憾最小化
虚拟
遗憾最小化
静态估计法
动态估计法
在线阅读
下载PDF
职称材料
合作-竞争混合型多智能体系统的虚拟遗憾优势自博弈方法
被引量:
2
3
作者
张明悦
金芝
刘坤
《软件学报》
EI
CSCD
北大核心
2024年第2期739-757,共19页
合作-竞争混合型多智能体系统由受控的目标智能体和不受控的外部智能体组成.目标智能体之间互相合作,同外部智能体展开竞争,应对环境和外部智能体的动态变化,最终完成指定的任务.针对如何训练目标智能体使他们获得完成任务的最优策略的...
合作-竞争混合型多智能体系统由受控的目标智能体和不受控的外部智能体组成.目标智能体之间互相合作,同外部智能体展开竞争,应对环境和外部智能体的动态变化,最终完成指定的任务.针对如何训练目标智能体使他们获得完成任务的最优策略的问题,现有工作从两个方面展开:(1)仅关注目标智能体间的合作,将外部智能体视为环境的一部分,利用多智能体强化学习来训练目标智能体.这种方法难以应对外部智能体策略未知或者动态改变的情况;(2)仅关注目标智能体和外部智能体间的竞争,将竞争建模为双人博弈,采用自博弈的方法训练目标智能体.这种方法主要针对单个目标智能体和单个外部智能体的情况,难以扩展到由多个目标智能体和多个外部智能体组成的系统中.结合这两类研究,提出一种基于虚拟遗憾优势的自博弈方法.具体地,首先以虚拟遗憾最小化和虚拟多智能体策略梯度为基础,设计虚拟遗憾优势策略梯度方法,使目标智能体能更准确地更新策略;然后,引入模仿学习,以外部智能体的历史决策轨迹作为示教数据,模仿外部智能体的策略,显式地建模外部智能体的行为,来应对自博弈过程中外部智能体策略的动态变化;最后,以虚拟遗憾优势策略梯度和外部智能体行为建模为基础,设计一种自博弈训练方法,该方法能够在外部智能体策略未知或者动态变化的情况下,为多个目标智能体训练出最优的联合策略.以协同电磁对抗为研究案例,设计具有合作-竞争混合特征的3个典型任务.实验结果表明,同其他方法相比,所提方法在自博弈效果方面有至少78%的提升.
展开更多
关键词
多智能体强
化
学习
虚拟
遗憾最小化
自博弈
动态决策
在线阅读
下载PDF
职称材料
带有欺骗证据的蜜罐博弈攻防策略优化机制
被引量:
5
4
作者
宋丽华
姜洋洋
+1 位作者
邢长友
张国敏
《通信学报》
EI
CSCD
北大核心
2022年第11期104-116,共13页
利用博弈模型实现蜜罐行为策略的优化是提高蜜罐诱捕能力的重要手段。现有研究存在动作空间简单、割裂博弈全过程的问题。基于此,提出了带有欺骗证据的蜜罐博弈机制(HoneyED)。HoneyED在扩大攻防动作空间的基础上,综合考虑博弈全过程,...
利用博弈模型实现蜜罐行为策略的优化是提高蜜罐诱捕能力的重要手段。现有研究存在动作空间简单、割裂博弈全过程的问题。基于此,提出了带有欺骗证据的蜜罐博弈机制(HoneyED)。HoneyED在扩大攻防动作空间的基础上,综合考虑博弈全过程,关注攻击者信念变化及这种变化对攻防策略的影响;然后基于信念求解理论均衡策略;最后基于深度反事实遗憾值最小化(Deep-CFR)设计了攻防混合策略均衡近似求解算法,得到了执行近似混合策略的攻防智能体。理论和实验结果表明,虽然攻击方在信念达到一定阈值后应及时退出博弈以获得最大收益,但所得蜜罐策略在考虑风险的情况下能尽量降低攻击方信念以诱骗其继续攻击,从而获得更大收益,且能针对具有不同欺骗识别能力的攻击方选择最佳响应。
展开更多
关键词
蜜罐博弈
策略适应性
信念
欺骗证据
深度反事实
遗憾
值
最小
化
在线阅读
下载PDF
职称材料
基于不完全信息的工业园区多主体需求响应博弈策略研究
被引量:
1
5
作者
孙勇
王惠锋
+5 位作者
孟祥东
李宝聚
王大亮
王尧
胡枭
陈厚合
《电工电能新技术》
CSCD
北大核心
2024年第2期65-77,共13页
随着我国电力市场化改革进程的推进与发展,在工业园区层面如何攫取各响应主体最大利润,以引导用户积极参与需求响应成为亟待解决的新问题。基于响应流程中市场信息披露有限且用户与聚合商自由缔结合约的情形,本文提出了一种聚合商视角...
随着我国电力市场化改革进程的推进与发展,在工业园区层面如何攫取各响应主体最大利润,以引导用户积极参与需求响应成为亟待解决的新问题。基于响应流程中市场信息披露有限且用户与聚合商自由缔结合约的情形,本文提出了一种聚合商视角下的最佳博弈策略及针对用户的收益分配方式。考虑工业园区内用户的利益关系,建立以不完全信息贝叶斯博弈作为上层、以合作博弈作为下层的多主体双层博弈架构;其次以最大化自身利益为目标,采用改进的虚拟遗憾最小化思想结合启发式算法求解博弈均衡,达成园区内的稳定合作关系。最后通过算例进行验证,分别设置了不同场景下申报策略和收益分配两方面的多个对比模型,结果表明本文所提方法得出的策略能够提高用户收益,且利益分配机制的合理选择能够在提高用户需求响应积极性方面起到促进作用。
展开更多
关键词
多主体需求响应
贝叶斯博弈
电力市场
工业园区
不完全信息
虚拟
遗憾最小化
在线阅读
下载PDF
职称材料
非完美信息博弈综述:对抗求解方法与对比分析
6
作者
余超
刘宗凯
+2 位作者
胡超豪
黄凯奇
张俊格
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第9期2211-2246,共36页
当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模...
当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模多智能体在私有信息下的博弈行为,能够刻画相较完美信息博弈更广泛的决策过程,在现实世界中具有广泛应用,例如金融贸易、商业谈判、军事对抗等.近年来,非完美信息博弈求解研究取得了突破性进展,涌现出以遗憾最小化(Regret Minimization)和最佳响应(Best Response)为核心技术的两大类离线求解方法.前者通过反省智能体过往决策以使自身策略向均衡点改进,成功解决了以德州扑克为代表的经典非完美信息博弈.后者通过特定应对方式针对对手决策以使自身策略向均衡点改进,在例如星际争霸、DOTA等大型实时战略游戏AI训练中发挥着关键作用.此外,一系列在线求解方法能够进一步实时优化离线算法求解所得的蓝图策略,使其在实时对局中得到进一步改进,成为求解非完美信息博弈的关键技术.本文将从非完美信息博弈的概念和特点切入,全面介绍这三类方法的基本原理、发展脉络和改进技巧,深入对比不同方法间的优缺点并展望未来研究方向.希望通过对非完美信息博弈求解这一研究领域的全方位细致梳理,能够进一步推动博弈智能技术向前发展,为迈向通用人工智能赋能.
展开更多
关键词
非完美信息博弈
遗憾最小化
最佳响应
在线求解
强
化
学习
在线阅读
下载PDF
职称材料
MySQL缓冲区自适应管理仿真研究
被引量:
4
7
作者
王楠
吴云
《计算机应用研究》
CSCD
北大核心
2023年第4期1154-1159,共6页
由于MySQL使用配置参数的方式调节线性预读的阈值以及冷热LRU算法的冷热比例,导致缓冲区存在性能瓶颈。针对以上问题,提出一种缓冲区自适应管理的方法,该方法通过遗憾最小化的强化在线学习技术设计了自适应阈值调整算法以及自适应冷热...
由于MySQL使用配置参数的方式调节线性预读的阈值以及冷热LRU算法的冷热比例,导致缓冲区存在性能瓶颈。针对以上问题,提出一种缓冲区自适应管理的方法,该方法通过遗憾最小化的强化在线学习技术设计了自适应阈值调整算法以及自适应冷热缓存替换算法。首先,对MySQL中的预读算法以及冷热缓存替换算法进行深入研究,明确了预读阈值以及冷热比例大小对两种算法的具体影响;其次,通过FIFO历史队列以及增加辅助字段的方式,设计了一套参数评估流程,实时评估当前参数是偏大或偏小;最后,设计了一种参数调整模型,该模型利用MySQL原生的预读算法以及缓存替换算法的性能监控指标,实现对参数的合理调整。在FIU数据集上进行了900组仿真实验,实验表明,相较于MySQL原生的基准预读算法以及冷热缓存算法,自适应后的两种算法能够在基本不牺牲算法运行速度的基础上,有效减少8%的磁盘I/O以及增加24%的缓存命中率;相对于最新的缓存替换算法,自适应后的冷热缓存替换算法在保证缓存命中率的前提下,将速度提升至1.6倍。
展开更多
关键词
自适应
缓冲区
遗憾最小化
预读算法
缓存替换算法
在线阅读
下载PDF
职称材料
多准则妥协解排序法在境外铁路选线方案应用
被引量:
2
8
作者
马彦祥
《铁道工程学报》
EI
北大核心
2022年第4期1-4,10,共5页
研究目的:在境外铁路线路方案比选中,由于受土地私有化、征地拆迁困难、环保要求高等因素影响,同时政府部门及社会团体等利益相关方诉求各不相同等,均大大增加了线路方案比选和决策的困难。如何合理地选择线路方案,尽可能在满足各种限...
研究目的:在境外铁路线路方案比选中,由于受土地私有化、征地拆迁困难、环保要求高等因素影响,同时政府部门及社会团体等利益相关方诉求各不相同等,均大大增加了线路方案比选和决策的困难。如何合理地选择线路方案,尽可能在满足各种限制因素条件下均衡各利益相关方诉求,使群体效益最大化成为境外铁路线路方案优选的一大难题。研究结论:(1)针对境外项目特点,建立了包含技术效益、经济效益、环境效益、社会效益、项目可执行效益等多层面评价指标体系的多目标决策模型;(2)利用多准则妥协排序法进行求解,得出线路方案的比选排序;(3)通过案例分析对该方法进行验证,该方法具有原理简单、结果稳定、分辨率高等特点,在境外铁路线路比选研究方面有一定的应用前景。
展开更多
关键词
铁路线路走向
多准则妥协排序法
群体利益最大
化
个体
遗憾最小化
方案排序
在线阅读
下载PDF
职称材料
三方众包市场中的发包方-平台博弈机制设计
9
作者
何雨橙
丁尧相
周志华
《计算机研究与发展》
EI
CSCD
北大核心
2022年第11期2507-2519,共13页
众包(crowdsourcing)通常涉及到目标各不相同的多个参与者.设计有效的众包机制,使得各个参与者在竞争中实现共赢,是众包理论研究中的基本问题之一.当前,众包机制设计通常基于发包方标注者直接进行交互的两方博弈模型.而现实应用中,发包...
众包(crowdsourcing)通常涉及到目标各不相同的多个参与者.设计有效的众包机制,使得各个参与者在竞争中实现共赢,是众包理论研究中的基本问题之一.当前,众包机制设计通常基于发包方标注者直接进行交互的两方博弈模型.而现实应用中,发包方与标注者之间往往通过平台进行交互,从而构成三方博弈下的众包市场.其中的发包方平台博弈机制设计是过往众包研究中未曾涉及的全新问题.将三方众包市场建模为不完全信息博弈,并证明该博弈问题的Nash均衡可通过在线学习来最小化发包方和平台的累计遗憾而达到.在单发包方情形下,证明经典的EXP3算法对于发包方的最优性,并基于反事实遗憾最小化技术为平台设计了有效策略.同时,将单发包方情形下发包方和平台策略拓展到多发包方情形下并给出理论分析.合成及真实数据集上的实验验证了该方法的有效性.
展开更多
关键词
众包
博弈理论
机制设计
在线学习
反事实
遗憾最小化
在线阅读
下载PDF
职称材料
题名
包含非数值型属性的交互式遗憾最小化查询
1
作者
王美静
郑吉平
机构
南京航空航天大学计算机科学与技术学院
南京大学计算机软件新技术国家重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第3期513-520,共8页
基金
国家自然科学基金项目(U1733112,61702260)资助
中央高校基本科研业务费专项资金项目(NS2020068)资助.
文摘
近年来,遗憾最小化查询作为多准则决策的重要工具之一,逐渐成为数据查询的研究热点.遗憾最小化查询中,通过与用户进行交互,不断地学习用户的偏好,可以有效帮助降低查询的遗憾率.然而,已有的研究仅针对具有数值型属性的数据定义遗憾率并据此进行遗憾最小化查询,当面对包含非数值型属性的数据时,这些方法不再适用.本文提出的遗憾率定义针对包含非数值型属性的数据,并给出新的交互式遗憾最小化查询问题的定义.在此基础上,采用“支配”的概念提出用于预处理的skyline删减算法,利用偏好矩阵帮助学习用户偏好,并提出用于解决交互式遗憾最小化的算法MECR_QS.最后,实验结果表明MECR_QS算法能有效处理包含非数值型属性的交互式遗憾最小化查询.
关键词
遗憾最小化
查询
交互
非数值型属性
skyline筛选
Keywords
regret minimization queries
interaction
categorical attributes
skyline pruning
分类号
TP392 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
不完美信息扩展式博弈中在线虚拟遗憾最小化
被引量:
9
2
作者
胡裕靖
高阳
安波
机构
软件新技术国家重点实验室(南京大学)
中国科学院计算技术研究所智能信息处理重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第10期2160-2170,共11页
基金
国家自然科学基金项目(61035003
61175042
+3 种基金
61321491
61202212)
江苏省自然科学基金重点项目(BK2011005)
江苏省普通高校研究生科研创新计划基金项目(CXLX13_049)
文摘
研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种离线的均衡计算方法——虚拟遗憾最小化方法——将其扩展到在线博弈的场景中,实现对次优对手弱点的利用.提出了从博弈结果中估计各个信息集的虚拟价值的方法,给出2种估计手段:静态估计法和动态估计法.静态估计法直接从博弈结果的分布中进行估计,并对每个结果给以相等的估计权重;而动态估计法则对新产生的博弈结果给以较高的估计权重,以便快速地适应对手的策略变化.基于2种估计方法,提出在线博弈中虚拟遗憾最小化的算法,并在基于单牌扑克的实验中,与4种在线学习算法(DBBR,MCCFR-os,Q-learning,Sarsa)进行了对比.实验结果显示所提出的算法不仅对较弱对手的利用效果最好,还能在与4种对比算法的比赛中取得最高的胜率.
关键词
扩展式博弈
不完美信息
遗憾最小化
虚拟
遗憾最小化
静态估计法
动态估计法
Keywords
extensive games
minimization
static estimator
imperfect information
regret minimization
counterfactual regret dynamic estimator
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
合作-竞争混合型多智能体系统的虚拟遗憾优势自博弈方法
被引量:
2
3
作者
张明悦
金芝
刘坤
机构
西南大学计算机信息科学学院&软件学院
北京大学计算机学院
高可信软件技术教育部重点实验室(北京大学)
出处
《软件学报》
EI
CSCD
北大核心
2024年第2期739-757,共19页
基金
国家自然科学基金(62192731)。
文摘
合作-竞争混合型多智能体系统由受控的目标智能体和不受控的外部智能体组成.目标智能体之间互相合作,同外部智能体展开竞争,应对环境和外部智能体的动态变化,最终完成指定的任务.针对如何训练目标智能体使他们获得完成任务的最优策略的问题,现有工作从两个方面展开:(1)仅关注目标智能体间的合作,将外部智能体视为环境的一部分,利用多智能体强化学习来训练目标智能体.这种方法难以应对外部智能体策略未知或者动态改变的情况;(2)仅关注目标智能体和外部智能体间的竞争,将竞争建模为双人博弈,采用自博弈的方法训练目标智能体.这种方法主要针对单个目标智能体和单个外部智能体的情况,难以扩展到由多个目标智能体和多个外部智能体组成的系统中.结合这两类研究,提出一种基于虚拟遗憾优势的自博弈方法.具体地,首先以虚拟遗憾最小化和虚拟多智能体策略梯度为基础,设计虚拟遗憾优势策略梯度方法,使目标智能体能更准确地更新策略;然后,引入模仿学习,以外部智能体的历史决策轨迹作为示教数据,模仿外部智能体的策略,显式地建模外部智能体的行为,来应对自博弈过程中外部智能体策略的动态变化;最后,以虚拟遗憾优势策略梯度和外部智能体行为建模为基础,设计一种自博弈训练方法,该方法能够在外部智能体策略未知或者动态变化的情况下,为多个目标智能体训练出最优的联合策略.以协同电磁对抗为研究案例,设计具有合作-竞争混合特征的3个典型任务.实验结果表明,同其他方法相比,所提方法在自博弈效果方面有至少78%的提升.
关键词
多智能体强
化
学习
虚拟
遗憾最小化
自博弈
动态决策
Keywords
multi-agent reinforcement learning
counterfactual regret minimization
self-play
dynamic decision-making
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
带有欺骗证据的蜜罐博弈攻防策略优化机制
被引量:
5
4
作者
宋丽华
姜洋洋
邢长友
张国敏
机构
陆军工程大学指挥控制工程学院
出处
《通信学报》
EI
CSCD
北大核心
2022年第11期104-116,共13页
基金
国家自然科学基金项目(No.62172432)。
文摘
利用博弈模型实现蜜罐行为策略的优化是提高蜜罐诱捕能力的重要手段。现有研究存在动作空间简单、割裂博弈全过程的问题。基于此,提出了带有欺骗证据的蜜罐博弈机制(HoneyED)。HoneyED在扩大攻防动作空间的基础上,综合考虑博弈全过程,关注攻击者信念变化及这种变化对攻防策略的影响;然后基于信念求解理论均衡策略;最后基于深度反事实遗憾值最小化(Deep-CFR)设计了攻防混合策略均衡近似求解算法,得到了执行近似混合策略的攻防智能体。理论和实验结果表明,虽然攻击方在信念达到一定阈值后应及时退出博弈以获得最大收益,但所得蜜罐策略在考虑风险的情况下能尽量降低攻击方信念以诱骗其继续攻击,从而获得更大收益,且能针对具有不同欺骗识别能力的攻击方选择最佳响应。
关键词
蜜罐博弈
策略适应性
信念
欺骗证据
深度反事实
遗憾
值
最小
化
Keywords
honeypot game
strategy adaptability
belief
evidence for deception
Deep-CFR
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于不完全信息的工业园区多主体需求响应博弈策略研究
被引量:
1
5
作者
孙勇
王惠锋
孟祥东
李宝聚
王大亮
王尧
胡枭
陈厚合
机构
国网吉林省电力有限公司
东北电力大学电气工程学院
国网吉林省电力有限公司电力科学研究院
国网吉林省电力有限公司长春供电公司
出处
《电工电能新技术》
CSCD
北大核心
2024年第2期65-77,共13页
基金
吉林省科技发展计划项目(20220508009RC)
国网吉林省电力有限公司科技项目(52234221000D)。
文摘
随着我国电力市场化改革进程的推进与发展,在工业园区层面如何攫取各响应主体最大利润,以引导用户积极参与需求响应成为亟待解决的新问题。基于响应流程中市场信息披露有限且用户与聚合商自由缔结合约的情形,本文提出了一种聚合商视角下的最佳博弈策略及针对用户的收益分配方式。考虑工业园区内用户的利益关系,建立以不完全信息贝叶斯博弈作为上层、以合作博弈作为下层的多主体双层博弈架构;其次以最大化自身利益为目标,采用改进的虚拟遗憾最小化思想结合启发式算法求解博弈均衡,达成园区内的稳定合作关系。最后通过算例进行验证,分别设置了不同场景下申报策略和收益分配两方面的多个对比模型,结果表明本文所提方法得出的策略能够提高用户收益,且利益分配机制的合理选择能够在提高用户需求响应积极性方面起到促进作用。
关键词
多主体需求响应
贝叶斯博弈
电力市场
工业园区
不完全信息
虚拟
遗憾最小化
Keywords
multi-agent demand response
Bayesian game
electricity market
industrial park
incomplete information
counterfactual regret minimization
分类号
TM73 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
非完美信息博弈综述:对抗求解方法与对比分析
6
作者
余超
刘宗凯
胡超豪
黄凯奇
张俊格
机构
中山大学计算机学院
中国科学院自动化研究所智能系统与工程研究中心
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第9期2211-2246,共36页
基金
国家自然科学基金面上项目(No.62076259)
广东省自然科学基金(No.2023A1515012946)
+2 种基金
中国科学院基础培育基金项目(JCPYJJ-22017)
中山大学中央高校基本科研业务费专项资金
中国科学院青年促进会项目资助.
文摘
当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模多智能体在私有信息下的博弈行为,能够刻画相较完美信息博弈更广泛的决策过程,在现实世界中具有广泛应用,例如金融贸易、商业谈判、军事对抗等.近年来,非完美信息博弈求解研究取得了突破性进展,涌现出以遗憾最小化(Regret Minimization)和最佳响应(Best Response)为核心技术的两大类离线求解方法.前者通过反省智能体过往决策以使自身策略向均衡点改进,成功解决了以德州扑克为代表的经典非完美信息博弈.后者通过特定应对方式针对对手决策以使自身策略向均衡点改进,在例如星际争霸、DOTA等大型实时战略游戏AI训练中发挥着关键作用.此外,一系列在线求解方法能够进一步实时优化离线算法求解所得的蓝图策略,使其在实时对局中得到进一步改进,成为求解非完美信息博弈的关键技术.本文将从非完美信息博弈的概念和特点切入,全面介绍这三类方法的基本原理、发展脉络和改进技巧,深入对比不同方法间的优缺点并展望未来研究方向.希望通过对非完美信息博弈求解这一研究领域的全方位细致梳理,能够进一步推动博弈智能技术向前发展,为迈向通用人工智能赋能.
关键词
非完美信息博弈
遗憾最小化
最佳响应
在线求解
强
化
学习
Keywords
imperfect information game
regret minimization
best response
safe search
reinforcement learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
MySQL缓冲区自适应管理仿真研究
被引量:
4
7
作者
王楠
吴云
机构
贵州大学公共大数据国家重点实验室
贵州大学计算机科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2023年第4期1154-1159,共6页
基金
贵州省科学技术厅资助项目(黔科合基础-ZK[2022]一般119)。
文摘
由于MySQL使用配置参数的方式调节线性预读的阈值以及冷热LRU算法的冷热比例,导致缓冲区存在性能瓶颈。针对以上问题,提出一种缓冲区自适应管理的方法,该方法通过遗憾最小化的强化在线学习技术设计了自适应阈值调整算法以及自适应冷热缓存替换算法。首先,对MySQL中的预读算法以及冷热缓存替换算法进行深入研究,明确了预读阈值以及冷热比例大小对两种算法的具体影响;其次,通过FIFO历史队列以及增加辅助字段的方式,设计了一套参数评估流程,实时评估当前参数是偏大或偏小;最后,设计了一种参数调整模型,该模型利用MySQL原生的预读算法以及缓存替换算法的性能监控指标,实现对参数的合理调整。在FIU数据集上进行了900组仿真实验,实验表明,相较于MySQL原生的基准预读算法以及冷热缓存算法,自适应后的两种算法能够在基本不牺牲算法运行速度的基础上,有效减少8%的磁盘I/O以及增加24%的缓存命中率;相对于最新的缓存替换算法,自适应后的冷热缓存替换算法在保证缓存命中率的前提下,将速度提升至1.6倍。
关键词
自适应
缓冲区
遗憾最小化
预读算法
缓存替换算法
Keywords
adaptive
buffer
regret minimization
read-ahead algorithm
cache replacement algorithm
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
多准则妥协解排序法在境外铁路选线方案应用
被引量:
2
8
作者
马彦祥
机构
中铁第四勘测设计院集团有限公司
出处
《铁道工程学报》
EI
北大核心
2022年第4期1-4,10,共5页
文摘
研究目的:在境外铁路线路方案比选中,由于受土地私有化、征地拆迁困难、环保要求高等因素影响,同时政府部门及社会团体等利益相关方诉求各不相同等,均大大增加了线路方案比选和决策的困难。如何合理地选择线路方案,尽可能在满足各种限制因素条件下均衡各利益相关方诉求,使群体效益最大化成为境外铁路线路方案优选的一大难题。研究结论:(1)针对境外项目特点,建立了包含技术效益、经济效益、环境效益、社会效益、项目可执行效益等多层面评价指标体系的多目标决策模型;(2)利用多准则妥协排序法进行求解,得出线路方案的比选排序;(3)通过案例分析对该方法进行验证,该方法具有原理简单、结果稳定、分辨率高等特点,在境外铁路线路比选研究方面有一定的应用前景。
关键词
铁路线路走向
多准则妥协排序法
群体利益最大
化
个体
遗憾最小化
方案排序
Keywords
railway alignment
multi-criteria compromise ranking method
maximization of group interests
minimization of individual regret
options ranking
分类号
U212.3 [交通运输工程—道路与铁道工程]
O185 [理学—基础数学]
在线阅读
下载PDF
职称材料
题名
三方众包市场中的发包方-平台博弈机制设计
9
作者
何雨橙
丁尧相
周志华
机构
计算机软件新技术国家重点实验室(南京大学)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2022年第11期2507-2519,共13页
基金
国家自然科学基金项目(61921006)。
文摘
众包(crowdsourcing)通常涉及到目标各不相同的多个参与者.设计有效的众包机制,使得各个参与者在竞争中实现共赢,是众包理论研究中的基本问题之一.当前,众包机制设计通常基于发包方标注者直接进行交互的两方博弈模型.而现实应用中,发包方与标注者之间往往通过平台进行交互,从而构成三方博弈下的众包市场.其中的发包方平台博弈机制设计是过往众包研究中未曾涉及的全新问题.将三方众包市场建模为不完全信息博弈,并证明该博弈问题的Nash均衡可通过在线学习来最小化发包方和平台的累计遗憾而达到.在单发包方情形下,证明经典的EXP3算法对于发包方的最优性,并基于反事实遗憾最小化技术为平台设计了有效策略.同时,将单发包方情形下发包方和平台策略拓展到多发包方情形下并给出理论分析.合成及真实数据集上的实验验证了该方法的有效性.
关键词
众包
博弈理论
机制设计
在线学习
反事实
遗憾最小化
Keywords
crowdsourcing
game theory
mechanism design
online learning
counterfactual regret minimization
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
包含非数值型属性的交互式遗憾最小化查询
王美静
郑吉平
《小型微型计算机系统》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
不完美信息扩展式博弈中在线虚拟遗憾最小化
胡裕靖
高阳
安波
《计算机研究与发展》
EI
CSCD
北大核心
2014
9
在线阅读
下载PDF
职称材料
3
合作-竞争混合型多智能体系统的虚拟遗憾优势自博弈方法
张明悦
金芝
刘坤
《软件学报》
EI
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
4
带有欺骗证据的蜜罐博弈攻防策略优化机制
宋丽华
姜洋洋
邢长友
张国敏
《通信学报》
EI
CSCD
北大核心
2022
5
在线阅读
下载PDF
职称材料
5
基于不完全信息的工业园区多主体需求响应博弈策略研究
孙勇
王惠锋
孟祥东
李宝聚
王大亮
王尧
胡枭
陈厚合
《电工电能新技术》
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
6
非完美信息博弈综述:对抗求解方法与对比分析
余超
刘宗凯
胡超豪
黄凯奇
张俊格
《计算机学报》
EI
CAS
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
7
MySQL缓冲区自适应管理仿真研究
王楠
吴云
《计算机应用研究》
CSCD
北大核心
2023
4
在线阅读
下载PDF
职称材料
8
多准则妥协解排序法在境外铁路选线方案应用
马彦祥
《铁道工程学报》
EI
北大核心
2022
2
在线阅读
下载PDF
职称材料
9
三方众包市场中的发包方-平台博弈机制设计
何雨橙
丁尧相
周志华
《计算机研究与发展》
EI
CSCD
北大核心
2022
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部