期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
从FIPD的合作现象看潜在参与人对Nash均衡的影响
被引量:
1
1
作者
杨城
朱超威
吕峻闽
《管理科学学报》
CSSCI
北大核心
2013年第1期87-94,共8页
针对大量现实博弈与Nash均衡预测相背离的现象,抛开"共同理性"假设,提出了Nash均衡理论的另一个隐性前提"博弈的封闭性假设",进而引入"潜在参与人"的概念,扩展了博弈参与人的范围,从理论上指出开放环境...
针对大量现实博弈与Nash均衡预测相背离的现象,抛开"共同理性"假设,提出了Nash均衡理论的另一个隐性前提"博弈的封闭性假设",进而引入"潜在参与人"的概念,扩展了博弈参与人的范围,从理论上指出开放环境下策略偏离者的支付增益可能导致博弈结果偏离原Nash均衡;然后举例说明,将随机扰动引入标准复制子动态,对一个两阶段重复囚徒博弈偏离预期均衡的原因进行剖析;最后基于CAS理论和多主体系统的建模思想,应用仿真实验进一步分析和验证了以上结论.
展开更多
关键词
纳什均衡
潜在参与人
进化博弈
有限次重复囚徒博弈
多主体系统
在线阅读
下载PDF
职称材料
基于证据理论的多Agent重复囚徒困境博弈研究
被引量:
3
2
作者
陈波
朱卫东
张洪涛
《系统工程学报》
CSCD
北大核心
2009年第6期653-659,共7页
在多Agent系统中,利用证据理论与重复囚徒困境博弈对其中的合作行为进行了研究.为加强Agent之间的合作行为,构建了基于信度函数的综合信任模型.该综合信任度的建立来于两个方面:一是由以前交互历史中观察的直接证据而得到的直接信任度,...
在多Agent系统中,利用证据理论与重复囚徒困境博弈对其中的合作行为进行了研究.为加强Agent之间的合作行为,构建了基于信度函数的综合信任模型.该综合信任度的建立来于两个方面:一是由以前交互历史中观察的直接证据而得到的直接信任度,二是由来自于第三方的推荐证据而得到的推荐信任度.基于综合信任模型,给出了多Agent重复囚徒困境博弈算法,并对所研究的问题进行了仿真.仿真结果表明,基于综合信任度的博弈策略能够有效地加强系统中的合作行为,提高系统的收益.
展开更多
关键词
博弈
重复囚徒困境
证据理论
Demp
s
ter合成
综合信任
在线阅读
下载PDF
职称材料
有限次重复囚徒博弈中的合作机制研究
3
作者
杨城
吕峻闽
缪春池
《计算机应用研究》
CSCD
北大核心
2012年第4期1322-1325,共4页
模仿现实中人们的决策方式,提出类"触发策略"的策略思想,将原问题由双策略的多阶段博弈转换为多策略的一次性博弈,并建立起扩展的支付矩阵;然后运用进化博弈理论,将随机扰动引入复制子动态,从理论上说明有限次重复囚徒博弈之...
模仿现实中人们的决策方式,提出类"触发策略"的策略思想,将原问题由双策略的多阶段博弈转换为多策略的一次性博弈,并建立起扩展的支付矩阵;然后运用进化博弈理论,将随机扰动引入复制子动态,从理论上说明有限次重复囚徒博弈之所以能够涌现合作是复制效应和变异效应共同作用的结果;最后通过建立多主体系统的仿真模型,进一步分析和验证了合作涌现的门限条件和稳定状态。
展开更多
关键词
有限次重复囚徒博弈
进化博弈
演化稳定策略
类“触发策略”
随机扰动
在线阅读
下载PDF
职称材料
重复囚徒困境的学习和响应模型
被引量:
2
4
作者
宋亦泠
王秉中
+1 位作者
朱洪
蔡晟
《计算机工程与科学》
CSCD
2007年第10期115-119,共5页
囚徒困境问题是博弈论的一个重要范例,对此的研究涉及经济学、社会学、生物学等广泛领域。Axelrod R在文献[1]中从进化的角度研究和探讨了经典囚徒困境的一个扩展——重复囚徒困境。这种博弈要求参与者反复进行囚徒困境的博弈,并且可以...
囚徒困境问题是博弈论的一个重要范例,对此的研究涉及经济学、社会学、生物学等广泛领域。Axelrod R在文献[1]中从进化的角度研究和探讨了经典囚徒困境的一个扩展——重复囚徒困境。这种博弈要求参与者反复进行囚徒困境的博弈,并且可以记住他们的对抗历史。Axelrod还组织了两次重复囚徒困境的计算机竞赛,最终胜出的都是简单的"以牙还牙"策略[2]。这之后有不少学者试图找到可以击败它的策略,都未能取得显著成功。本文提出了一种学习和响应的理论模型,实际中的许多重复囚徒困境的策略都可以纳入这一模型中。我们分析了实现这一模型的难点和复杂度,同时给出了一种基于树结构的实现方式,并在实验中把它和"以牙还牙"作比较。实验以及分析表明,策略在竞赛中表现的优劣主要取决于如何利用一些启发式规则来权衡学习代价和博弈的总利益,以及在此基础上如何抽取对手的关键信息。
展开更多
关键词
囚徒困境
重复囚徒困境
博弈论
学习和响应
在线阅读
下载PDF
职称材料
题名
从FIPD的合作现象看潜在参与人对Nash均衡的影响
被引量:
1
1
作者
杨城
朱超威
吕峻闽
机构
西南财经大学经济信息工程学院
宜春学院经管学院
中国人民大学商学院
出处
《管理科学学报》
CSSCI
北大核心
2013年第1期87-94,共8页
基金
国家社会科学基金资助项目(11AZD077)
西南财经大学创新团队建设项目
文摘
针对大量现实博弈与Nash均衡预测相背离的现象,抛开"共同理性"假设,提出了Nash均衡理论的另一个隐性前提"博弈的封闭性假设",进而引入"潜在参与人"的概念,扩展了博弈参与人的范围,从理论上指出开放环境下策略偏离者的支付增益可能导致博弈结果偏离原Nash均衡;然后举例说明,将随机扰动引入标准复制子动态,对一个两阶段重复囚徒博弈偏离预期均衡的原因进行剖析;最后基于CAS理论和多主体系统的建模思想,应用仿真实验进一步分析和验证了以上结论.
关键词
纳什均衡
潜在参与人
进化博弈
有限次重复囚徒博弈
多主体系统
Keywords
Na
s
h equilibrium
potential player
s
evolutionary game
finite iterated prisoner's dilemma(fipd)
multi-agent
s
y
s
tem
分类号
F224.32 [经济管理—国民经济]
在线阅读
下载PDF
职称材料
题名
基于证据理论的多Agent重复囚徒困境博弈研究
被引量:
3
2
作者
陈波
朱卫东
张洪涛
机构
合肥工业大学管理学院
出处
《系统工程学报》
CSCD
北大核心
2009年第6期653-659,共7页
基金
高等学校优秀青年人才基金资助项目(2009SQRZ011)
国家自然科学基金资助项目(J0624004
+1 种基金
J0824105)
合肥工业大学专项科研基金资助项目(2007GDBJ033)
文摘
在多Agent系统中,利用证据理论与重复囚徒困境博弈对其中的合作行为进行了研究.为加强Agent之间的合作行为,构建了基于信度函数的综合信任模型.该综合信任度的建立来于两个方面:一是由以前交互历史中观察的直接证据而得到的直接信任度,二是由来自于第三方的推荐证据而得到的推荐信任度.基于综合信任模型,给出了多Agent重复囚徒困境博弈算法,并对所研究的问题进行了仿真.仿真结果表明,基于综合信任度的博弈策略能够有效地加强系统中的合作行为,提高系统的收益.
关键词
博弈
重复囚徒困境
证据理论
Demp
s
ter合成
综合信任
Keywords
game
iterated
prisoner'
s
dilemma
(1PD)
evidence theory
Demp
s
ter combination
combined tru
s
t
分类号
F224.32 [经济管理—国民经济]
C934 [经济管理—管理学]
在线阅读
下载PDF
职称材料
题名
有限次重复囚徒博弈中的合作机制研究
3
作者
杨城
吕峻闽
缪春池
机构
西南财经大学经济信息工程学院
西南财经大学天府学院
出处
《计算机应用研究》
CSCD
北大核心
2012年第4期1322-1325,共4页
文摘
模仿现实中人们的决策方式,提出类"触发策略"的策略思想,将原问题由双策略的多阶段博弈转换为多策略的一次性博弈,并建立起扩展的支付矩阵;然后运用进化博弈理论,将随机扰动引入复制子动态,从理论上说明有限次重复囚徒博弈之所以能够涌现合作是复制效应和变异效应共同作用的结果;最后通过建立多主体系统的仿真模型,进一步分析和验证了合作涌现的门限条件和稳定状态。
关键词
有限次重复囚徒博弈
进化博弈
演化稳定策略
类“触发策略”
随机扰动
Keywords
finite iterated prisoner's dilemma(fipd)
evolutionary game
evolutionary
s
table
s
trategy(E
s
s
)
qua
s
i trigger
s
trategy(QT
s
)
s
tocha
s
tic di
s
turbance
分类号
F224.32 [经济管理—国民经济]
在线阅读
下载PDF
职称材料
题名
重复囚徒困境的学习和响应模型
被引量:
2
4
作者
宋亦泠
王秉中
朱洪
蔡晟
机构
复旦大学计算机科学与工程系
南京大学计算机科学与技术系
出处
《计算机工程与科学》
CSCD
2007年第10期115-119,共5页
文摘
囚徒困境问题是博弈论的一个重要范例,对此的研究涉及经济学、社会学、生物学等广泛领域。Axelrod R在文献[1]中从进化的角度研究和探讨了经典囚徒困境的一个扩展——重复囚徒困境。这种博弈要求参与者反复进行囚徒困境的博弈,并且可以记住他们的对抗历史。Axelrod还组织了两次重复囚徒困境的计算机竞赛,最终胜出的都是简单的"以牙还牙"策略[2]。这之后有不少学者试图找到可以击败它的策略,都未能取得显著成功。本文提出了一种学习和响应的理论模型,实际中的许多重复囚徒困境的策略都可以纳入这一模型中。我们分析了实现这一模型的难点和复杂度,同时给出了一种基于树结构的实现方式,并在实验中把它和"以牙还牙"作比较。实验以及分析表明,策略在竞赛中表现的优劣主要取决于如何利用一些启发式规则来权衡学习代价和博弈的总利益,以及在此基础上如何抽取对手的关键信息。
关键词
囚徒困境
重复囚徒困境
博弈论
学习和响应
Keywords
prisoner'
s
dilemma
iterated
prisoner'
s
dilemma
game theory
learning and re
s
pon
s
e
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
从FIPD的合作现象看潜在参与人对Nash均衡的影响
杨城
朱超威
吕峻闽
《管理科学学报》
CSSCI
北大核心
2013
1
在线阅读
下载PDF
职称材料
2
基于证据理论的多Agent重复囚徒困境博弈研究
陈波
朱卫东
张洪涛
《系统工程学报》
CSCD
北大核心
2009
3
在线阅读
下载PDF
职称材料
3
有限次重复囚徒博弈中的合作机制研究
杨城
吕峻闽
缪春池
《计算机应用研究》
CSCD
北大核心
2012
0
在线阅读
下载PDF
职称材料
4
重复囚徒困境的学习和响应模型
宋亦泠
王秉中
朱洪
蔡晟
《计算机工程与科学》
CSCD
2007
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部