-
题名基于证据理论的多Agent重复囚徒困境博弈研究
被引量:3
- 1
-
-
作者
陈波
朱卫东
张洪涛
-
机构
合肥工业大学管理学院
-
出处
《系统工程学报》
CSCD
北大核心
2009年第6期653-659,共7页
-
基金
高等学校优秀青年人才基金资助项目(2009SQRZ011)
国家自然科学基金资助项目(J0624004
+1 种基金
J0824105)
合肥工业大学专项科研基金资助项目(2007GDBJ033)
-
文摘
在多Agent系统中,利用证据理论与重复囚徒困境博弈对其中的合作行为进行了研究.为加强Agent之间的合作行为,构建了基于信度函数的综合信任模型.该综合信任度的建立来于两个方面:一是由以前交互历史中观察的直接证据而得到的直接信任度,二是由来自于第三方的推荐证据而得到的推荐信任度.基于综合信任模型,给出了多Agent重复囚徒困境博弈算法,并对所研究的问题进行了仿真.仿真结果表明,基于综合信任度的博弈策略能够有效地加强系统中的合作行为,提高系统的收益.
-
关键词
博弈
重复囚徒困境
证据理论
Dempster合成
综合信任
-
Keywords
game
iterated prisoner' s dilemma (1pd)
evidence theory
Dempster combination
combined trust
-
分类号
F224.32
[经济管理—国民经济]
C934
[经济管理—管理学]
-
-
题名遗传算法求解囚犯困境问题
- 2
-
-
作者
丁晶
吴萍
-
机构
华东师范大学计算中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第30期67-70,共4页
-
文摘
囚犯困境问题是个哲学问题。随着对它研究的深入,这个问题已经作为一种模型被应用到现实社会的很多领域:经济学、社会学、商务谈判。这就提出了一个问题:如何有效地求解囚犯困境问题。利用遗传算法,对囚犯困境问题进行了求解。并且根据所提的算法进行了实验。证明该方法用于求解囚犯困境问题的可行性。
-
关键词
对称2*2囚犯困境
可重复的囚犯困境
遗传算法
-
Keywords
symmetric 2*2 pd with ordinal payoffs
iterated prisoner's dilemma
genetic algorithms
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名重复囚徒困境的学习和响应模型
被引量:2
- 3
-
-
作者
宋亦泠
王秉中
朱洪
蔡晟
-
机构
复旦大学计算机科学与工程系
南京大学计算机科学与技术系
-
出处
《计算机工程与科学》
CSCD
2007年第10期115-119,共5页
-
文摘
囚徒困境问题是博弈论的一个重要范例,对此的研究涉及经济学、社会学、生物学等广泛领域。Axelrod R在文献[1]中从进化的角度研究和探讨了经典囚徒困境的一个扩展——重复囚徒困境。这种博弈要求参与者反复进行囚徒困境的博弈,并且可以记住他们的对抗历史。Axelrod还组织了两次重复囚徒困境的计算机竞赛,最终胜出的都是简单的"以牙还牙"策略[2]。这之后有不少学者试图找到可以击败它的策略,都未能取得显著成功。本文提出了一种学习和响应的理论模型,实际中的许多重复囚徒困境的策略都可以纳入这一模型中。我们分析了实现这一模型的难点和复杂度,同时给出了一种基于树结构的实现方式,并在实验中把它和"以牙还牙"作比较。实验以及分析表明,策略在竞赛中表现的优劣主要取决于如何利用一些启发式规则来权衡学习代价和博弈的总利益,以及在此基础上如何抽取对手的关键信息。
-
关键词
囚徒困境
重复囚徒困境
博弈论
学习和响应
-
Keywords
prisoner' s dilemma
iterated prisoner' s dilemma
game theory
learning and response
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-