检索结果-维普期刊中文期刊服务平台

从FIPD的合作现象看潜在参与人对Nash均衡的影响被引量：1: 1; 作者杨城朱超威吕峻闽《管理科学学报》 CSSCI 北大核心 2013年第1期87-94,共8页; 针对大量现实博弈与Nash均衡预测相背离的现象,抛开"共同理性"假设,提出了Nash均衡理论的另一个隐性前提"博弈的封闭性假设",进而引入"潜在参与人"的概念,扩展了博弈参与人的范围,从理论上指出开放环境... 展开更多; 关键词纳什均衡潜在参与人进化博弈有限次重复囚徒博弈多主体系统; 在线阅读下载PDF 职称材料

基于证据理论的多Agent重复囚徒困境博弈研究被引量：3: 2; 作者陈波朱卫东张洪涛《系统工程学报》 CSCD 北大核心 2009年第6期653-659,共7页; 在多Agent系统中,利用证据理论与重复囚徒困境博弈对其中的合作行为进行了研究.为加强Agent之间的合作行为,构建了基于信度函数的综合信任模型.该综合信任度的建立来于两个方面:一是由以前交互历史中观察的直接证据而得到的直接信任度,... 展开更多; 关键词博弈重复囚徒困境证据理论 Dempster合成综合信任; 在线阅读下载PDF 职称材料

有限次重复囚徒博弈中的合作机制研究: 3; 作者杨城吕峻闽缪春池《计算机应用研究》 CSCD 北大核心 2012年第4期1322-1325,共4页; 模仿现实中人们的决策方式,提出类"触发策略"的策略思想,将原问题由双策略的多阶段博弈转换为多策略的一次性博弈,并建立起扩展的支付矩阵;然后运用进化博弈理论,将随机扰动引入复制子动态,从理论上说明有限次重复囚徒博弈之... 展开更多; 关键词有限次重复囚徒博弈进化博弈演化稳定策略类“触发策略” 随机扰动; 在线阅读下载PDF 职称材料

重复囚徒困境的学习和响应模型被引量：2: 4; 作者宋亦泠王秉中 +1 位作者朱洪蔡晟《计算机工程与科学》 CSCD 2007年第10期115-119,共5页; 囚徒困境问题是博弈论的一个重要范例,对此的研究涉及经济学、社会学、生物学等广泛领域。Axelrod R在文献[1]中从进化的角度研究和探讨了经典囚徒困境的一个扩展——重复囚徒困境。这种博弈要求参与者反复进行囚徒困境的博弈,并且可以... 展开更多; 关键词囚徒困境重复囚徒困境博弈论学习和响应; 在线阅读下载PDF 职称材料

题名从FIPD的合作现象看潜在参与人对Nash均衡的影响被引量：1: 1; 作者杨城朱超威吕峻闽; 机构西南财经大学经济信息工程学院宜春学院经管学院中国人民大学商学院; 出处《管理科学学报》 CSSCI 北大核心 2013年第1期87-94,共8页; 基金国家社会科学基金资助项目(11AZD077) 西南财经大学创新团队建设项目; 文摘针对大量现实博弈与Nash均衡预测相背离的现象,抛开"共同理性"假设,提出了Nash均衡理论的另一个隐性前提"博弈的封闭性假设",进而引入"潜在参与人"的概念,扩展了博弈参与人的范围,从理论上指出开放环境下策略偏离者的支付增益可能导致博弈结果偏离原Nash均衡;然后举例说明,将随机扰动引入标准复制子动态,对一个两阶段重复囚徒博弈偏离预期均衡的原因进行剖析;最后基于CAS理论和多主体系统的建模思想,应用仿真实验进一步分析和验证了以上结论.; 关键词纳什均衡潜在参与人进化博弈有限次重复囚徒博弈多主体系统; Keywords Nash equilibrium potential players evolutionary game finite iterated prisoner＇s dilemma（fipd） multi-agent system; 分类号 F224.32 [经济管理—国民经济]; 在线阅读下载PDF 职称材料

题名基于证据理论的多Agent重复囚徒困境博弈研究被引量：3: 2; 作者陈波朱卫东张洪涛; 机构合肥工业大学管理学院; 出处《系统工程学报》 CSCD 北大核心 2009年第6期653-659,共7页; 基金高等学校优秀青年人才基金资助项目(2009SQRZ011) 国家自然科学基金资助项目(J0624004 +1 种基金 J0824105) 合肥工业大学专项科研基金资助项目(2007GDBJ033); 文摘在多Agent系统中,利用证据理论与重复囚徒困境博弈对其中的合作行为进行了研究.为加强Agent之间的合作行为,构建了基于信度函数的综合信任模型.该综合信任度的建立来于两个方面:一是由以前交互历史中观察的直接证据而得到的直接信任度,二是由来自于第三方的推荐证据而得到的推荐信任度.基于综合信任模型,给出了多Agent重复囚徒困境博弈算法,并对所研究的问题进行了仿真.仿真结果表明,基于综合信任度的博弈策略能够有效地加强系统中的合作行为,提高系统的收益.; 关键词博弈重复囚徒困境证据理论 Dempster合成综合信任; Keywords game iterated prisoner＇ s dilemma （1PD） evidence theory Dempster combination combined trust; 分类号 F224.32 [经济管理—国民经济] C934 [经济管理—管理学]; 在线阅读下载PDF 职称材料

题名有限次重复囚徒博弈中的合作机制研究: 3; 作者杨城吕峻闽缪春池; 机构西南财经大学经济信息工程学院西南财经大学天府学院; 出处《计算机应用研究》 CSCD 北大核心 2012年第4期1322-1325,共4页; 文摘模仿现实中人们的决策方式,提出类"触发策略"的策略思想,将原问题由双策略的多阶段博弈转换为多策略的一次性博弈,并建立起扩展的支付矩阵;然后运用进化博弈理论,将随机扰动引入复制子动态,从理论上说明有限次重复囚徒博弈之所以能够涌现合作是复制效应和变异效应共同作用的结果;最后通过建立多主体系统的仿真模型,进一步分析和验证了合作涌现的门限条件和稳定状态。; 关键词有限次重复囚徒博弈进化博弈演化稳定策略类“触发策略” 随机扰动; Keywords finite iterated prisoner＇s dilemma（fipd） evolutionary game evolutionary stable strategy（Ess） quasi trigger strategy（QTs） stochastic disturbance; 分类号 F224.32 [经济管理—国民经济]; 在线阅读下载PDF 职称材料

题名重复囚徒困境的学习和响应模型被引量：2: 4; 作者宋亦泠王秉中朱洪蔡晟; 机构复旦大学计算机科学与工程系南京大学计算机科学与技术系; 出处《计算机工程与科学》 CSCD 2007年第10期115-119,共5页; 文摘囚徒困境问题是博弈论的一个重要范例,对此的研究涉及经济学、社会学、生物学等广泛领域。Axelrod R在文献[1]中从进化的角度研究和探讨了经典囚徒困境的一个扩展——重复囚徒困境。这种博弈要求参与者反复进行囚徒困境的博弈,并且可以记住他们的对抗历史。Axelrod还组织了两次重复囚徒困境的计算机竞赛,最终胜出的都是简单的"以牙还牙"策略[2]。这之后有不少学者试图找到可以击败它的策略,都未能取得显著成功。本文提出了一种学习和响应的理论模型,实际中的许多重复囚徒困境的策略都可以纳入这一模型中。我们分析了实现这一模型的难点和复杂度,同时给出了一种基于树结构的实现方式,并在实验中把它和"以牙还牙"作比较。实验以及分析表明,策略在竞赛中表现的优劣主要取决于如何利用一些启发式规则来权衡学习代价和博弈的总利益,以及在此基础上如何抽取对手的关键信息。; 关键词囚徒困境重复囚徒困境博弈论学习和响应; Keywords prisoner＇ s dilemma iterated prisoner＇ s dilemma game theory learning and response; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	从FIPD的合作现象看潜在参与人对Nash均衡的影响	杨城朱超威吕峻闽	《管理科学学报》 CSSCI 北大核心	2013	1	在线阅读下载PDF 职称材料
2	基于证据理论的多Agent重复囚徒困境博弈研究	陈波朱卫东张洪涛	《系统工程学报》 CSCD 北大核心	2009	3	在线阅读下载PDF 职称材料
3	有限次重复囚徒博弈中的合作机制研究	杨城吕峻闽缪春池	《计算机应用研究》 CSCD 北大核心	2012	0	在线阅读下载PDF 职称材料
4	重复囚徒困境的学习和响应模型	宋亦泠王秉中朱洪蔡晟	《计算机工程与科学》 CSCD	2007	2	在线阅读下载PDF 职称材料