检索结果-维普期刊中文期刊服务平台

基于多Agent的交互式动态影响图研究、应用与展望被引量：1: 1; 作者罗键李波 +2 位作者潘颖慧尹华一吴长庆《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2011年第2期253-260,共8页; 交互式动态影响图(I-DIDs)是不确定环境下多Agent序贯决策的图模型.该模型突破传统基于公共知识的纳什均衡点的假设,使得该模型具备解决大规模动态决策问题的能力,具有更为广泛的应用前景.在总结、分析动态影响图研究成果的基础上,针对... 展开更多; 关键词交互式动态影响图多AGENT 动态决策自动小车; 在线阅读下载PDF 职称材料

基于KL距离的交互式动态影响图近似算法被引量：2: 2; 作者田乐罗键 +1 位作者曹浪财陈志平《系统工程与电子技术》 EI CSCD 北大核心 2013年第1期207-211,共5页; 交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model update... 展开更多; 关键词多AGENT决策交互式动态影响图行为等价近似行为等价 Kullback—Leibler(KL)距离; 在线阅读下载PDF 职称材料

多Agent交互式动态影响图的建模方法被引量：2: 3; 作者潘颖慧罗键曾一锋《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2012年第6期985-990,共6页; 交互式动态影响图是一种以动态影响图为基础,利用有向图构造Agent之间交互作用的决策概率模型,目前只能解决2个Agent的问题.根据概率图模型理论、交互式部分可观测马尔可夫决策过程性质、最大奖励期望值原理等以3个Agent为例建立多Agen... 展开更多; 关键词交互式动态影响图多AGENT建模概率图模型; 在线阅读下载PDF 职称材料

基于lookahead的交互式动态影响图的DMU改进算法: 4; 作者田乐曹浪财《系统工程与电子技术》 EI CSCD 北大核心 2014年第6期1201-1206,共6页; 区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足... 展开更多; 关键词多AGENT 决策交互式动态影响图行为等价近似行为等价前瞻; 在线阅读下载PDF 职称材料

题名基于多Agent的交互式动态影响图研究、应用与展望被引量：1: 1; 作者罗键李波潘颖慧尹华一吴长庆; 机构厦门大学信息科学与技术学院; 出处《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2011年第2期253-260,共8页; 基金国家自然科学基金项目(60975052); 文摘交互式动态影响图(I-DIDs)是不确定环境下多Agent序贯决策的图模型.该模型突破传统基于公共知识的纳什均衡点的假设,使得该模型具备解决大规模动态决策问题的能力,具有更为广泛的应用前景.在总结、分析动态影响图研究成果的基础上,针对多Agent的I-DIDs状态空间随时间片的增长呈指数级增长问题,提出了基于行为等价和动作等价的两种新型算法并进行算法分析;此外,探讨应用I-DIDs模型解决自动小车存取系统中的路径规划、避免环路死锁问题,扩展了I-DIDs的应用范围.; 关键词交互式动态影响图多AGENT 动态决策自动小车; Keywords interactive dynamic influence diagrams multi-agent dynamic decision automatic vehicle; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于KL距离的交互式动态影响图近似算法被引量：2: 2; 作者田乐罗键曹浪财陈志平; 机构厦门大学信息科学与技术学院; 出处《系统工程与电子技术》 EI CSCD 北大核心 2013年第1期207-211,共5页; 基金国家自然科学基金(60975052)资助课题; 文摘交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model updates,DMU)相结合的近似算法。首先给出了基于Kullback-Leibler(KL)距离模型行为等价和近似行为等价的定义,然后基于KL距离和候选模型的动作对候选模型聚类,自上而下合并策略树形成策略图,最后利用DMU算法进行求解。仿真结果表明,相对于传统的DMU算法,所提近似算法能显著降低候选模型的数量,提高I-DIDs的效率,对I-DIDs的理论及应用研究具有参考价值。; 关键词多AGENT决策交互式动态影响图行为等价近似行为等价 Kullback—Leibler(KL)距离; Keywords multi-Agent decisionl interactive dynamic influence diagram（I-DID） behavioral equivalence approximate behavioral equivalencel Kullback-Leibler （KL） distance; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名多Agent交互式动态影响图的建模方法被引量：2: 3; 作者潘颖慧罗键曾一锋; 机构厦门大学信息科学与技术学院; 出处《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2012年第6期985-990,共6页; 基金国家自然科学基金项目(60975052) 江西省教育厅科技重点项目(GJJ10695); 文摘交互式动态影响图是一种以动态影响图为基础,利用有向图构造Agent之间交互作用的决策概率模型,目前只能解决2个Agent的问题.根据概率图模型理论、交互式部分可观测马尔可夫决策过程性质、最大奖励期望值原理等以3个Agent为例建立多Agent交互式动态影响图(I-MADIDs)模型,探讨除建模Agent之外,其他非建模Agent之间存在稳定关系时,如何简化I-MADIDs模型.最后对老虎问题进行建模,利用HUGIN7.0对其进行求解,分别讨论了建模A-gent和其他Agent的决策情况,对比了精确方法和简化模型中贝叶斯参数学习近似方法中Agent的决策情况,证明了近似方法的有效性.; 关键词交互式动态影响图多AGENT建模概率图模型; Keywords interaetive dynamic influence diagrams multi-agent modeling probabilistic graph model; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于lookahead的交互式动态影响图的DMU改进算法: 4; 作者田乐曹浪财; 机构厦门大学信息科学与技术学院自动化系; 出处《系统工程与电子技术》 EI CSCD 北大核心 2014年第6期1201-1206,共6页; 基金国家自然科学基金(61375070)资助课题; 文摘区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足近似行为等价的模型聚类形成代表模型集合,然后自上而下对代表模型进行更新,在模型更新过程中,只更新那些与其他模型预测行为不同的模型。结合lookahead思想提出了一种判断模型近似行为等价的方法。与DMU算法相比,该算法能迅速有效地减少模型的数量,从而减少了计算机的存储空间和运行时间,提高了算法的效率。最后通过对多Agent老虎问题及机器维修问题实验来验证所提方法的有效性。; 关键词多AGENT 决策交互式动态影响图行为等价近似行为等价前瞻; Keywords multi-agent decision interactive dynamic influence diagrams （I-DIDs） behavioral equivalence approximate behavioral equivalence lookahead; 分类号 TP301.6 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于多Agent的交互式动态影响图研究、应用与展望	罗键李波潘颖慧尹华一吴长庆	《厦门大学学报（自然科学版）》 CAS CSCD 北大核心	2011	1	在线阅读下载PDF 职称材料
2	基于KL距离的交互式动态影响图近似算法	田乐罗键曹浪财陈志平	《系统工程与电子技术》 EI CSCD 北大核心	2013	2	在线阅读下载PDF 职称材料
3	多Agent交互式动态影响图的建模方法	潘颖慧罗键曾一锋	《厦门大学学报（自然科学版）》 CAS CSCD 北大核心	2012	2	在线阅读下载PDF 职称材料
4	基于lookahead的交互式动态影响图的DMU改进算法	田乐曹浪财	《系统工程与电子技术》 EI CSCD 北大核心	2014	0	在线阅读下载PDF 职称材料