-
题名基于KL距离的交互式动态影响图近似算法
被引量:2
- 1
-
-
作者
田乐
罗键
曹浪财
陈志平
-
机构
厦门大学信息科学与技术学院
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2013年第1期207-211,共5页
-
基金
国家自然科学基金(60975052)资助课题
-
文摘
交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model updates,DMU)相结合的近似算法。首先给出了基于Kullback-Leibler(KL)距离模型行为等价和近似行为等价的定义,然后基于KL距离和候选模型的动作对候选模型聚类,自上而下合并策略树形成策略图,最后利用DMU算法进行求解。仿真结果表明,相对于传统的DMU算法,所提近似算法能显著降低候选模型的数量,提高I-DIDs的效率,对I-DIDs的理论及应用研究具有参考价值。
-
关键词
多AGENT决策
交互式动态影响图
行为等价
近似行为等价
Kullback—Leibler(KL)距离
-
Keywords
multi-agent decisionl interactive dynamic influence diagram(i-did)
behavioral equivalence approximate behavioral equivalencel Kullback-Leibler (KL) distance
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-