期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于KL距离的交互式动态影响图近似算法 被引量:2
1
作者 田乐 罗键 +1 位作者 曹浪财 陈志平 《系统工程与电子技术》 EI CSCD 北大核心 2013年第1期207-211,共5页
交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model update... 交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model updates,DMU)相结合的近似算法。首先给出了基于Kullback-Leibler(KL)距离模型行为等价和近似行为等价的定义,然后基于KL距离和候选模型的动作对候选模型聚类,自上而下合并策略树形成策略图,最后利用DMU算法进行求解。仿真结果表明,相对于传统的DMU算法,所提近似算法能显著降低候选模型的数量,提高I-DIDs的效率,对I-DIDs的理论及应用研究具有参考价值。 展开更多
关键词 多AGENT决策 交互式动态影响图 行为等价 近似行为等价 Kullback—Leibler(KL)距离
在线阅读 下载PDF
基于lookahead的交互式动态影响图的DMU改进算法
2
作者 田乐 曹浪财 《系统工程与电子技术》 EI CSCD 北大核心 2014年第6期1201-1206,共6页
区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足... 区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足近似行为等价的模型聚类形成代表模型集合,然后自上而下对代表模型进行更新,在模型更新过程中,只更新那些与其他模型预测行为不同的模型。结合lookahead思想提出了一种判断模型近似行为等价的方法。与DMU算法相比,该算法能迅速有效地减少模型的数量,从而减少了计算机的存储空间和运行时间,提高了算法的效率。最后通过对多Agent老虎问题及机器维修问题实验来验证所提方法的有效性。 展开更多
关键词 多AGENT 决策 交互式动态影响图 行为等价 近似行为等价 前瞻
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部