期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于KL距离的交互式动态影响图近似算法
被引量:
2
1
作者
田乐
罗键
+1 位作者
曹浪财
陈志平
《系统工程与电子技术》
EI
CSCD
北大核心
2013年第1期207-211,共5页
交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model update...
交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model updates,DMU)相结合的近似算法。首先给出了基于Kullback-Leibler(KL)距离模型行为等价和近似行为等价的定义,然后基于KL距离和候选模型的动作对候选模型聚类,自上而下合并策略树形成策略图,最后利用DMU算法进行求解。仿真结果表明,相对于传统的DMU算法,所提近似算法能显著降低候选模型的数量,提高I-DIDs的效率,对I-DIDs的理论及应用研究具有参考价值。
展开更多
关键词
多AGENT决策
交互式动态影响图
行为
等价
近似行为等价
Kullback—Leibler(KL)距离
在线阅读
下载PDF
职称材料
基于lookahead的交互式动态影响图的DMU改进算法
2
作者
田乐
曹浪财
《系统工程与电子技术》
EI
CSCD
北大核心
2014年第6期1201-1206,共6页
区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足...
区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足近似行为等价的模型聚类形成代表模型集合,然后自上而下对代表模型进行更新,在模型更新过程中,只更新那些与其他模型预测行为不同的模型。结合lookahead思想提出了一种判断模型近似行为等价的方法。与DMU算法相比,该算法能迅速有效地减少模型的数量,从而减少了计算机的存储空间和运行时间,提高了算法的效率。最后通过对多Agent老虎问题及机器维修问题实验来验证所提方法的有效性。
展开更多
关键词
多AGENT
决策
交互式动态影响图
行为
等价
近似行为等价
前瞻
在线阅读
下载PDF
职称材料
题名
基于KL距离的交互式动态影响图近似算法
被引量:
2
1
作者
田乐
罗键
曹浪财
陈志平
机构
厦门大学信息科学与技术学院
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2013年第1期207-211,共5页
基金
国家自然科学基金(60975052)资助课题
文摘
交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model updates,DMU)相结合的近似算法。首先给出了基于Kullback-Leibler(KL)距离模型行为等价和近似行为等价的定义,然后基于KL距离和候选模型的动作对候选模型聚类,自上而下合并策略树形成策略图,最后利用DMU算法进行求解。仿真结果表明,相对于传统的DMU算法,所提近似算法能显著降低候选模型的数量,提高I-DIDs的效率,对I-DIDs的理论及应用研究具有参考价值。
关键词
多AGENT决策
交互式动态影响图
行为
等价
近似行为等价
Kullback—Leibler(KL)距离
Keywords
multi-Agent decisionl interactive dynamic influence diagram(I-DID)
behavioral equivalence approximate behavioral equivalencel Kullback-Leibler (KL) distance
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于lookahead的交互式动态影响图的DMU改进算法
2
作者
田乐
曹浪财
机构
厦门大学信息科学与技术学院自动化系
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2014年第6期1201-1206,共6页
基金
国家自然科学基金(61375070)资助课题
文摘
区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足近似行为等价的模型聚类形成代表模型集合,然后自上而下对代表模型进行更新,在模型更新过程中,只更新那些与其他模型预测行为不同的模型。结合lookahead思想提出了一种判断模型近似行为等价的方法。与DMU算法相比,该算法能迅速有效地减少模型的数量,从而减少了计算机的存储空间和运行时间,提高了算法的效率。最后通过对多Agent老虎问题及机器维修问题实验来验证所提方法的有效性。
关键词
多AGENT
决策
交互式动态影响图
行为
等价
近似行为等价
前瞻
Keywords
multi-agent decision
interactive dynamic influence diagrams (I-DIDs)
behavioral equivalence
approximate behavioral equivalence
lookahead
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于KL距离的交互式动态影响图近似算法
田乐
罗键
曹浪财
陈志平
《系统工程与电子技术》
EI
CSCD
北大核心
2013
2
在线阅读
下载PDF
职称材料
2
基于lookahead的交互式动态影响图的DMU改进算法
田乐
曹浪财
《系统工程与电子技术》
EI
CSCD
北大核心
2014
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部