期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于独立任务的POMDP问题的解决方法
1
作者
房俊恒
朱斐
+2 位作者
刘全
伏玉琛
凌兴宏
《计算机应用研究》
CSCD
北大核心
2016年第1期147-152,共6页
通常利用POMDPs对在部分可观测的随机环境中决策的agents建模。针对完整POMDP的求解方法扩展能力弱的问题,提出把多元POMDP分解成多个受限制的POMDPs,然后独立求解每个模型,以获得值函数,并将这些受限制的POMDPs的值函数结合起来以便获...
通常利用POMDPs对在部分可观测的随机环境中决策的agents建模。针对完整POMDP的求解方法扩展能力弱的问题,提出把多元POMDP分解成多个受限制的POMDPs,然后独立求解每个模型,以获得值函数,并将这些受限制的POMDPs的值函数结合起来以便获得完整POMDP策略。该方法主要阐述识别与独立任务相关的状态变量的过程,以及如何构造被限制在单独任务上的模型。将该方法应用到两个不同规模的岩石采样问题中,实验结果表明,该方法能够获得很好的策略。
展开更多
关键词
POMDP
基于点的算法
相互独立的任务
多元POMDP
受限制的POMDPs
在线阅读
下载PDF
职称材料
题名
一种基于独立任务的POMDP问题的解决方法
1
作者
房俊恒
朱斐
刘全
伏玉琛
凌兴宏
机构
苏州大学计算机科学与技术学院
吉林大学符号计算与知识工程教育部重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2016年第1期147-152,共6页
基金
国家自然科学基金资助项目(61103045
61272005
+5 种基金
61272244
61303108
61373094)
江苏省自然科学基金资助项目(BK2012616)
江苏省高校自然科学研究项目(13KJB520020)
吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172014K04)
文摘
通常利用POMDPs对在部分可观测的随机环境中决策的agents建模。针对完整POMDP的求解方法扩展能力弱的问题,提出把多元POMDP分解成多个受限制的POMDPs,然后独立求解每个模型,以获得值函数,并将这些受限制的POMDPs的值函数结合起来以便获得完整POMDP策略。该方法主要阐述识别与独立任务相关的状态变量的过程,以及如何构造被限制在单独任务上的模型。将该方法应用到两个不同规模的岩石采样问题中,实验结果表明,该方法能够获得很好的策略。
关键词
POMDP
基于点的算法
相互独立的任务
多元POMDP
受限制的POMDPs
Keywords
POMDP
point-based algorithms
independent-tasks
factored POMDP
restricted POMDPs
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于独立任务的POMDP问题的解决方法
房俊恒
朱斐
刘全
伏玉琛
凌兴宏
《计算机应用研究》
CSCD
北大核心
2016
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部