检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种基于最优策略概率分布的POMDP值迭代算法被引量：4: 1; 作者刘峰王崇骏骆斌《电子学报》 EI CAS CSCD 北大核心 2016年第5期1078-1084,共7页; 随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该... 展开更多; 关键词部分可观测马尔科夫决策过程基于最优策略概率的值迭代算法蒙特卡罗法; 在线阅读下载PDF 职称材料

基于半马氏的无限阶段指数效用最优模型: 2; 作者温鲜霍海峰《应用概率统计》 CSCD 北大核心 2023年第4期577-588,共12页; 本文考虑半马氏决策过程的指数效用最优问题,其中状态和行动空间均为Borel集,报酬函数非负.最优准则是最大化系统无限阶段内获取总报酬指数效用的期望值.首先,建立标准正则性条件确保状态过程非爆炸,连续-紧条件确保最优策略存在.其次,... 展开更多; 关键词半马氏决策过程指数效用值迭代最优方程最优策略; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部