检索结果-维普期刊中文期刊服务平台

可数状态空间的平均成本马氏决策过程: 1; 作者张俊玉吴怡婷 +1 位作者夏俐曹希仁《控制理论与应用》 EI CAS CSCD 北大核心 2021年第11期1707-1716,共10页; 具有可数状态空间的马尔可夫决策过程(Markov decision process,MDP)在平均准则下,最优(平稳)策略不一定存在.本文研究平均准则可数状态MDP中满足最优不等式的最优策略.不同于消去折扣(因子)方法,利用离散的Dynkin公式推导本文的主要结... 展开更多; 关键词马尔可夫决策过程平均准则可数状态空间 Dynkin公式泊松方程性能敏感; 在线阅读下载PDF 职称材料

可数状态空间的马氏过程的小参数大偏差估计: 2; 作者胡亦钧《数学年刊（A辑）》 CSCD 北大核心 1995年第1期1-7,共7页; 设Ｘ＝｛Ｘｔ；ｔ≥０｝是取值于可列状态空间的马氏过程．本文讨论了Ｘε＝｛Ｘεｔ；ｔ∈［０，１］当Ｏ时的大偏差性质，其速率函数由马氏过程的跳跃次数所决定．; 关键词马氏过程大偏差估计扩散过程可数状态空间; 在线阅读下载PDF 职称材料

带有无界赔付函数的非零和随机对策折扣模型: 3; 作者杨洁郭先平《中山大学学报（自然科学版）》 CAS CSCD 北大核心 2008年第5期23-27,36,共6页; 讨论了赔付函数可能既无上界又无下界的离散时间可数状态非零和随机对策的折扣模型。在零和随机对策中常用的"漂移"和"连续-紧"性条件下,用Fan's不动点定理证明了Nash平衡点的存在性。; 关键词非零和随机对策期望折扣赔付准则 NASH平衡点可数状态空间; 在线阅读下载PDF 职称材料