期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
离散时间折扣多目标马氏决策模型:加权与字典序准则 被引量:1
1
作者 贾让成 《运筹与管理》 CSCD 1999年第1期6-9,共4页
定义了离散时间折扣多目标马氏决策模型,在加权准则下,证明了存在(n,∞)最优马氏策略;在字典序准则下,利用最优策略的结构性质,将其最优问题转化为一系列单目标模型的最优问题。
关键词 离散时间折扣多目标马氏决策模型 加权准则 字典序准则 最优策略
在线阅读 下载PDF
字典序下的折扣多目标半马氏决策模型
2
作者 贾让成 《西安电子科技大学学报》 EI CAS CSCD 北大核心 1989年第2期55-63,共9页
本文定义了一多目标马氏决策模型(MOSMDM),并利用半马氏决策模型最优策略的结构性质将MOSMDM的(K)阶段最优问题(利用字典序定义的)转化为一等价半马氏决策模型SMDM(K),进而讨论了(K)阶段最优策略的结构性质,利用参考文献2的结论,我们证... 本文定义了一多目标马氏决策模型(MOSMDM),并利用半马氏决策模型最优策略的结构性质将MOSMDM的(K)阶段最优问题(利用字典序定义的)转化为一等价半马氏决策模型SMDM(K),进而讨论了(K)阶段最优策略的结构性质,利用参考文献2的结论,我们证明了通常之半马氏决策模型的(K)阶矩最优问题原来就是一特殊MOSMDM的(K)阶段最优问题。 展开更多
关键词 多目标 折扣模型 马氏决策
在线阅读 下载PDF
Q(f)-过程非唯一时连续时间折扣目标MDP
3
作者 郭先平 《湖南师范大学自然科学学报》 CAS 1996年第3期7-12,共6页
考虑的是可数状态空间连续时间MDP的折扣模型,与以往不同的是,我们放弃了由策略f所确定的Q(f)-过程唯一的传统假设.而首次考虑Q(f)-过程非唯一的情形,借助于Q-过程的构造理论,用拓扑分析的方法,证明了最优策略的... 考虑的是可数状态空间连续时间MDP的折扣模型,与以往不同的是,我们放弃了由策略f所确定的Q(f)-过程唯一的传统假设.而首次考虑Q(f)-过程非唯一的情形,借助于Q-过程的构造理论,用拓扑分析的方法,证明了最优策略的存在性. 展开更多
关键词 连续时间 折扣目标 Q过程 马氏决策规划
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部