期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
离散时间折扣多目标马氏决策模型:加权与字典序准则
被引量:
1
1
作者
贾让成
《运筹与管理》
CSCD
1999年第1期6-9,共4页
定义了离散时间折扣多目标马氏决策模型,在加权准则下,证明了存在(n,∞)最优马氏策略;在字典序准则下,利用最优策略的结构性质,将其最优问题转化为一系列单目标模型的最优问题。
关键词
离散时间折扣多目标马氏决策模型
加权准则
字典序准则
最优策略
在线阅读
下载PDF
职称材料
字典序下的折扣多目标半马氏决策模型
2
作者
贾让成
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
1989年第2期55-63,共9页
本文定义了一多目标马氏决策模型(MOSMDM),并利用半马氏决策模型最优策略的结构性质将MOSMDM的(K)阶段最优问题(利用字典序定义的)转化为一等价半马氏决策模型SMDM(K),进而讨论了(K)阶段最优策略的结构性质,利用参考文献2的结论,我们证...
本文定义了一多目标马氏决策模型(MOSMDM),并利用半马氏决策模型最优策略的结构性质将MOSMDM的(K)阶段最优问题(利用字典序定义的)转化为一等价半马氏决策模型SMDM(K),进而讨论了(K)阶段最优策略的结构性质,利用参考文献2的结论,我们证明了通常之半马氏决策模型的(K)阶矩最优问题原来就是一特殊MOSMDM的(K)阶段最优问题。
展开更多
关键词
多目标
折扣
模型
半
马氏
决策
在线阅读
下载PDF
职称材料
Q(f)-过程非唯一时连续时间折扣目标MDP
3
作者
郭先平
《湖南师范大学自然科学学报》
CAS
1996年第3期7-12,共6页
考虑的是可数状态空间连续时间MDP的折扣模型,与以往不同的是,我们放弃了由策略f所确定的Q(f)-过程唯一的传统假设.而首次考虑Q(f)-过程非唯一的情形,借助于Q-过程的构造理论,用拓扑分析的方法,证明了最优策略的...
考虑的是可数状态空间连续时间MDP的折扣模型,与以往不同的是,我们放弃了由策略f所确定的Q(f)-过程唯一的传统假设.而首次考虑Q(f)-过程非唯一的情形,借助于Q-过程的构造理论,用拓扑分析的方法,证明了最优策略的存在性.
展开更多
关键词
连续
时间
折扣
目标
Q过程
马氏
决策
规划
在线阅读
下载PDF
职称材料
题名
离散时间折扣多目标马氏决策模型:加权与字典序准则
被引量:
1
1
作者
贾让成
机构
宁波大学管理学系
出处
《运筹与管理》
CSCD
1999年第1期6-9,共4页
基金
宁波大学科研基金
文摘
定义了离散时间折扣多目标马氏决策模型,在加权准则下,证明了存在(n,∞)最优马氏策略;在字典序准则下,利用最优策略的结构性质,将其最优问题转化为一系列单目标模型的最优问题。
关键词
离散时间折扣多目标马氏决策模型
加权准则
字典序准则
最优策略
Keywords
discrete time Markov Decision Model with discounted multi rewards
weighted criteria
Lexicographically Order criteria
optimal policy
分类号
C934 [经济管理—管理学]
O225 [理学—运筹学与控制论]
在线阅读
下载PDF
职称材料
题名
字典序下的折扣多目标半马氏决策模型
2
作者
贾让成
机构
西安电子科技大学研究生部
出处
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
1989年第2期55-63,共9页
基金
国家自然科学基金
文摘
本文定义了一多目标马氏决策模型(MOSMDM),并利用半马氏决策模型最优策略的结构性质将MOSMDM的(K)阶段最优问题(利用字典序定义的)转化为一等价半马氏决策模型SMDM(K),进而讨论了(K)阶段最优策略的结构性质,利用参考文献2的结论,我们证明了通常之半马氏决策模型的(K)阶矩最优问题原来就是一特殊MOSMDM的(K)阶段最优问题。
关键词
多目标
折扣
模型
半
马氏
决策
Keywords
multiple objective
Semi-markov decision programming
duscount model
Optimal policies
moment optimal
分类号
O221 [理学—运筹学与控制论]
在线阅读
下载PDF
职称材料
题名
Q(f)-过程非唯一时连续时间折扣目标MDP
3
作者
郭先平
机构
湖南师范大学数学系
出处
《湖南师范大学自然科学学报》
CAS
1996年第3期7-12,共6页
基金
国家自然科学基金
湖南省自然科学基金
文摘
考虑的是可数状态空间连续时间MDP的折扣模型,与以往不同的是,我们放弃了由策略f所确定的Q(f)-过程唯一的传统假设.而首次考虑Q(f)-过程非唯一的情形,借助于Q-过程的构造理论,用拓扑分析的方法,证明了最优策略的存在性.
关键词
连续
时间
折扣
目标
Q过程
马氏
决策
规划
Keywords
countinuous time MDP
not uniqueness
discounted reward criterion
optimal policies
分类号
O211.6 [理学—概率论与数理统计]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
离散时间折扣多目标马氏决策模型:加权与字典序准则
贾让成
《运筹与管理》
CSCD
1999
1
在线阅读
下载PDF
职称材料
2
字典序下的折扣多目标半马氏决策模型
贾让成
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
1989
0
在线阅读
下载PDF
职称材料
3
Q(f)-过程非唯一时连续时间折扣目标MDP
郭先平
《湖南师范大学自然科学学报》
CAS
1996
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部