期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Polish空间上的折扣马氏过程量子化策略的渐近优化
1
作者
吴晓
孔荫莹
郭圳滨
《数学物理学报(A辑)》
CSCD
北大核心
2022年第2期594-604,共11页
该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对...
该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果.
展开更多
关键词
连续时间马尔可夫决策过程
依赖状态折扣因子
折扣准则
量子化平稳策略
渐近最优性
在线阅读
下载PDF
职称材料
题名
Polish空间上的折扣马氏过程量子化策略的渐近优化
1
作者
吴晓
孔荫莹
郭圳滨
机构
肇庆学院数学与统计学院
广东财经大学智能财会管理学院
广发证券股份有限公司发展研究中心
出处
《数学物理学报(A辑)》
CSCD
北大核心
2022年第2期594-604,共11页
基金
国家自然科学基金(11961005)
中山大学广东省计算科学重点实验室开放基金(2021021)
+1 种基金
广东省普通高校重点领域(新一代信息技术)基金(2020ZDZX3019)
广州市科技计划项目(202102080420)。
文摘
该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果.
关键词
连续时间马尔可夫决策过程
依赖状态折扣因子
折扣准则
量子化平稳策略
渐近最优性
Keywords
Continuous-time Markov decision processes
State-dependent discount factors
Discounted criterion
Quantized stationary policies
Asymptotic optimality
分类号
O211.6 [理学—概率论与数理统计]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Polish空间上的折扣马氏过程量子化策略的渐近优化
吴晓
孔荫莹
郭圳滨
《数学物理学报(A辑)》
CSCD
北大核心
2022
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部