题名 风险概率准则下的非平稳马氏决策过程
1
作者
温馨
徐小雅
郭先平
机构
中山大学管理学院
广东财经大学工商管理学院
中山大学数学学院
出处
《应用概率统计》
CSCD
北大核心
2023年第4期589-603,共15页
基金
The research was supported by the National Natural Science Foundation of China(Grant Nos.11931018,72101059)
Guangdong Natural Science Foundation(Grant No.2020A1515010924).
文摘
本文研究一类非平稳离散马氏决策过程的风险概率最小化问题,其中转移概率和奖励函数随时间变化.与现有文献中的期望报酬/成本准则不同,本文考虑最小化系统在首次到达某个目标集之前获得的总报酬未能达到给定利润目标的概率.在合理的假设条件下,我们建立了相应的最优方程序列,验证了最优风险函数序列是最优方程序列的唯一解,并证明了最优马氏策略的存在性.
关键词
非平稳离散马氏决策过程
风险概率准则
最优方程序列
首达时间
最优马氏 策略
Keywords
nonstationary discrete-time Markov decision process
risk probability criterion
optimality equations
first passage time
optimal Markov policy
分类号
O211.62
[理学—概率论与数理统计]
题名 非齐次马氏决策过程的齐次化
2
作者
侯振挺
郭先平
机构
长沙铁道学院科研所
出处
《数学物理学报(A辑)》
CSCD
北大核心
1997年第4期432-438,共7页
基金
国家自然科学基金
文摘
该文考虑的是可数状态空间有限行动空间非齐次马氏决策过程的期望总报酬准则.与以往不同的是,我们是通过扩大状态空间的方法,将非齐次的马氏决策过程转化成齐次的马氏决策过程,于是非常简洁地得到了按传统的方法所得的主要结果.
关键词
马氏 决策 过程
非 齐次
齐次
期望总报酬准则
Keywords
Markov decision processes, Non-homogeneous, Homogenization, Optimal policies
分类号
O225
[理学—运筹学与控制论]
题名 基于平稳离散小波变换的地震动时程模拟
被引量:5
3
作者
白泉
朱浮声
边晶梅
机构
沈阳工业大学建筑工程学院
东北大学资源与土木工程学院
出处
《世界地震工程》
CSCD
北大核心
2009年第3期124-129,共6页
基金
辽宁省自然科学金基金项目(20052019)
文摘
人工地震动时程的模拟是结构抗震分析的热点问题。基于平稳离散小波变换理论,利用小波变换的带通滤波特性,推导了各频带小波系数与功率谱密度函数的关系,从而直接采用时变功率谱密度函数,在不同频带上随机生成小波系数,进而通过小波逆变换模拟出同时具有强度非平稳和频率非平稳的地震动时程。对模拟时程的统计特性与目标值进行了比较,证明了该方法的可行性和正确性。
关键词
平稳 离散 小波变换
地震动时程模拟
时变功率谱
非 平稳 过程
Keywords
discrete stationary wavelet transform
simulation of earthquake spectral density
nonstationary stochastic process ground motion
time - dependent power
分类号
TN911.7
[电子电信—通信与信息系统]
题名 一种有限时段Markov决策过程的强化学习算法
被引量:4
4
作者
李春贵
刘永信
机构
广西工学院计算机系
内蒙古大学自动化系
出处
《广西工学院学报》
CAS
2003年第1期1-4,共4页
文摘
研究有限时段非平稳的 Markov决策过程的强化学习算法。通过引入一个人工吸收状态 ,把有限时段问题变为无限时段问题 ,从而可利用通常的强化学习方法来求解。在文献 [3]提出的算法思想基础上 ,提出了一种新的有限时段非平稳的 Markov决策过程的强化学习算法 。
关键词
强化学习
有限时段
MARKOV决策 过程
无完全模型
库存控制
机器学习
非 平稳
Keywords
reinforcementlearning
Markov decision process
non stationary
inventory control
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]