期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
风险概率准则下的非平稳马氏决策过程
1
作者 温馨 徐小雅 郭先平 《应用概率统计》 CSCD 北大核心 2023年第4期589-603,共15页
本文研究一类非平稳离散马氏决策过程的风险概率最小化问题,其中转移概率和奖励函数随时间变化.与现有文献中的期望报酬/成本准则不同,本文考虑最小化系统在首次到达某个目标集之前获得的总报酬未能达到给定利润目标的概率.在合理的假... 本文研究一类非平稳离散马氏决策过程的风险概率最小化问题,其中转移概率和奖励函数随时间变化.与现有文献中的期望报酬/成本准则不同,本文考虑最小化系统在首次到达某个目标集之前获得的总报酬未能达到给定利润目标的概率.在合理的假设条件下,我们建立了相应的最优方程序列,验证了最优风险函数序列是最优方程序列的唯一解,并证明了最优马氏策略的存在性. 展开更多
关键词 非平稳离散马氏决策过程 风险概率准则 最优方程序列 首达时间 最优马氏策略
在线阅读 下载PDF
非齐次马氏决策过程的齐次化
2
作者 侯振挺 郭先平 《数学物理学报(A辑)》 CSCD 北大核心 1997年第4期432-438,共7页
该文考虑的是可数状态空间有限行动空间非齐次马氏决策过程的期望总报酬准则.与以往不同的是,我们是通过扩大状态空间的方法,将非齐次的马氏决策过程转化成齐次的马氏决策过程,于是非常简洁地得到了按传统的方法所得的主要结果.
关键词 马氏决策过程 齐次 齐次 期望总报酬准则
在线阅读 下载PDF
基于平稳离散小波变换的地震动时程模拟 被引量:5
3
作者 白泉 朱浮声 边晶梅 《世界地震工程》 CSCD 北大核心 2009年第3期124-129,共6页
人工地震动时程的模拟是结构抗震分析的热点问题。基于平稳离散小波变换理论,利用小波变换的带通滤波特性,推导了各频带小波系数与功率谱密度函数的关系,从而直接采用时变功率谱密度函数,在不同频带上随机生成小波系数,进而通过小波逆... 人工地震动时程的模拟是结构抗震分析的热点问题。基于平稳离散小波变换理论,利用小波变换的带通滤波特性,推导了各频带小波系数与功率谱密度函数的关系,从而直接采用时变功率谱密度函数,在不同频带上随机生成小波系数,进而通过小波逆变换模拟出同时具有强度非平稳和频率非平稳的地震动时程。对模拟时程的统计特性与目标值进行了比较,证明了该方法的可行性和正确性。 展开更多
关键词 平稳离散小波变换 地震动时程模拟 时变功率谱 平稳过程
在线阅读 下载PDF
一种有限时段Markov决策过程的强化学习算法 被引量:4
4
作者 李春贵 刘永信 《广西工学院学报》 CAS 2003年第1期1-4,共4页
研究有限时段非平稳的 Markov决策过程的强化学习算法。通过引入一个人工吸收状态 ,把有限时段问题变为无限时段问题 ,从而可利用通常的强化学习方法来求解。在文献 [3]提出的算法思想基础上 ,提出了一种新的有限时段非平稳的 Markov决... 研究有限时段非平稳的 Markov决策过程的强化学习算法。通过引入一个人工吸收状态 ,把有限时段问题变为无限时段问题 ,从而可利用通常的强化学习方法来求解。在文献 [3]提出的算法思想基础上 ,提出了一种新的有限时段非平稳的 Markov决策过程的强化学习算法 。 展开更多
关键词 强化学习 有限时段 MARKOV决策过程 无完全模型 库存控制 机器学习 平稳
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部