期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
随机线性二次问题中一类改进的强化学习方法
1
作者 高晋鹏 《科技创新与应用》 2024年第32期142-145,共4页
随机线性二次问题是一类重要且研究较为成熟的随机控制问题。其中,部分信息条件下的随机线性二次问题是指系统的状态方程或代价函数中存在未知系数的情形,该文在前人工作的基础上,改进部分信息条件下线性二次问题的最优控制在线强化学... 随机线性二次问题是一类重要且研究较为成熟的随机控制问题。其中,部分信息条件下的随机线性二次问题是指系统的状态方程或代价函数中存在未知系数的情形,该文在前人工作的基础上,改进部分信息条件下线性二次问题的最优控制在线强化学习算法。所研究系统方程和代价函数的系数都存在未知量,在此条件下,算法通过可观察的样本轨迹和回报函数求得最优控制以及代价函数中的未知系数,进一步地,我们给出迭代过程收敛性与控制稳定性的证明。 展开更多
关键词 随机线性二次问题 部分信息 李雅普诺夫方程 强化学习 动态规划原理
在线阅读 下载PDF
由布朗运动和列维过程联合驱动的一个有限期的线性二次最优随机控制问题(英文) 被引量:1
2
作者 胡世培 贺志民 《应用概率统计》 CSCD 北大核心 2019年第3期275-291,共17页
我们研究了由布朗运动和列维过程联合驱动的线性二次最优随机控制问题.我们利用深刻的截口定理新的仿射随机微分方程存在逆过程.应用拟线性贝尔曼原理和单调迭代收敛方法,我们证明了倒向黎卡提微分方程解的存在性和唯一性.最后,我们证... 我们研究了由布朗运动和列维过程联合驱动的线性二次最优随机控制问题.我们利用深刻的截口定理新的仿射随机微分方程存在逆过程.应用拟线性贝尔曼原理和单调迭代收敛方法,我们证明了倒向黎卡提微分方程解的存在性和唯一性.最后,我们证明了存在一个最优反馈控制且值函数由相应的倒向黎卡提微分方程和相应的伴随方程的初始值合成. 展开更多
关键词 线性最优随机控制问题 倒向黎卡提微分方程 列维过程 伴随方程 线性迭代方法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部