期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Markov控制过程基于单个样本轨道的在线优化算法 被引量:5
1
作者 唐昊 奚宏生 殷保群 《控制理论与应用》 EI CAS CSCD 北大核心 2002年第6期865-871,共7页
在Markov性能势理论基础上 ,研究了Markov控制过程的性能优化算法 .不同于传统的基于计算的方法 ,文中的算法是根据单个样本轨道的仿真来估计性能指标关于策略参数的梯度 ,以寻找最优 (或次优 )随机平稳策略 .由于可根据不同实际系统的... 在Markov性能势理论基础上 ,研究了Markov控制过程的性能优化算法 .不同于传统的基于计算的方法 ,文中的算法是根据单个样本轨道的仿真来估计性能指标关于策略参数的梯度 ,以寻找最优 (或次优 )随机平稳策略 .由于可根据不同实际系统的特征来选择适当的算法参数 ,因此它能满足不同实际工程系统在线优化的需要 .最后简要分析了这些算法在一个无限长的样本轨道上以概率 1的收敛性 ,并给出了一个三 状态受控Markov过程的数值实例 . 展开更多
关键词 MARKOV控制过程 单个样本轨道 在线优化算法 离散事件动态系统 随机平稳策略
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部