期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一类可数Markov控制过程的最优平稳策略 被引量:1
1
作者 殷保群 李衍杰 +1 位作者 奚宏生 周亚平 《控制理论与应用》 EI CAS CSCD 北大核心 2005年第1期43-46,共4页
研究了一类具有可数状态空间的Markov控制过程在无限水平平均代价准则下的最优平稳策略问题.对此类过程,引入了折扣Poisson方程,运用无穷小矩阵和性能势的基本性质,导出了平均代价模型在紧致行动集上的最优性方程,并证明了其解的一个存... 研究了一类具有可数状态空间的Markov控制过程在无限水平平均代价准则下的最优平稳策略问题.对此类过程,引入了折扣Poisson方程,运用无穷小矩阵和性能势的基本性质,导出了平均代价模型在紧致行动集上的最优性方程,并证明了其解的一个存在性定理. 展开更多
关键词 可数Markov控制过程 性能势 平均代价准则 紧致行动集 最优平稳策略
在线阅读 下载PDF
Markov控制过程基于性能势的平均代价最优策略 被引量:4
2
作者 周亚平 奚宏生 +1 位作者 殷保群 孙德敏 《自动化学报》 EI CSCD 北大核心 2002年第6期904-910,共7页
研究了一类离散时间 Markov控制过程平均代价性能最优控制决策问题 .应用Markov性能势的基本性质 ,在很一般性的假设条件下 ,直接导出了无限时间平均代价模型在紧致行动集上的最优性方程及其解的存在性定理 .提出了求解最优平稳控制策... 研究了一类离散时间 Markov控制过程平均代价性能最优控制决策问题 .应用Markov性能势的基本性质 ,在很一般性的假设条件下 ,直接导出了无限时间平均代价模型在紧致行动集上的最优性方程及其解的存在性定理 .提出了求解最优平稳控制策略的迭代算法 ,并讨论了这种算法的收敛性问题 .最后通过分析一个实例来说明这种算法的应用 . 展开更多
关键词 MARKOV控制过程 性能势 平均代价模型 最优平稳策略 最优控制
在线阅读 下载PDF
受控M/G/1排队系统的性能优化及迭代算法 被引量:3
3
作者 代桂平 殷保群 +1 位作者 王肖龙 奚宏生 《系统仿真学报》 CAS CSCD 2004年第8期1683-1685,共3页
通过嵌入Markov链的方法,讨论了受控M/G/1排队系统,在无限水平平均代价准则下的最优平稳策略问题。定义了平均Poisson方程,导出了平均代价模型在紧致行动集上的最优性方程。最后给出了一个求解最优平稳策略的迭代算法,并给出了一个仿真... 通过嵌入Markov链的方法,讨论了受控M/G/1排队系统,在无限水平平均代价准则下的最优平稳策略问题。定义了平均Poisson方程,导出了平均代价模型在紧致行动集上的最优性方程。最后给出了一个求解最优平稳策略的迭代算法,并给出了一个仿真实例来说明该算法的应用。 展开更多
关键词 受控M/G/1排队系统 平均代价准则 紧致行动集 最优平稳策略 迭代算法
在线阅读 下载PDF
受控排队系统的平均最优与约束平均最优 被引量:1
4
作者 张兰兰 郭先平 《控制理论与应用》 EI CAS CSCD 北大核心 2009年第2期139-144,共6页
根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件.这个新条件仅使用模型的初始数据,但利用了生灭过程的遍历性理论.可以证明受控排队系统存在平均最优平稳策略与... 根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件.这个新条件仅使用模型的初始数据,但利用了生灭过程的遍历性理论.可以证明受控排队系统存在平均最优平稳策略与约束平均最优策略. 展开更多
关键词 连续时间马尔可夫决策过程 平均准则 受控排队系统 平均最优平稳策略 约束平均最优策略
在线阅读 下载PDF
半Markov决策过程折扣模型与平均模型之间的关系 被引量:1
5
作者 殷保群 李衍杰 +2 位作者 唐昊 代桂平 奚宏生 《控制理论与应用》 EI CAS CSCD 北大核心 2006年第1期65-68,共4页
首先分别在折扣代价与平均代价性能准则下,讨论了一类半M arkov决策问题.基于性能势方法,导出了由最优平稳策略所满足的最优性方程.然后讨论了两种模型之间的关系,表明了平均模型的有关结论,可以通过对折扣模型相应结论取折扣因子趋于... 首先分别在折扣代价与平均代价性能准则下,讨论了一类半M arkov决策问题.基于性能势方法,导出了由最优平稳策略所满足的最优性方程.然后讨论了两种模型之间的关系,表明了平均模型的有关结论,可以通过对折扣模型相应结论取折扣因子趋于零时的极限来得到. 展开更多
关键词 半MARKOV决策过程 折扣模型 平均模型 最优性方程 最优平稳策略
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部