期刊文献+
共找到153篇文章
< 1 2 8 >
每页显示 20 50 100
Robust H_∞ Control for Uncertain Markovian Jump Linear Time-Delay Systems 被引量:2
1
作者 Zhong Maiying, Zhu Kunping & Tang Bingyong Business and Management School of Donghua University, Shanghai 200051, P. R. China 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2002年第1期13-20,共8页
This paper studies the robust stochastic stabilization and robust H∞ control for linear time-delay systems with both Markovian jump parameters and unknown norm-bounded parameter uncertainties. This problem can be sol... This paper studies the robust stochastic stabilization and robust H∞ control for linear time-delay systems with both Markovian jump parameters and unknown norm-bounded parameter uncertainties. This problem can be solved on the basis of stochastic Lyapunov approach and linear matrix inequality (LMI) technique. Sufficient conditions for the existence of stochastic stabilization and robust H∞ state feedback controller are presented in terms of a set of solutions of coupled LMIs. Finally, a numerical example is included to demonstrate the practicability of the proposed methods. 展开更多
关键词 Feedback control Linear algebra Linear equations Linear systems Lyapunov methods markov processes Robustness (control systems)
在线阅读 下载PDF
FTC of hidden Markov process with application to resource allocation in air operation
2
作者 Neng Eva Wu Matthew Charies Ruschmann 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2011年第1期12-21,共10页
This paper investigates the feedback control of hidden Markov process(HMP) in the face of loss of some observation processes.The control action facilitates or impedes some particular transitions from an inferred cur... This paper investigates the feedback control of hidden Markov process(HMP) in the face of loss of some observation processes.The control action facilitates or impedes some particular transitions from an inferred current state in the attempt to maximize the probability that the HMP is driven to a desirable absorbing state.This control problem is motivated by the need for judicious resource allocation to win an air operation involving two opposing forces.The effectiveness of a receding horizon control scheme based on the inferred discrete state is examined.Tolerance to loss of sensors that help determine the state of the air operation is achieved through a decentralized scheme that estimates a continuous state from measurements of linear models with additive noise.The discrete state of the HMP is identified using three well-known detection schemes.The sub-optimal control policy based on the detected state is implemented on-line in a closed-loop,where the air operation is simulated as a stochastic process with SimEvents,and the measurement process is simulated for a range of single sensor loss rates. 展开更多
关键词 hidden markov process(HMP) DECENTRALIZATION information fusion fault tolerant estimation air operation receding horizon control(RHC).
在线阅读 下载PDF
基于多级库存管理理论的导航星座可用性研究
3
作者 赵灵峰 黄朝伟 +3 位作者 林若禹 黄莎莎 薛小锋 冯蕴雯 《西北工业大学学报》 北大核心 2025年第2期222-232,共11页
目前星座可用性的备份策略研究方法单一且忽略了卫星短期故障,采用马尔可夫理论但对备份策略研究不够深入。针对上述问题,提出了一种基于多级库存管理理论并考虑星座状态的星座可用性研究方法。以备份卫星的保障率为指标建立星座备份策... 目前星座可用性的备份策略研究方法单一且忽略了卫星短期故障,采用马尔可夫理论但对备份策略研究不够深入。针对上述问题,提出了一种基于多级库存管理理论并考虑星座状态的星座可用性研究方法。以备份卫星的保障率为指标建立星座备份策略的数学模型;根据马尔可夫理论,结合单星可用性和星座状态概率进一步建立星座服务可用性数学模型;以某导航星座为例进行案例分析对比。根据模型计算结果,探究了星座故障状态概率变化;给出了备份卫星部署位置、补充时机以及增加数量对提高星座服务可用性的影响;验证了短期故障对卫星星座可用性的影响程度与长期故障相当,在工程应用中不可忽视。 展开更多
关键词 卫星星座 多级库存管理理论 备份策略 PETRI网 马尔可夫过程 星座可用性
在线阅读 下载PDF
具有马尔科夫切换Lévy过程驱动的非线性随机系统离散控制
4
作者 殷利平 韩雅微 李涛 《江苏大学学报(自然科学版)》 北大核心 2025年第5期570-576,共7页
研究了一类带有Lévy噪声和马尔科夫切换的非线性随机系统稳定性问题.首先,设计了一种状态反馈控制器,确保闭环系统具有均方指数稳定性.其次,将该连续时间状态反馈控制器进行离散化处理,以适应实际控制系统的需求.最后,通过推导得出... 研究了一类带有Lévy噪声和马尔科夫切换的非线性随机系统稳定性问题.首先,设计了一种状态反馈控制器,确保闭环系统具有均方指数稳定性.其次,将该连续时间状态反馈控制器进行离散化处理,以适应实际控制系统的需求.最后,通过推导得出,在离散控制器作用下,系统状态与连续控制器作用下的系统状态之差的二阶矩是有界的.仿真结果表明:离散化后的控制器依然能够使系统保持稳定,离散控制器作用下闭环系统的稳定性得到了验证. 展开更多
关键词 非线性随机系统 LÉVY过程 马尔科夫切换 状态反馈控制 离散化 二阶矩有界 稳定性
在线阅读 下载PDF
基于序贯检测的快速马尔可夫决策:理论、方法及应用 被引量:1
5
作者 陈祖旭 陈巍 +1 位作者 李长坤 韩宇星 《信号处理》 北大核心 2025年第3期448-471,共24页
本文立足存在突变状态与检测噪声复杂环境,针对控制后效性与动作迟滞性问题,探索提升决策与控制时效性的方法,提出了一种基于序贯检测的快速马尔可夫决策框架,并应用于智能电网、疾控、水利等若干典型场景。具体的,本文发掘了统计信号... 本文立足存在突变状态与检测噪声复杂环境,针对控制后效性与动作迟滞性问题,探索提升决策与控制时效性的方法,提出了一种基于序贯检测的快速马尔可夫决策框架,并应用于智能电网、疾控、水利等若干典型场景。具体的,本文发掘了统计信号处理中的变化点最速检测与随机最优控制中的马尔可夫决策之间的关联,建立了一种包含四维状态的受约束马尔可夫决策框架。该框架可选择一种可行的联合检测-控制策略,最大化控制对象的期望回报,或达到平均收益与风险的最佳折中。相对于传统的“先检测变化点、后调整可控量”的分层策略,所提出的新方法实现了“边检测变化点,边调整可控量”的跨层协同,可有效应对检测延时、反应迟滞对决策控制时效性带来的挑战。在智能电网、疾控、水利等场景中,均展示了“检中调”的思路显著优于“检后调”的传统方法。最后,本文还简要展望了基于序贯检测的快速马尔可夫决策在海上碳封存、网络攻击检测防御中的潜在应用价值。 展开更多
关键词 统计信号处理 随机最优控制 序贯检测 最速变化点检测 马尔可夫决策过程 受约束马尔可夫决策过程
在线阅读 下载PDF
基于深度强化学习的中央空调冷水机组无模型控制 被引量:1
6
作者 王萌 傅启明 +3 位作者 何坤 陈建平 陆悠 王蕴哲 《计算机工程与设计》 北大核心 2025年第5期1526-1534,共9页
针对当前中央空调冷水机组优化问题中基于模型控制对模型精确度依赖高和模型维护困难等问题,提出一种基于优先经验回放的深度强化学习无模型控制方法。将优化控制建模为马尔可夫决策过程,利用时间差分误差和总和树改进经验回放机制,提... 针对当前中央空调冷水机组优化问题中基于模型控制对模型精确度依赖高和模型维护困难等问题,提出一种基于优先经验回放的深度强化学习无模型控制方法。将优化控制建模为马尔可夫决策过程,利用时间差分误差和总和树改进经验回放机制,提高样本利用效率,设计兼顾室内舒适性和节能需求的奖励函数。基于实测历史数据构建仿真平台,用于方法验证。实验结果表明,在保证舒适度的前提下,该方法节能性优于规则控制,接近于模型控制并具有更快的收敛性。 展开更多
关键词 深度强化学习 优先经验回放 无模型控制 马尔可夫决策过程 冷水机组优化 舒适性保持 节能优化
在线阅读 下载PDF
Markov控制过程基于单个样本轨道的在线优化算法 被引量:5
7
作者 唐昊 奚宏生 殷保群 《控制理论与应用》 EI CAS CSCD 北大核心 2002年第6期865-871,共7页
在Markov性能势理论基础上 ,研究了Markov控制过程的性能优化算法 .不同于传统的基于计算的方法 ,文中的算法是根据单个样本轨道的仿真来估计性能指标关于策略参数的梯度 ,以寻找最优 (或次优 )随机平稳策略 .由于可根据不同实际系统的... 在Markov性能势理论基础上 ,研究了Markov控制过程的性能优化算法 .不同于传统的基于计算的方法 ,文中的算法是根据单个样本轨道的仿真来估计性能指标关于策略参数的梯度 ,以寻找最优 (或次优 )随机平稳策略 .由于可根据不同实际系统的特征来选择适当的算法参数 ,因此它能满足不同实际工程系统在线优化的需要 .最后简要分析了这些算法在一个无限长的样本轨道上以概率 1的收敛性 ,并给出了一个三 状态受控Markov过程的数值实例 . 展开更多
关键词 markov控制过程 单个样本轨道 在线优化算法 离散事件动态系统 随机平稳策略
在线阅读 下载PDF
连续时间Markov控制过程的平均代价最优鲁棒控制策略 被引量:4
8
作者 唐昊 韩江洪 高隽 《中国科学技术大学学报》 CAS CSCD 北大核心 2004年第2期219-225,共7页
在Markov性能势基础上 ,研究了一类转移速率不确定但受紧集约束的遍历连续时间Markov控制过程 (CTMCP)的鲁棒控制问题 .根据系统的遍历性 ,平均代价Poisson方程的解可被看作是性能势的一种定义 .在平均代价准则下 ,优化控制的目标是选... 在Markov性能势基础上 ,研究了一类转移速率不确定但受紧集约束的遍历连续时间Markov控制过程 (CTMCP)的鲁棒控制问题 .根据系统的遍历性 ,平均代价Poisson方程的解可被看作是性能势的一种定义 .在平均代价准则下 ,优化控制的目标是选择一个平稳策略使得系统在参数最坏取值下能获得最小无穷水平平均代价 ,据此论文给出了求解最优鲁棒控制策略的策略迭代 (PI)算法 ,并详细讨论了算法的收敛性 . 展开更多
关键词 markov性能势 连续时间markov控制过程 鲁棒控制策略 策略迭代 最优控制
在线阅读 下载PDF
Markov控制过程基于神经元动态规划的优化算法 被引量:1
9
作者 唐昊 奚宏生 殷保群 《中国科学技术大学学报》 CAS CSCD 北大核心 2001年第5期549-557,共9页
论文在Markov性能势理论基础上 ,研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法 ;分析了它们在一个无限长的样本轨道上以概率 1的收敛性 ;并给出了一个三
关键词 markov性能势理论 markov控制过程 随机平稳策略 样本轨道 神经元动态规划 随机决策问题
在线阅读 下载PDF
基于融合经验安全强化学习的配电网电压控制
10
作者 冯昌森 汤飞霞 +2 位作者 王国烽 文福拴 张有兵 《电力系统自动化》 北大核心 2025年第8期169-177,共9页
随着分布式可再生能源在配电网中的渗透率逐渐提高,分布式并网逆变器参与电压-无功控制对提升电力系统运行的安全性和经济性具有重要意义。然而,在基于强化学习的电压-无功控制模型中,安全运行约束难以建模,且无法确保控制策略满足运行... 随着分布式可再生能源在配电网中的渗透率逐渐提高,分布式并网逆变器参与电压-无功控制对提升电力系统运行的安全性和经济性具有重要意义。然而,在基于强化学习的电压-无功控制模型中,安全运行约束难以建模,且无法确保控制策略满足运行约束。针对上述问题,文中提出一种基于安全强化学习的配电网电压控制策略。首先,将带约束的电压控制问题建模为约束马尔可夫决策过程。然后,采用原始-对偶方法学习最优策略,确保控制策略满足系统运行约束。随后,引入增强经验融合方法来改进强化学习经验利用方式,从而提高算法样本效率。最后,通过配电系统算例验证了所提方法的有效性。 展开更多
关键词 配电网 电压控制 强化学习 约束马尔可夫决策过程 经验融合
在线阅读 下载PDF
半Markov控制过程在平均准则下的优化算法 被引量:1
11
作者 代桂平 殷保群 +2 位作者 李衍杰 周亚平 奚宏生 《中国科学技术大学学报》 CAS CSCD 北大核心 2005年第2期202-207,共6页
研究了一类半Markov控制过程(SMCP)在紧致行动集上关于无限水平平均代价准则的性能优化算法.利用等价Markov过程的方法,导出了SMCP的性能势公式和平均代价最优性方程,给出了求解最优或次最优平稳策略的策略迭代算法和数值迭代算法,并证... 研究了一类半Markov控制过程(SMCP)在紧致行动集上关于无限水平平均代价准则的性能优化算法.利用等价Markov过程的方法,导出了SMCP的性能势公式和平均代价最优性方程,给出了求解最优或次最优平稳策略的策略迭代算法和数值迭代算法,并证明了算法的收敛性.最后给出了一个数值例子来说明算法的应用. 展开更多
关键词 markov控制过程 紧致行动集 性能势 策略迭代 数值迭代
在线阅读 下载PDF
拒绝服务攻击下的有限时间控制
12
作者 叶洁 石厅 闫文君 《浙江大学学报(工学版)》 北大核心 2025年第4期832-841,共10页
针对遭受外部干扰的离散网络控制系统,研究在拒绝服务(DoS)攻击下的有限时间控制问题.考虑到DoS攻击可能同时存在于传感器-控制器(S-C)通道和控制器-执行器(C-A)通道,采用马尔可夫随机过程对DoS攻击的动态特性进行建模,将闭环控制系统... 针对遭受外部干扰的离散网络控制系统,研究在拒绝服务(DoS)攻击下的有限时间控制问题.考虑到DoS攻击可能同时存在于传感器-控制器(S-C)通道和控制器-执行器(C-A)通道,采用马尔可夫随机过程对DoS攻击的动态特性进行建模,将闭环控制系统表示为具有4个模态的马尔可夫跳变系统.为了降低外部干扰对系统性能的影响,引入l_(2)-l_(∞)性能指标,增强闭环系统的抗干扰鲁棒性.基于有限时间有界理论,构建适当的模态依赖李雅普诺夫函数,应用李雅普诺夫稳定性理论推导出控制算法的设计条件.通过求解线性矩阵不等式(LMIs),给出有限时间状态反馈控制器的充分条件,确保系统在有限时间内保持稳定并满足给定的性能要求.通过数值仿真和角度定位系统验证该控制算法的有效性及实用性.仿真结果表明,在不同的DoS攻击模式下,该控制算法能够有效抑制系统的波动并保证系统在有限时间内的稳定性. 展开更多
关键词 网络控制系统 有限时间控制 拒绝服务攻击 马尔可夫随机过程 马尔可夫跳变系统
在线阅读 下载PDF
基于改进MASAC算法的配电网光储一体电压控制策略
13
作者 周勇 周云海 +4 位作者 赵畅 李欣 林可意 季怀招 罗琰琳 《电力自动化设备》 北大核心 2025年第8期190-198,共9页
现有基于深度强化学习的配电网光储协同电压控制方法在训练过程中存在样本覆盖不足和特征感知能力有限的问题。提出一种基于改进多智能体柔性动作-评价(MASAC)算法的配电网光储一体电压控制策略。充分考虑光伏变流器的无功调节能力与储... 现有基于深度强化学习的配电网光储协同电压控制方法在训练过程中存在样本覆盖不足和特征感知能力有限的问题。提出一种基于改进多智能体柔性动作-评价(MASAC)算法的配电网光储一体电压控制策略。充分考虑光伏变流器的无功调节能力与储能变流器的有功调节能力,构建配电网有功无功优化模型;将电压控制问题转化为马尔可夫决策过程,针对因训练时回放池随机采样而导致的样本利用效率低下问题以及因缺乏特征提取和权重分配机制而引发的信息冗余问题,通过引入经验增强技术和注意力机制改进多智能体柔性动作-评价算法,在有效加快收敛速度的同时提升算法性能。在改进的IEEE 33节点系统和改进的IEEE 141节点系统上进行仿真分析,验证了所提策略的有效性。 展开更多
关键词 配电网 光储系统 电压控制 多智能体深度强化学习 马尔可夫决策过程 变流器
在线阅读 下载PDF
一类可数Markov控制过程的最优平稳策略 被引量:1
14
作者 殷保群 李衍杰 +1 位作者 奚宏生 周亚平 《控制理论与应用》 EI CAS CSCD 北大核心 2005年第1期43-46,共4页
研究了一类具有可数状态空间的Markov控制过程在无限水平平均代价准则下的最优平稳策略问题.对此类过程,引入了折扣Poisson方程,运用无穷小矩阵和性能势的基本性质,导出了平均代价模型在紧致行动集上的最优性方程,并证明了其解的一个存... 研究了一类具有可数状态空间的Markov控制过程在无限水平平均代价准则下的最优平稳策略问题.对此类过程,引入了折扣Poisson方程,运用无穷小矩阵和性能势的基本性质,导出了平均代价模型在紧致行动集上的最优性方程,并证明了其解的一个存在性定理. 展开更多
关键词 可数markov控制过程 性能势 平均代价准则 紧致行动集 最优平稳策略
在线阅读 下载PDF
基于自适应事件触发的半马尔科夫跳变系统的有限时间L_(2)–L_(∞)控制
15
作者 徐文灏 石厅 《控制理论与应用》 北大核心 2025年第4期722-730,共9页
本文使用马尔科夫过程的变体半马尔科夫过程建立了连续时间半马尔科夫跳变系统,并针对该系统研究了有限时间L_(2)-L_(∞)控制问题.首先,为了处理网络带宽有限的问题,在传感器通道中引入一种自适应事件触发机制,用以降低系统中的数据传... 本文使用马尔科夫过程的变体半马尔科夫过程建立了连续时间半马尔科夫跳变系统,并针对该系统研究了有限时间L_(2)-L_(∞)控制问题.首先,为了处理网络带宽有限的问题,在传感器通道中引入一种自适应事件触发机制,用以降低系统中的数据传输频率,从而降低通信负担.其次,考虑系统模态不可测的情况,以一定概率对其进行估计,进而研究了异步控制问题.然后,考虑了外部干扰,并引入了L_(2)-L_(∞)性能指标,研究了有限时间控制问题.本文的设计目标是在确保闭环系统有限时间稳定和满足一定性能指标的同时,降低系统中的通信负担.基于Lyapunov理论,得到状态反馈控制的设计算法.最后,用RLC电路作为实例来验证算法的有效性和可用性. 展开更多
关键词 马尔科夫过程 半马尔科夫跳变系统 有限时间控制 自适应事件触发 异步控制 闭环系统 状态反馈
在线阅读 下载PDF
基于离散Markov决策过程的发电公司多阶段决策 被引量:2
16
作者 张宏刚 宋依群 《上海交通大学学报》 EI CAS CSCD 北大核心 2004年第8期1238-1240,1245,共4页
采用离散时间Markov决策过程(DTMDP)对以多阶段总利润最优为目标的发电公司决策问题进行研究.市场环境下,发电公司根据自身条件,其竞争策略可以是价格的接受者,也可以是价格的制定者.考虑了发电公司不同策略情况下市场均衡状态间的转换... 采用离散时间Markov决策过程(DTMDP)对以多阶段总利润最优为目标的发电公司决策问题进行研究.市场环境下,发电公司根据自身条件,其竞争策略可以是价格的接受者,也可以是价格的制定者.考虑了发电公司不同策略情况下市场均衡状态间的转换概率,分别给出了发电公司作为价格接受者和价格制定者时的多阶段决策模型.通过算例验证了所提模型的有效性和可行性. 展开更多
关键词 电力市场 离散时间markov决策过程 决策问题
在线阅读 下载PDF
应对非预期情况的船舶混合能源系统能量管理
17
作者 司玉鹏 王荣杰 +2 位作者 王亦春 林安辉 刘亚杰 《哈尔滨工程大学学报》 北大核心 2025年第10期2021-2031,共11页
为应对船舶混合能源系统在设备故障或突发扰动等非预期工况下面临的能量管理挑战,本文提出一种基于优先级采样的深度确定性策略梯度算法的弹性增强控制策略。基于动作-评价网络框架,构建了适用于船舶混合能源系统协同运行的马尔可夫决... 为应对船舶混合能源系统在设备故障或突发扰动等非预期工况下面临的能量管理挑战,本文提出一种基于优先级采样的深度确定性策略梯度算法的弹性增强控制策略。基于动作-评价网络框架,构建了适用于船舶混合能源系统协同运行的马尔可夫决策模型,该模型具有连续的状态空间和动作空间。利用历史航行数据对该算法进行训练,从而生成高效的最优能量管理策略。该策略旨在实现船舶混合能源系统在正常运行条件下的经济性优化调度,以及非预期工况下的弹性安全控制。不同场景的模拟船舶航行试验结果表明:该策略能够充分利用各类型设备的运行特性,稳态工况下能以经济性为导向实现合理的能量分配,非预期工况下则以可靠性为导向最大限度地保证系统安全运行。 展开更多
关键词 新能源船舶 非预期工况 弹性增强控制 马尔可夫决策过程 优先级采样 深度确定性策略梯度算法 历史航行数据 能量管理
在线阅读 下载PDF
基于Markov决策过程的列控系统定量安全分析方法 被引量:1
18
作者 周果 赵会兵 《铁道学报》 EI CAS CSCD 北大核心 2016年第2期74-81,共8页
为了在列控系统的设计阶段和安全评估阶段对系统隐患进行把握,对系统的设计进行定量安全分析是至关重要的。定量分析的结果可以用来判断和比较设计的优劣,也可用来评估隐患的风险,并根据分析结果判断所采取的隐患控制措施是否使隐患的... 为了在列控系统的设计阶段和安全评估阶段对系统隐患进行把握,对系统的设计进行定量安全分析是至关重要的。定量分析的结果可以用来判断和比较设计的优劣,也可用来评估隐患的风险,并根据分析结果判断所采取的隐患控制措施是否使隐患的风险被控制在可接受的范围内。本文应用以Markov决策过程为基础的建模方法,对列控系统中的双车追踪场景进行系统行为建模,集成系统正常行为和失效行为,提出综合系统行为模型CBM,并通过概率模型检验工具PRISM对危险失效概率进行准确计算,提出列控系统定量安全分析方法。 展开更多
关键词 列控系统 定量安全分析 markov决策过程 概率模型检验
在线阅读 下载PDF
结合深度学习和自适应的业务动态访问控制研究及应用分析
19
作者 李玮 张金金 张肖艳 《现代电子技术》 北大核心 2025年第16期50-54,共5页
为解决传统访问控制手段难以满足动态评估与响应需求的问题,提出一种融合深度学习与自适应动态访问控制的零信任安全访问方法(DA-ZeroTrust)。该方法通过构建用户行为的向量化表示,以及挖掘交互序列的时序依赖关系,实现对用户行为的持... 为解决传统访问控制手段难以满足动态评估与响应需求的问题,提出一种融合深度学习与自适应动态访问控制的零信任安全访问方法(DA-ZeroTrust)。该方法通过构建用户行为的向量化表示,以及挖掘交互序列的时序依赖关系,实现对用户行为的持续评估与用户身份异常的检测。同时,利用马尔科夫决策过程评估访问行为价值,实现动态访问控制权限的自适应分配。实验结果表明,该方法有效攻克了用户编码、语义特征提取、异常行为检测等关键技术难题,能够快速检测并响应异常行为。 展开更多
关键词 访问控制 零信任 深度学习 自适应动态访问控制 异常检测 马尔科夫决策过程 访问行为价值
在线阅读 下载PDF
半Markov控制过程基于性能势仿真的并行优化算法
20
作者 代桂平 殷保群 +1 位作者 李衍杰 奚宏生 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第2期183-186,共4页
根据等价Markov过程方法,研究了一类半Markov控制过程在紧致行动集上关于无限水平平均代价准则的性能优化算法.由于实际系统的状态空间往往非常大,因此通常的串行仿真算法可能会耗时过长,或由于硬件限制而无法实现.针对这些问题,提出了... 根据等价Markov过程方法,研究了一类半Markov控制过程在紧致行动集上关于无限水平平均代价准则的性能优化算法.由于实际系统的状态空间往往非常大,因此通常的串行仿真算法可能会耗时过长,或由于硬件限制而无法实现.针对这些问题,提出了一种基于性能势的并行仿真优化算法,以期寻找系统的最优平稳策略,并用该算法对性能势的仿真和策略寻优分别进行了并行化,获得了较好的运行效率.仿真实例表明了该算法的有效性.这一算法可应用于大规模实际半Markov系统的性能优化. 展开更多
关键词 markov控制过程 紧致行动集 性能势 并行仿真算法
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部