期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
Receding horizon H_∞ control for constrained time-delay systems
1
作者 Lu Mei Jin Chengbo Shao Huihe 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2009年第2期363-370,共8页
A receding horizon Hoo control algorithm is presented for linear discrete time-delay system in the presence of constrained input and disturbances. Disturbance attenuation level is optimized at each time instant, and t... A receding horizon Hoo control algorithm is presented for linear discrete time-delay system in the presence of constrained input and disturbances. Disturbance attenuation level is optimized at each time instant, and the receding optimization problem includes several linear matrix inequality constraints. When the convex hull is applied to denote the saturating input, the algorithm has better performance. The numerical example can verify this result. 展开更多
关键词 receding horizon control Hoo control TIME-DELAY constrained input
在线阅读 下载PDF
Receding horizon H_∞ control for discrete-time Markovian jump linear systems
2
作者 Jiwei Wen Fei Liu 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2011年第2期292-299,共8页
Receding horizon H∞ control scheme which can deal with both the H∞ disturbance attenuation and mean square stability is proposed for a class of discrete-time Markovian jump linear systems when minimizing a given qua... Receding horizon H∞ control scheme which can deal with both the H∞ disturbance attenuation and mean square stability is proposed for a class of discrete-time Markovian jump linear systems when minimizing a given quadratic performance criteria. First, a control law is established for jump systems based on pontryagin’s minimum principle and it can be constructed through numerical solution of iterative equations. The aim of this control strategy is to obtain an optimal control which can minimize the cost function under the worst disturbance at every sampling time. Due to the difficulty of the assurance of stability, then the above mentioned approach is improved by determining terminal weighting matrix which satisfies cost monotonicity condition. The control move which is calculated by using this type of terminal weighting matrix as boundary condition naturally guarantees the mean square stability of the closed-loop system. A sufficient condition for the existence of the terminal weighting matrix is presented in linear matrix inequality (LMI) form which can be solved efficiently by available software toolbox. Finally, a numerical example is given to illustrate the feasibility and effectiveness of the proposed method. 展开更多
关键词 Marker jump linear systems receding horizon H∞ control mean square stability terminal weighting matrix pontrya-gin's minimum principle current time jump mode.
在线阅读 下载PDF
Practical stabilization of receding-horizon control
3
作者 LIU Bi yu,GUI Wei hua,MU Min (College of Information Science and Engineering, Central South University, Changsha 410083, China) 《Journal of Central South University of Technology》 2001年第4期268-271,共4页
The purpose of this work is to propose a scheme to stabilize the predictive control systems in the practical stability sense. In the paper, the authors dealt with a general discrete predictive control system x j+1|t =... The purpose of this work is to propose a scheme to stabilize the predictive control systems in the practical stability sense. In the paper, the authors dealt with a general discrete predictive control system x j+1|t =f(x j|t , u j|t ) by using the Lyapunov direct method combining with receding horizon control technique, and presented a new condition to guarantee the practical stabilization of the systems. With the proposed results, one can design the optimal controllers easily to practically stabilize the predictive control systems. 展开更多
关键词 receding-horizon control PRACTICAL STABILITY LYAPUNOV FUNCTION NONLINEAR system optimization
在线阅读 下载PDF
基于RHC的航班进港排序多局部搜索GA优化算法 被引量:3
4
作者 张玉州 陈文莉 +1 位作者 江克勤 王一宾 《中国科学技术大学学报》 CAS CSCD 北大核心 2015年第1期75-86,共12页
为解决航班进港排序难以应对动态环境下航班信息变化的问题,首先建立了一种基于滚动时域控制的机场进港航班动态排序优化模型,并将存储时域上的航班进港优化序列作为后继时域航班排序的启发信息;然后提出了一种基于滚动时域控制的多局... 为解决航班进港排序难以应对动态环境下航班信息变化的问题,首先建立了一种基于滚动时域控制的机场进港航班动态排序优化模型,并将存储时域上的航班进港优化序列作为后继时域航班排序的启发信息;然后提出了一种基于滚动时域控制的多局部搜索遗传算法对问题求解,给出了一种以存储的航班优化信息为基础的种群初始化策略;针对遗传算法易陷入局部最优的不足以及单一局部搜索难以取得很好收敛效果与满意解的现状,提出的多局部搜索遗传算法,在不同时期采用不同的局部搜索策略,其中定向局部搜索根据个体、基准个体的基因结构和适应性调整最大搜索速度;最后,大量仿真实验结果证明了所提模型与算法的有效性以及算法的稳定性,并由实验结果得出了航班排序问题的相关特性结论. 展开更多
关键词 进港排序 rhc 多局部搜索遗传算法 航班优化序列
在线阅读 下载PDF
基于RHC-QPSO的飞机主动防御技术 被引量:1
5
作者 王路通 王小平 +2 位作者 林秦颖 王哲 苏赛语 《空军工程大学学报(自然科学版)》 CSCD 北大核心 2017年第5期42-47,共6页
提出了一种空战飞机三点共线式主动防御实施策略。首先以战斗机、防御导弹、攻击导弹运动特性为基础,提出了诱导捕获的飞机-防御导弹协同主动防御方法,将空战对抗问题转化为战斗机的轨迹优化问题。其次提出了过程性能指标,并分析了其与... 提出了一种空战飞机三点共线式主动防御实施策略。首先以战斗机、防御导弹、攻击导弹运动特性为基础,提出了诱导捕获的飞机-防御导弹协同主动防御方法,将空战对抗问题转化为战斗机的轨迹优化问题。其次提出了过程性能指标,并分析了其与传统性能指标(目的性能指标)的不同。最后针对量子粒子群优化算法无法对整个过程进行评价问题,引入滚动时域控制的思想,将过程性能指标作为每一个滚动优化窗口的优化指标,以此来提高算法的实时性,并进行了作战仿真。仿真结果显示过程性能指标迅速收敛至给定数值附近,战斗机等三者控制指令稳定在很小幅度的振荡,主动防御过程得以有效实现,协同思想的正确性,算法。 展开更多
关键词 主动防御 防御导弹 轨迹优化 性能指标 量子粒子群优化算法 滚动时域控制
在线阅读 下载PDF
基于RHC-PSO的双机协同探测跟踪行为决策
6
作者 黄泽楠 张涛 +2 位作者 周中良 黄俊 李飞 《电光与控制》 北大核心 2014年第8期91-97,共7页
针对现代空战双机编队协同探测的复杂性,以双机协同探测一架敌机为背景,基于滚动时域控制思想对搜索跟踪阶段战斗机机动决策及雷达行为决策进行研究。首先建立雷达的探测模型,重点研究双机协同探测态势及全向雷达反射面积(RCS)动态特性... 针对现代空战双机编队协同探测的复杂性,以双机协同探测一架敌机为背景,基于滚动时域控制思想对搜索跟踪阶段战斗机机动决策及雷达行为决策进行研究。首先建立雷达的探测模型,重点研究双机协同探测态势及全向雷达反射面积(RCS)动态特性;其次建立了战斗机协同搜索跟踪行为决策模型,重点分析了协同探测控制函数的建立,以及基于粒子群算法的探测行为决策模型;最后进行了仿真验证。仿真结果表明,该方法可以有效提高我方战斗机协同探测能力。 展开更多
关键词 协同探测 行为决策 双机编队 滚动时域 粒子群算法
在线阅读 下载PDF
An Efficient Constrained Model Predictive Control Algorithm Based on Approximate Computation 被引量:1
7
作者 Du Xiaoning, Xi Yugeng & Li Shaoyuan Institute of Automation, Shanghai Jiaotong University, Shanghai 200030, P.R.China 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2002年第1期42-47,共6页
The on line computational burden related to model predictive control (MPC) of large scale constrained systems hampers its real time applications and limits it to slow dynamic process with moderate number of inputs.... The on line computational burden related to model predictive control (MPC) of large scale constrained systems hampers its real time applications and limits it to slow dynamic process with moderate number of inputs. To avoid this, an efficient and fast algorithm based on aggregation optimization is proposed in this paper. It only optimizes the current control action at time instant k , while other future control sequences in the optimization horizon are approximated off line by the linear feedback control sequence, so the on line optimization can be converted into a low dimensional quadratic programming problem. Input constraints can be well handled in this scheme. The comparable performance is achieved with existing standard model predictive control algorithm. Simulation results well demonstrate its effectiveness. 展开更多
关键词 Model predictive control (MPC) receding horizon control (rhc) Approximate computation.
在线阅读 下载PDF
Constrained predictive control of nonlinear stochastic systems
8
作者 Yanyan Yin Fei Liu 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2010年第5期859-867,共9页
The receding horizon control(RHC) problem is considered for nonlinear Markov jump systems which can be represented by Takagi-Sugeno fuzzy models subject to constraints both on control inputs and on observe outputs.I... The receding horizon control(RHC) problem is considered for nonlinear Markov jump systems which can be represented by Takagi-Sugeno fuzzy models subject to constraints both on control inputs and on observe outputs.In the given receding horizon,for each mode sequence of the T-S modeled nonlinear system with Markov jump parameter,the cost function is optimized by constraints on state trajectories,so that the optimization control input sequences are obtained in order to make the state into a terminal invariant set.Out of the receding horizon,the stability is guaranteed by searching a state feedback control law.Based on such stability analysis,a linear matrix inequality approach for designing receding horizon predictive controller for nonlinear systems subject to constraints both on the inputs and on the outputs is developed.The simulation shows the validity of this method. 展开更多
关键词 NONLINEAR Markov jump constraint predictive control receding horizon control invariant set.
在线阅读 下载PDF
Stabilizing model predictive control scheme for piecewise affine systems with maximal positively invariant terminal set
9
作者 Fu Chen Guangzhou Zhao Xiaoming Yu 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2010年第6期1090-1094,共5页
An efficient algorithm is proposed for computing the solution to the constrained finite time optimal control (CFTOC) problem for discrete-time piecewise affine (PWA) systems with a quadratic performance index. The... An efficient algorithm is proposed for computing the solution to the constrained finite time optimal control (CFTOC) problem for discrete-time piecewise affine (PWA) systems with a quadratic performance index. The maximal positively invariant terminal set, which is feasible and invariant with respect to a feedback control law, is computed as terminal target set and an associated Lyapunov function is chosen as terminal cost. The combination of these two components guarantees constraint satisfaction and closed-loop stability for all time. The proposed algorithm combines a dynamic programming strategy with a multi-parametric quadratic programming solver and basic polyhedral manipulation. A numerical example shows that a larger stabilizable set of states can be obtained by the proposed algorithm than precious work. 展开更多
关键词 constrained optimal predictive control multi-parametric quadratic programming dynamic programming receding horizon control positively invariant set.
在线阅读 下载PDF
离散时间平均场随机系统的滚动时域控制
10
作者 叶志勇 贾亚琪 +3 位作者 张春梅 杨路 陈柏江 宋江敏 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第2期343-352,共10页
研究了一类离散时间平均场随机时变系统的滚动时域控制(RHC)镇定问题。定义一个新的条件期望型的性能指标;通过利用随机极值原理,得到RHC控制器。基于最优性能指标的单调非增性,得到了使平均场随机系统在RHC控制器下均方镇定的条件,即当... 研究了一类离散时间平均场随机时变系统的滚动时域控制(RHC)镇定问题。定义一个新的条件期望型的性能指标;通过利用随机极值原理,得到RHC控制器。基于最优性能指标的单调非增性,得到了使平均场随机系统在RHC控制器下均方镇定的条件,即当2个耦合的Lyapunov型不等式被满足时,由RHC策略控制的系统是均方镇定的。通过数值算例得到在RHC控制器下,其状态轨迹满足渐近均方镇定的条件,即平均场随机系统是渐近均方镇定的,验证了该结论的有效性。 展开更多
关键词 滚动时域控制(rhc) 平均场随机系统 均方镇定 离散时间
在线阅读 下载PDF
基于滚动时域的无人机空战决策专家系统 被引量:45
11
作者 傅莉 谢福怀 +1 位作者 孟光磊 王东政 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2015年第11期1994-1999,共6页
针对专家系统法在空战应用中存在适应性差的缺陷,提出了一种基于滚动时域控制(RHC)的机动决策算法对空战机动决策专家系统进行改进.首先,系统地分析了在专家系统空战机动决策中的最优控制问题,完成了机动决策最优控制模型系统状态方程... 针对专家系统法在空战应用中存在适应性差的缺陷,提出了一种基于滚动时域控制(RHC)的机动决策算法对空战机动决策专家系统进行改进.首先,系统地分析了在专家系统空战机动决策中的最优控制问题,完成了机动决策最优控制模型系统状态方程的建立、控制约束的设计以及指标函数的建立.在此基础上,根据滚动时域法原理,将整个空战过程分解为若干有限时域,并在每个时域内将空战机动决策问题视为初始条件不断更新的专家系统机动决策最优控制模型的求解,反复进行直到空战结束.仿真结果表明,在专家系统法失效的情况下,通过求解专家系统空战机动决策滚动时域最优控制模型,无人机能够快速地进行有效的机动决策. 展开更多
关键词 滚动时域控制(rhc) 最优控制模型 机动决策 专家系统 空战
在线阅读 下载PDF
基于MTPM和DPM的多无人机协同广域目标搜索滚动时域决策 被引量:34
12
作者 沈东 魏瑞轩 +1 位作者 祁晓明 关旭宁 《自动化学报》 EI CSCD 北大核心 2014年第7期1391-1403,共13页
传统的协同搜索决策方法在目标引导和机间协同方面存在不足.研究建立了基于分布概率预测的目标概率图(Target probability map,TPM)初始化方法和基于贝叶斯准则的目标概率图动态更新方法,形成了修正目标概率图(Modified TPM,MTPM)及其... 传统的协同搜索决策方法在目标引导和机间协同方面存在不足.研究建立了基于分布概率预测的目标概率图(Target probability map,TPM)初始化方法和基于贝叶斯准则的目标概率图动态更新方法,形成了修正目标概率图(Modified TPM,MTPM)及其运算机理.考虑对任务子区域进行可控回访,定义了数字信息素图(Digital pheromone map,DPM),建立了数字信息素图使用方法及更新机理.设计了基于MTPM和DPM的寻优指标,建立了基于滚动时域控制的协同搜索决策方法(MTPM-DPM-RHC method,MDR).仿真表明:1)MTPM能有效降低对目标的虚警率和漏检率;2)DPM能有效实现对任务区域可控回访;3)MDR方法的遍历能力、重访能力和目标搜索效率均优于已有方法. 展开更多
关键词 无人机 协同搜索 目标概率图 数字信息素 滚动时域控制
在线阅读 下载PDF
基于混合算法的空战机动决策 被引量:29
13
作者 张涛 于雷 +1 位作者 周中良 王琳 《系统工程与电子技术》 EI CSCD 北大核心 2013年第7期1445-1450,共6页
针对现代战斗机空战机动决策的复杂性,以红蓝双机一对一空战为背景,结合滚动时域控制(receding ho-rizon control,RHC)思想对战斗机空战机动决策进行研究。首先借鉴人工势场(artificial potential field,APF)法构建战斗机空战人工势场,... 针对现代战斗机空战机动决策的复杂性,以红蓝双机一对一空战为背景,结合滚动时域控制(receding ho-rizon control,RHC)思想对战斗机空战机动决策进行研究。首先借鉴人工势场(artificial potential field,APF)法构建战斗机空战人工势场,重点分析空战APF函数和变权重函数的构建;提出一种基于RHC-APF启发粒子群算法(particleswarm optimization,PSO)的战斗机空战机动决策方法。仿真结果表明,该方法可以有效避免APF法局部极小值问题,改善PSO的全局搜索能力,从而在一定程度上提高了战斗机在空战过程中的APF值,使战斗机在空战中占据有利态势。 展开更多
关键词 机动决策 滚动时域控制 人工势场 粒子群算法 变权重
在线阅读 下载PDF
战斗机隐蔽接敌轨迹优化方法 被引量:7
14
作者 付昭旺 于雷 +1 位作者 李战武 李飞 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第5期52-58,共7页
针对空战对抗的隐蔽作战需求,对战斗机隐蔽接敌方法进行研究。基于战斗机雷达反射截面积的动态特性建立雷达探测威胁模型,以空战态势参数为状态建立接敌引导模型,以给定目标发现概率为暴露阈值进行威胁约束,以最小化接敌过程中累积被发... 针对空战对抗的隐蔽作战需求,对战斗机隐蔽接敌方法进行研究。基于战斗机雷达反射截面积的动态特性建立雷达探测威胁模型,以空战态势参数为状态建立接敌引导模型,以给定目标发现概率为暴露阈值进行威胁约束,以最小化接敌过程中累积被发现概率为性能指标,将战斗机隐蔽接敌问题建立为隐蔽性约束下的最优控制问题模型。为保证算法的实时性和有效性,引入滚动时域控制策略进行在线优化,并采用高斯伪谱法进行数值求解。仿真实验表明,通过路径约束和性能指标双重约束,能有效增强战斗机接敌的隐蔽性,算法实时性能满足战斗机控制的需求。 展开更多
关键词 隐蔽接敌 轨迹优化 探测威胁 高斯伪谱法 滚动时域控制
在线阅读 下载PDF
计及配电网三相模型的电动汽车充电滚动时域控制 被引量:15
15
作者 李佩杰 林颂晨 +2 位作者 白晓清 罗翠云 韦化 《中国电机工程学报》 EI CSCD 北大核心 2016年第17期4533-4542,共10页
针对电动汽车实时充电具有随机性强、受配电网多种安全约束限制的特点,该文计及配电网的三相网络结构,建立了电动汽车充电控制的最优化模型;同时,基于滚动时域控制理论,提出了一种高效的电动汽车实时调度方法。该方法结合电动汽车的充... 针对电动汽车实时充电具有随机性强、受配电网多种安全约束限制的特点,该文计及配电网的三相网络结构,建立了电动汽车充电控制的最优化模型;同时,基于滚动时域控制理论,提出了一种高效的电动汽车实时调度方法。该方法结合电动汽车的充电特点,通过调度对象筛选、变时域滚动、局部滚动和事件驱动,实现优化效果和计算效率的平衡。爱尔兰-11、IEEE-33和IEEE-119这3个配电网系统的仿真计算表明,所提优化模型可有效地控制安全约束;改进的滚动时域控制方法计算效率高,优化效果好,对负荷和电价等曲线具有很好的跟踪性能。 展开更多
关键词 配电网 最优化 滚动时域控制 实时调度 电动汽车
在线阅读 下载PDF
基于终端不变集的Maurkov跳变系统约束预测控制 被引量:12
16
作者 刘飞 蔡胤 《自动化学报》 EI CSCD 北大核心 2008年第4期496-499,共4页
针对离散Markov跳变系统,研究带输入输出约束的有限时域预测控制问题.对于给定预测时域内的每条模态轨迹,设计控制输入序列,驱动系统状态到达相应的终端不变集内,在预测时域外,则寻求一个虚拟的状态反馈控制器以保证系统的随机稳定性,... 针对离散Markov跳变系统,研究带输入输出约束的有限时域预测控制问题.对于给定预测时域内的每条模态轨迹,设计控制输入序列,驱动系统状态到达相应的终端不变集内,在预测时域外,则寻求一个虚拟的状态反馈控制器以保证系统的随机稳定性,在此基础上,分别给出了以线性矩阵不等式(LMI)描述的带输入、输出约束预测控制器的设计方法. 展开更多
关键词 MARKOV跳变系统 约束控制 滚动时域控制 终端不变集 正半定规划
在线阅读 下载PDF
基于backstepping/RHO的变体飞机控制器设计 被引量:8
17
作者 陈伟 卢京潮 +1 位作者 王晓光 章卫国 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2014年第8期1060-1065,共6页
为了确保变体飞机在变体过程中的飞行稳定性,提出了一种并行修正控制器设计方案.采用backstepping方法进行标称控制器设计,提供基本的飞行稳定性和跟踪性能.使用雅可比线性化方法对变体飞机非线性方程进行线性化得到线性化模型,采用基... 为了确保变体飞机在变体过程中的飞行稳定性,提出了一种并行修正控制器设计方案.采用backstepping方法进行标称控制器设计,提供基本的飞行稳定性和跟踪性能.使用雅可比线性化方法对变体飞机非线性方程进行线性化得到线性化模型,采用基于指令滤波器的滚动时域优化(RHO,Receding Horizon Optimal)方法进行修正控制器设计.在有限时域区间内实时解算修正控制量,对标称控制器进行补偿.从航迹角控制系统仿真结果可以看出,航迹角能够较好地跟踪指令信号,基本不受变体过程的影响,飞行控制系统满足实时性和鲁棒性的要求. 展开更多
关键词 变体飞机 修正控制器 BACKSTEPPING 滚动时域优化 航迹角
在线阅读 下载PDF
计及线路热惯性效应的模型预测控制安全经济调度模型 被引量:10
18
作者 冯凯 应展烽 +2 位作者 陈汹 吴军基 张旭东 《电工技术学报》 EI CSCD 北大核心 2018年第8期1875-1883,共9页
基于模型预测控制(MPC)理论,提出一种计及输电导线热惯性效应的安全经济调度模型。该模型首先以自回归滑动平均(ARMA)模型进行沿线气象预测,以直流潮流下的灵敏度矩阵进行线路电流预测,在此基础上对未来时域内的导线温度做出估计。随后... 基于模型预测控制(MPC)理论,提出一种计及输电导线热惯性效应的安全经济调度模型。该模型首先以自回归滑动平均(ARMA)模型进行沿线气象预测,以直流潮流下的灵敏度矩阵进行线路电流预测,在此基础上对未来时域内的导线温度做出估计。随后,以最高允许温度对导线温度估计值进行限定,取代传统输送容量的载流量约束,构建二次规划形式的滚动优化调度模型。最后,以实际测量所得输出信息作为反馈构成控制闭环,及时修正调度策略。所提模型一方面利用线路热惯性提高了调度决策的经济程度,另一方面通过引入闭环加强了调度决策的抗干扰能力。算例仿真结果验证了模型的有效性。 展开更多
关键词 安全经济调度 热惯性 模型预测控制 滚动优化
在线阅读 下载PDF
计及控制时间窗内功率波动的风电场群无功电压分层优化控制 被引量:22
19
作者 蔡游明 李征 蔡旭 《电工技术学报》 EI CSCD 北大核心 2019年第6期1240-1250,共11页
针对因风电场群的无功电压控制指令周期远大于风电场内有功无功控制周期而造成的场群电压控制指令没有考虑控制周期内有功出力波动带来的节点电压变化的问题,提出一种考虑控制时间窗内电压波动的大规模风电场群无功电压优化控制策略。... 针对因风电场群的无功电压控制指令周期远大于风电场内有功无功控制周期而造成的场群电压控制指令没有考虑控制周期内有功出力波动带来的节点电压变化的问题,提出一种考虑控制时间窗内电压波动的大规模风电场群无功电压优化控制策略。区域场群控制层采用模型预测控制技术,通过对控制窗内风电出力的动态预测,求取控制窗内从当前至未来多个时刻的中枢点电压偏差和总网损的最优无功控制向量,然后对各风场下达当前无功控制指令。各风场进行自主优化跟踪。通过实时滚动优化,达到总体优化控制效果。在RT-Lab仿真平台上建立由9个大型风电场组成的场群模型,验证了所提出的控制策略比常规优化控制有更好的全局电压优化控制效果,可降低由于风电波动而产生的无功电压事故的风险。 展开更多
关键词 模型预测控制 风电场群 风电场无功控制 无功-电压控制 滚动优化
在线阅读 下载PDF
基于滚动优化的对偶控制策略 被引量:7
20
作者 钱富才 宋俐 陈小可 《控制理论与应用》 EI CAS CSCD 北大核心 2005年第6期855-860,共6页
考虑具有未知参数的随机系统的最优控制问题.提出了一种新的基于滚动优化的对偶控制算法.在动态规划泛函方程中,用Kalman滤波对系统的状态进行估计;用线性化方法对阶段损失函数中的后验概率进行近似,然后,用滚动优化策略对控制与学习之... 考虑具有未知参数的随机系统的最优控制问题.提出了一种新的基于滚动优化的对偶控制算法.在动态规划泛函方程中,用Kalman滤波对系统的状态进行估计;用线性化方法对阶段损失函数中的后验概率进行近似,然后,用滚动优化策略对控制与学习之间的耦合关系进行解耦.从而获得了原不可解泛函方程的解析递推表达式和一个易于实施的控制律的解析解.用一个例子说明了控制律的性能,仿真结果表明:该控制律具有良好的对偶性质,在学习和控制之间实现了较好的平衡. 展开更多
关键词 随机系统 动态规划 滚动优化 对偶控制
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部