期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于符号变量运算的状态空间方程离散化
1
作者 吕志民 林恩华 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第6期24-26,共3页
针对MATLAB控制系统工具箱中模型转换命令 ,不能对带符号变量连续状态空间方程进行离散化 ,提出借助符号数学工具箱中有关符号对象函数构成M文件 ,自动完成此过程 .该方法与常规方法所得结果比较 ,两者完全一致 。
关键词 符合变量 离散 符合数学工具箱 状态空间方程 计算机控制系统 CAD CAI
在线阅读 下载PDF
基于多状态劣化空间划分的多部件系统维修决策 被引量:1
2
作者 张晓红 张欣 +4 位作者 张剑飞 罗元庚 冯泽 石冠男 张小龙 《计算机集成制造系统》 EI CSCD 北大核心 2022年第3期769-779,共11页
针对劣化独立的同类型部件组成的系统,提出了最优的维修决策优化模型。将系统中部件的劣化过程描述为具有时间连续状态离散的马尔可夫过程,在分析系统转移特性的基础上,运用马尔可夫过程理论求解了系统中单个部件各状态的平稳概率表达式... 针对劣化独立的同类型部件组成的系统,提出了最优的维修决策优化模型。将系统中部件的劣化过程描述为具有时间连续状态离散的马尔可夫过程,在分析系统转移特性的基础上,运用马尔可夫过程理论求解了系统中单个部件各状态的平稳概率表达式,建立了具有多状态劣化特性的多部件系统的平均费用率最优决策模型,在系统长期平均费用率最小的情况下,得到系统最优的检测周期、机会和预防维修阈值。以风电机组为例,验证了维修决策模型的正确性和适用性。结果表明,该模型可以为实际的多部件系统给出较为经济且合理的维修策略。 展开更多
关键词 多部件系统 离散状态建模 状态空间划分 维修决策 风电机组
在线阅读 下载PDF
基于凸多面体抽象域的自适应强化学习技术研究 被引量:5
3
作者 陈冬火 刘全 +1 位作者 朱斐 金海东 《计算机学报》 EI CSCD 北大核心 2018年第1期112-131,共20页
表格驱动的算法是解决强化学习问题的一类重要方法,但由于"维数灾"现象的存在,这种方法不能直接应用于解决具有连续状态空间的强化学习问题.解决维数灾问题的方法主要包括两种:状态空间的离散化和函数近似方法.相比函数近似,... 表格驱动的算法是解决强化学习问题的一类重要方法,但由于"维数灾"现象的存在,这种方法不能直接应用于解决具有连续状态空间的强化学习问题.解决维数灾问题的方法主要包括两种:状态空间的离散化和函数近似方法.相比函数近似,基于连续状态空间离散化的表格驱动方法具有原理直观、程序结构简单和计算轻量化的特点.基于连续状态空间离散化方法的关键是发现合适的状态空间离散化机制,平衡计算量及准确性,并且确保基于离散抽象状态空间的数值性度量,例如V值函数和Q值函数,可以较为准确地对原始强化学习问题进行策略评估和最优策略π*计算.文中提出一种基于凸多面体抽象域的自适应状态空间离散化方法,实现自适应的基于凸多面体抽象域的Q(λ)强化学习算法(Adaptive Polyhedra Domain based Q(λ),APDQ(λ)).凸多面体是一种抽象状态的表达方法,广泛应用于各种随机系统性能评估和程序数值性属性的验证.这种方法通过抽象函数,建立具体状态空间至多面体域的抽象状态空间的映射,把连续状态空间最优策略的计算问题转化为有限大小的和易于处理的抽象状态空间最优策略的计算问题.根据与抽象状态相关的样本集信息,设计了包括BoxRefinement、LFRefinement和MVLFRefinement多种自适应精化机制.依据这些精化机制,对抽象状态空间持续进行适应性精化,从而优化具体状态空间的离散化机制,产生符合在线抽样样本空间所蕴涵的统计奖赏模型.基于多面体专业计算库PPL(Parma Polyhedra Library)和高精度数值计算库GMP(GNU Multiple Precision)实现了算法APDQ(λ),并实施了实例研究.选择典型的连续状态空间强化学习问题山地车(Mountain Car,MC)和杂技机器人(Acrobatic robot,Acrobot)作为实验对象,详细评估了各种强化学习参数和自适应精化相关的阈值参数对APDQ(λ)性能的影响,探究了抽象状态空间动态变化情况下各种参数在策略优化过程中的作用机理.实验结果显示当折扣率γ大于0.7时,算法展现出较好的综合性能,在初期,策略都快速地改进,后面的阶段平缓地趋向收敛(如图6~图13所示),并且对学习率α和各种抽象状态空间精化参数都具有较好的适应性;当折扣率γ小于0.6时,算法的性能衰退较快.抽象解释技术用于统计学习过程是一种较好的解决连续强化学习问题的思想,有许多问题值得进一步研究和探讨,例如基于近似模型的采样和值函数更新等问题. 展开更多
关键词 学习 凸多面体抽象域 连续状态空间 Q(λ) 自适应
在线阅读 下载PDF
基于学习自适应估计环的迭代学习控制 被引量:2
4
作者 池荣虎 侯忠生 《仪器仪表学报》 EI CAS CSCD 北大核心 2005年第z1期800-802,共3页
针对一类具有强非线性和不确定性的离散时间系统,文章给出了一种基于学习自适应估计环的迭代学习控制方法。在迭代学习控制器的基础上设计了一个学习自适应估计环,用来镇定系统,给出迭代学习控制初始的控制输入值,同时根据估计出的系统... 针对一类具有强非线性和不确定性的离散时间系统,文章给出了一种基于学习自适应估计环的迭代学习控制方法。在迭代学习控制器的基础上设计了一个学习自适应估计环,用来镇定系统,给出迭代学习控制初始的控制输入值,同时根据估计出的系统参数来确定迭代学习增益的取值范围。文章基于状态空间描述,分析了迭代学习控制系统的收敛性。仿真研究表明,该控制器能够实现完全跟踪,减少系统的初始输出误差,并加快了收敛速度。 展开更多
关键词 学习自适应估计 迭代学习控制 非线性离散系统 状态空间
在线阅读 下载PDF
柔性直流输电系统高频谐振阻尼特性分析及自适应抑制 被引量:14
5
作者 尹嘉豪 吕敬 蔡旭 《电力系统自动化》 EI CSCD 北大核心 2022年第22期90-100,共11页
基于模块化多电平换流器(MMC)的柔性直流输电系统高频谐振现象频发,MMC的高频负阻尼特性是导致系统发生高频谐振的主要原因。文中首先采用谐波状态空间法建立了含解耦双同步参考坐标系锁相环(DDSRF-PLL)、正负序分离算法和正负序电流控... 基于模块化多电平换流器(MMC)的柔性直流输电系统高频谐振现象频发,MMC的高频负阻尼特性是导致系统发生高频谐振的主要原因。文中首先采用谐波状态空间法建立了含解耦双同步参考坐标系锁相环(DDSRF-PLL)、正负序分离算法和正负序电流控制的MMC交流侧详细阻抗模型。然后,采用阻尼分析方法分析了MMC的高频阻尼特性,并提出参数阻尼灵敏度以定量提取影响MMC高频阻尼的关键因素。最后,提出了一种柔性直流系统高频谐振自适应抑制策略,并与2种典型高频谐振抑制策略进行比较,验证了所提策略在不同电网运行条件和不同MMC控制延时下的有效性。 展开更多
关键词 柔性直流输电 模块多电平换流器(MMC) 高频谐振 稳定性分析 负序控制 阻尼灵敏度 自适应抑制 谐波状态空间 阻抗模型
在线阅读 下载PDF
支持合并的自适应tile coding算法
6
作者 施梦宇 刘全 傅启明 《通信学报》 EI CSCD 北大核心 2015年第2期186-192,共7页
针对自适应tile coding算法会产生多余划分的问题,提出一种支持合并的自适应tile coding算法——MATC。该算法能够消除传统自适应tile coding算法中产生的多余划分,进一步解决连续状态空间离散化的问题。将MATC算法应用于离散动作连续... 针对自适应tile coding算法会产生多余划分的问题,提出一种支持合并的自适应tile coding算法——MATC。该算法能够消除传统自适应tile coding算法中产生的多余划分,进一步解决连续状态空间离散化的问题。将MATC算法应用于离散动作连续状态的Mountain Car问题上,实验结果表明,该算法在学习过程中能消除传统tile coding算法的误划分所产生的不良影响,更准确地自动调整划分的精度,并更快地收敛到最佳策略。 展开更多
关键词 连续空间 离散 学习 自适应 TILE CODING
在线阅读 下载PDF
PAC最优的RMAX-KNN探索算法 被引量:2
7
作者 李超 门昌骞 王文剑 《计算机科学与探索》 CSCD 北大核心 2020年第3期513-526,共14页
探索与利用的均衡是强化学习研究的重点之一。探索帮助智能体进一步了解环境来做出更优决策;而利用帮助智能体根据其自身当前对于环境的认知来做出当前最优决策。目前大多数探索算法只与值函数相关联,不考虑当前智能体对于环境的认知程... 探索与利用的均衡是强化学习研究的重点之一。探索帮助智能体进一步了解环境来做出更优决策;而利用帮助智能体根据其自身当前对于环境的认知来做出当前最优决策。目前大多数探索算法只与值函数相关联,不考虑当前智能体对于环境的认知程度,探索效率极低。针对此问题,提出了一种基于状态空间自适应离散化的RMAX-KNN强化学习算法,算法根据当前智能体对于环境状态空间的离散化程度改写值函数形式,然后基于此值函数对环境进行合理的探索,逐步实现对于环境状态空间的自适应离散化划分。RMAXKNN算法通过将探索与环境状态空间离散化相结合,逐渐加深智能体对于环境的认知程度,进而提高探索效率,同时在理论上证明该算法是一种概率近似正确(PAC)最优探索算法。在Benchmark环境上的仿真实验结果表明,RMAX-KNN算法可以在探索环境的同时实现对于环境状态空间的自适应离散化,并学习到最优策略。 展开更多
关键词 探索与利用的均衡 值函数 状态空间自适应离散化 概率近似正确(PAC)最优探索算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部