期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于迭代神经动态规划的数据驱动非线性近似最优调节 被引量:11
1
作者 王鼎 穆朝絮 刘德荣 《自动化学报》 EI CSCD 北大核心 2017年第3期366-375,共10页
利用数据驱动控制思想,建立一种设计离散时间非线性系统近似最优调节器的迭代神经动态规划方法.提出针对离散时间一般非线性系统的迭代自适应动态规划算法并且证明其收敛性与最优性.通过构建三种神经网络,给出全局二次启发式动态规划技... 利用数据驱动控制思想,建立一种设计离散时间非线性系统近似最优调节器的迭代神经动态规划方法.提出针对离散时间一般非线性系统的迭代自适应动态规划算法并且证明其收敛性与最优性.通过构建三种神经网络,给出全局二次启发式动态规划技术及其详细的实现过程,其中执行网络是在神经动态规划的框架下进行训练.这种新颖的结构可以近似代价函数及其导函数,同时在不依赖系统动态的情况下自适应地学习近似最优控制律.值得注意的是,这在降低对于控制矩阵或者其神经网络表示的要求方面,明显地改进了迭代自适应动态规划算法的现有结果,能够促进复杂非线性系统基于数据的优化与控制设计的发展.通过两个仿真实验,验证本文提出的数据驱动最优调节方法的有效性. 展开更多
关键词 自适应动态规划 数据驱动控制 神经动态规划 神经网络 非线性近似最优调节
在线阅读 下载PDF
基于迭代ADP算法的污水处理过程最优控制 被引量:3
2
作者 乔俊飞 王亚清 柴伟 《北京工业大学学报》 CAS CSCD 北大核心 2018年第2期200-206,共7页
针对污水处理过程(wastewater treatment process,WWTP)中溶解氧质量浓度和硝态氮质量浓度的最优控制问题,提出了一种基于迭代自适应动态规划(adaptive dynamic programming,ADP)算法的最优控制策略.该策略无须知道污水处理过程的非线... 针对污水处理过程(wastewater treatment process,WWTP)中溶解氧质量浓度和硝态氮质量浓度的最优控制问题,提出了一种基于迭代自适应动态规划(adaptive dynamic programming,ADP)算法的最优控制策略.该策略无须知道污水处理过程的非线性动力学模型,只需污水处理系统的输入输出观测信息,设计基于ADP强化学习原理的控制体系结构,并利用神经网络辨识特性,通过在线迭代来逼近性能评价指标和最优控制策略.实验结果表明:该控制器相对于传统的PID控制策略,提高了污水处理过程的控制精度,系统鲁棒性也明显增强,控制性能更优. 展开更多
关键词 自适应动态规划 性能评价指标 最优控制策略 自适应动态规划(adp)算法
在线阅读 下载PDF
基于改进的迭代动态规划的化工过程动态优化
3
作者 潘衍 费正顺 +1 位作者 赵利 梁军 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第1期61-65,共5页
为了对化工动态系统进行快速的全局优化,结合并加强迭代动态规划算法和一阶梯度算法的优势,同时利用随机搜索和定向搜索,提出了基于一阶梯度算法的迭代动态规划算法,通过2个化工生产实际例子应用,证明了该算法具有高效、高精度、全局性... 为了对化工动态系统进行快速的全局优化,结合并加强迭代动态规划算法和一阶梯度算法的优势,同时利用随机搜索和定向搜索,提出了基于一阶梯度算法的迭代动态规划算法,通过2个化工生产实际例子应用,证明了该算法具有高效、高精度、全局性好等特点。 展开更多
关键词 动态规划算法 一阶梯度算法 动态优化
在线阅读 下载PDF
模型未知非零和博弈问题的策略迭代算法 被引量:3
4
作者 杨明 罗艳红 王义贺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第3期318-321,326,共5页
提出了一种在线积分策略迭代算法,用来求解内部非线性动力模型未知的双人非零和博弈问题.通过在控制策略和干扰策略中引入探测信号,从而避开了系统的模型信息,得到了一个求解非零和博弈的无模型的近似动态规划算法.该算法同步更新值函... 提出了一种在线积分策略迭代算法,用来求解内部非线性动力模型未知的双人非零和博弈问题.通过在控制策略和干扰策略中引入探测信号,从而避开了系统的模型信息,得到了一个求解非零和博弈的无模型的近似动态规划算法.该算法同步更新值函数、控制策略、扰动策略,并且最终得到收敛的策略权值.在算法实现过程中,使用4个神经网络分别近似两个值函数、控制策略和扰动策略,使用最小二乘法估计神经网络的未知参数.最后仿真结果验证了算法的有效性. 展开更多
关键词 自适应动态规划 非零和博弈 策略 神经网络 最优控制
在线阅读 下载PDF
基于协同进化的动态双重自适应改进PSO算法 被引量:10
5
作者 宋美 葛玉辉 刘举胜 《计算机工程与应用》 CSCD 北大核心 2020年第13期54-62,共9页
针对PSO算法易陷入局部最优,发生早熟这一先天缺陷,在一定的误差容忍度下,借鉴协同进化理论中主体的能动性,系统的非线性,个体与环境的协同进化及个体的自适应性等优良特性,利用Feigenbaum迭代构造混沌序列,对粒子的位置和速度进行初始... 针对PSO算法易陷入局部最优,发生早熟这一先天缺陷,在一定的误差容忍度下,借鉴协同进化理论中主体的能动性,系统的非线性,个体与环境的协同进化及个体的自适应性等优良特性,利用Feigenbaum迭代构造混沌序列,对粒子的位置和速度进行初始化取值;采用非线性和自适应调整策略对算法中的自我学习因子、社会学习因子及惯性权重进行取值,从而形成了动态双重自适应PSO改进算法(DDAPSO)。在单模态和多模态Benchmark函数上对上述算法进行仿真,并与其他5种算法进行了对比,仿真结果表明,DDAPSO算法较其他算法在求解精度、寻优效率和稳定性上具有极大的优势,表现出了较强的寻找全局最优解的能力,具有广泛的应用前景。 展开更多
关键词 协同进化理论 动态双重自适应 Feigenbaum 自适应调整 PSO算法
在线阅读 下载PDF
改进麻雀搜索算法的飞行器航迹规划 被引量:2
6
作者 雷刚 李云舒 +2 位作者 张宏强 罗炜 赖灿辉 《电光与控制》 CSCD 北大核心 2024年第3期41-47,共7页
针对传统麻雀搜索算法(SSA)在飞行器航迹规划求解问题中计算过程复杂、易陷入局部解等不足,提出了一种融合鲸鱼搜索因子和柯西-高斯变异的麻雀搜索算法(WSSA)。首先借助佳点集法对种群进行了初始化处理;其次借助鲸鱼算法中螺旋式搜索因... 针对传统麻雀搜索算法(SSA)在飞行器航迹规划求解问题中计算过程复杂、易陷入局部解等不足,提出了一种融合鲸鱼搜索因子和柯西-高斯变异的麻雀搜索算法(WSSA)。首先借助佳点集法对种群进行了初始化处理;其次借助鲸鱼算法中螺旋式搜索因子形成自适应权重迭代因子,提高算法全局搜索能力的同时保证局部的收敛性;随后在跟随者位置更新中加入柯西-高斯变异因子对原迭代进行扰动更新,提高算法的全局寻优能力;最后基于改进前后的算法进行了模型求解和适应度比较,验证了所提算法的有效性。 展开更多
关键词 航迹规划 禁飞区规避 麻雀搜索算法 自适应权重因子
在线阅读 下载PDF
数据驱动自适应评判控制研究进展
7
作者 王鼎 赵明明 +2 位作者 刘德荣 乔俊飞 宋世杰 《自动化学报》 北大核心 2025年第6期1170-1190,共21页
最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法.通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法,ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展.然而... 最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法.通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法,ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展.然而,实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型,对最优控制器的设计提出挑战.近年来,具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注,它能够在不依赖动态模型的情况下,仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器,符合智能自动化的发展潮流.通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理,着重介绍了最新的研究进展,包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习,并涵盖数据学习范式、稳定性、收敛性以及最优性的分析.此外,为提高学习效率和控制性能,设计了一些改进的评判机制和效用函数.最后,以污水处理过程为背景,总结数据驱动ADP方法在实际工业系统中的应用效果和存在问题,并展望一些未来的研究方向. 展开更多
关键词 自适应评判控制 自适应动态规划 数据驱动设计 在线Q学习 Q学习
在线阅读 下载PDF
基于自适应动态规划的时滞多智能体系统协同输出调节
8
作者 赵纯彦 徐磊 +1 位作者 高伟男 杨涛 《控制工程》 CSCD 北大核心 2023年第8期1477-1487,共11页
研究一类在状态、控制输入上具有多个时滞的离散时间多智能体系统的协同输出调节问题。首先,引入了一种扩展状态的方法,在不需要知道时滞的情况下,将有时滞的系统转化为扩展的无时滞系统;然后,利用内模原理和值迭代相结合的分布式控制... 研究一类在状态、控制输入上具有多个时滞的离散时间多智能体系统的协同输出调节问题。首先,引入了一种扩展状态的方法,在不需要知道时滞的情况下,将有时滞的系统转化为扩展的无时滞系统;然后,利用内模原理和值迭代相结合的分布式控制方法来实现该类问题的最优控制;其次,在不依赖系统动力学知识和初始稳定控制策略的情况下,仅使用系统的控制输入和状态数据,在线学习出一种基于值迭代的数据驱动的自适应控制策略,能够保证闭环多智能体系统既能抑制干扰又能实现渐近跟踪;最后,通过一个仿真案例验证了所提方法的有效性。 展开更多
关键词 多智能体系统 输入延时 状态延时 协同输出调节 自适应动态规划
在线阅读 下载PDF
针对方向图综合的MIMO雷达双边自适应矩阵算法 被引量:2
9
作者 王勇 刘宏伟 +1 位作者 纠博 杨晓超 《电子与信息学报》 EI CSCD 北大核心 2012年第4期898-903,共6页
为了降低MIMO雷达自适应矩阵算法(Adaptive Matrix Approach,AMA)的计算复杂度和样本需求,该文提出一种双边AMA(Two-Sided AMA,TS-AMA)算法。TS-AMA算法将AMA算法的权矩阵分解成两个低维权矩阵的Kronecker积,从而将AMA算法的代价函数转... 为了降低MIMO雷达自适应矩阵算法(Adaptive Matrix Approach,AMA)的计算复杂度和样本需求,该文提出一种双边AMA(Two-Sided AMA,TS-AMA)算法。TS-AMA算法将AMA算法的权矩阵分解成两个低维权矩阵的Kronecker积,从而将AMA算法的代价函数转化为一个双二次的代价函数。新的代价函数可以通过结合半正定规划(Semi-Definite Programming,SDP)和双迭代算法(Bi-Iterative Algorithm,BIA)有效地求解。相比AMA算法,TS-AMA算法的收敛速度更快,样本需求更低,运算量更小。仿真结果说明了该算法的有效性。 展开更多
关键词 MIMO雷达 方向图综合 双边自适应矩阵算法 半正定规划 算法
在线阅读 下载PDF
基于IDP的重型商用车自适应距离域预见性巡航控制策略 被引量:2
10
作者 李兴坤 王国晖 +3 位作者 卢紫旺 王玉海 王语风 田光宇 《汽车工程》 EI CSCD 北大核心 2024年第8期1346-1356,共11页
为降低重型商用车燃油消耗、减少运输成本,本文协调“人-车-路”交互体系,将车辆与智能网联环境下的多维度信息进行融合,提出了一种基于迭代动态规划(iterative dynamic programming,IDP)的自适应距离域预见性巡航控制策略(adaptive ran... 为降低重型商用车燃油消耗、减少运输成本,本文协调“人-车-路”交互体系,将车辆与智能网联环境下的多维度信息进行融合,提出了一种基于迭代动态规划(iterative dynamic programming,IDP)的自适应距离域预见性巡航控制策略(adaptive range predictive cruise control strategy,ARPCC)。首先结合车辆状态与前方环境多维度信息,基于车辆纵向动力学建立自适应距离域模型对路网重构,简化网格数量并利用IDP求取全局最优速度序列。其次,在全局最优速度序列的基础上,求取自适应距离域内的分段最优速度序列,实现车辆控制状态的快速求解。最后,利用Matlab/Simulink进行验证。结果表明,通过多次迭代缩小网格,该算法有效提高了计算效率和车辆燃油经济性。 展开更多
关键词 重型商用车 自适应距离域 预见性巡航 动态规划
在线阅读 下载PDF
基于人工鱼群算法的园林导览路径规划方法研究
11
作者 杨琳艺 《现代电子技术》 北大核心 2020年第3期169-172,共4页
导览路径规划作为园林智能辅助导览系统中的重要一环,能够为游客提供实时的目的地地图路径指导,直接影响着用户的使用体验。为了提高其准确性和实时性,提出一种基于人工鱼群算法的园林导览路径规划方法。对导览环境模型及相关问题进行描... 导览路径规划作为园林智能辅助导览系统中的重要一环,能够为游客提供实时的目的地地图路径指导,直接影响着用户的使用体验。为了提高其准确性和实时性,提出一种基于人工鱼群算法的园林导览路径规划方法。对导览环境模型及相关问题进行描述,并通过总长度和平滑度两个方面设计了路径规划的目标函数。对采用的人工鱼群优化算法进行分析,并针对人工鱼群算法存在的缺点,在步长更新方式上进行了改进,有利于提高寻优精度和运行速度。仿真环境下的测试结果表明,提出的改进算法具有更好的最优解和快速收敛性能。实际案例应用结果验证了提出路径规划方法的可行性和有效性。 展开更多
关键词 园林导览 路径规划 人工鱼群算法 自适应步长 目标函数 曲线
在线阅读 下载PDF
基于ADP的一类时滞离散系统跟踪控制 被引量:1
12
作者 林小峰 杨晓娜 +1 位作者 黄清宝 宋春宁 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第6期994-999,共6页
时滞现象是自然界中广泛存在的一种物理现象,时滞的存在使得被控量不能及时反映系统的变化,从而使控制系统的稳定性变差,给时滞系统控制器的设计带来很大困难。针对一类状态和控制输入均含有时滞的离散仿射系统的跟踪控制进行研究,采用... 时滞现象是自然界中广泛存在的一种物理现象,时滞的存在使得被控量不能及时反映系统的变化,从而使控制系统的稳定性变差,给时滞系统控制器的设计带来很大困难。针对一类状态和控制输入均含有时滞的离散仿射系统的跟踪控制进行研究,采用自适应动态规划迭代算法求解时滞系统的跟踪控制,在自适应动态规划的基础上,建立系统性能指标函数,通过系统变换将跟踪问题转化成为最优调节问题,并采用自适应动态规划迭代算法对性能指标函数进行迭代求解,得到最优控制策略。并给出了一个仿真算例,结果证明了所提出的跟踪控制方案是有效的。 展开更多
关键词 时滞 跟踪 离散非线性系统 自适应动态规划
在线阅读 下载PDF
补料分批发酵过程动态优化控制研究 被引量:2
13
作者 李海波 潘丰 《控制工程》 CSCD 北大核心 2019年第10期1950-1954,共5页
针对非线性程度高、稳定性差的生化过程典型应用案例-酒精补料分批发酵过程的优化控制问题,从提高寻优效率和最大化产物浓度出发,提出了一种基于预测控制中的核心思想-滚动优化策略,利用罚函数法将原带有约束的优化问题转化为无约束的... 针对非线性程度高、稳定性差的生化过程典型应用案例-酒精补料分批发酵过程的优化控制问题,从提高寻优效率和最大化产物浓度出发,提出了一种基于预测控制中的核心思想-滚动优化策略,利用罚函数法将原带有约束的优化问题转化为无约束的优化问题,从而通过蚁群算法与迭代动态规划相结合的混合优化算法来进行基质流加率控制轨迹动态优化。并将这种优化策略应用的结果与蚁群算法寻优效果比较,仿真结果显示,无论从寻优速度、优化性能等方面都有了较大的改善。 展开更多
关键词 滚动时域优化 模型预测控制 优化控制 蚁群算法 动态规划
在线阅读 下载PDF
面向多人同时作业的拆卸序列规划 被引量:6
14
作者 蔡凯骏 张伟明 +2 位作者 张梅军 季立 赵鸿飞 《计算机集成制造系统》 EI CSCD 北大核心 2016年第12期2767-2777,共11页
为生成面向多人同时作业的并行拆卸序列、提高求解的效率与质量,在分析现有方法不足之处的基础上,提出基于改进蚁群算法的面向多人同时作业的拆卸序列规划方法(Disassembly Sequence Planning For Multipeople Simultaneous Operation,D... 为生成面向多人同时作业的并行拆卸序列、提高求解的效率与质量,在分析现有方法不足之处的基础上,提出基于改进蚁群算法的面向多人同时作业的拆卸序列规划方法(Disassembly Sequence Planning For Multipeople Simultaneous Operation,DSPMSO)。针对该方法的特点,基于零件分层图对于零件配合关系以及可拆卸性的表达,提出改进的蚂蚁搜索方式,并采用动态候选表避免无效序列的产生;定义了零件拆卸所需人数与拆卸等待时间,提出以考虑等待时间为主的多人拆卸成本模型;针对基本蚁群算法求解复杂装配体拆卸序列时算法求解效率与解的质量难以兼顾的问题,提出算法的分阶段迭代策略:根据路径信息量确定算法迭代阶段,使蚂蚁具有不同的选路策略,提出与之对应的蚂蚁信息素自适应更新机制,使算法在求解的效率与质量之间取得较好的平衡。通过实例对关键参数的取值进行讨论,并验证了算法各项优化措施的有效性。 展开更多
关键词 多人同时作业 拆卸序列规划 改进蚁群算法 分阶段 自适应更新
在线阅读 下载PDF
一类短生命周期产品的订购与定价联合决策模型 被引量:3
15
作者 刘斌 刘思峰 +1 位作者 邱广华 翟振杰 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2007年第5期691-694,共4页
研究了一类短生命周期产品在价格依赖(加和)随机需求下的订购与定价联合决策问题。根据一类产品单周期两阶段销售的营销特性,首先以集中式系统的视角研究了其联合最优决策,并应用随机动态规划模型刻画了集中式系统的最优决策;然后,证明... 研究了一类短生命周期产品在价格依赖(加和)随机需求下的订购与定价联合决策问题。根据一类产品单周期两阶段销售的营销特性,首先以集中式系统的视角研究了其联合最优决策,并应用随机动态规划模型刻画了集中式系统的最优决策;然后,证明了其期望利润函数关于各决策矢量的凹性,并给出了确定最优决策矢量的迭代搜寻算法;最后,应用数值实验对决策结果进行了分析。研究表明:系统的绩效主要来自于销售的第一阶段,经营者应当更注重该阶段利润的挖掘。 展开更多
关键词 报童模型 联合决策 随机动态规划 搜寻算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部