期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
An Optimal Control Scheme for a Class of Discrete-time Nonlinear Systems with Time Delays Using Adaptive Dynamic Programming 被引量:17
1
作者 WEI Qing-Lai ZHANG Hua-Guang +1 位作者 LIU De-Rong ZHAO Yan 《自动化学报》 EI CSCD 北大核心 2010年第1期121-129,共9页
关键词 非线性系统 最优控制 控制变量 动态规划
在线阅读 下载PDF
Optimal Tracking Control for a Class of Unknown Discrete-time Systems with Actuator Saturation via Data-based ADP Algorithm 被引量:4
2
作者 SONG Rui-Zhuo XIAO Wen-Dong SUN Chang-Yin 《自动化学报》 EI CSCD 北大核心 2013年第9期1413-1420,共8页
为有致动器浸透和未知动力学的分离时间的系统的一个班的一个新奇最佳的追踪控制方法在这份报纸被建议。计划基于反复的适应动态编程(自动数据处理) 算法。以便实现控制计划,一个 data-based 标识符首先为未知系统动力学被构造。由介绍... 为有致动器浸透和未知动力学的分离时间的系统的一个班的一个新奇最佳的追踪控制方法在这份报纸被建议。计划基于反复的适应动态编程(自动数据处理) 算法。以便实现控制计划,一个 data-based 标识符首先为未知系统动力学被构造。由介绍 M 网络,稳定的控制的明确的公式被完成。以便消除致动器浸透的效果, nonquadratic 表演功能被介绍,然后一个反复的自动数据处理算法被建立与集中分析完成最佳的追踪控制解决方案。为实现最佳的控制方法,神经网络被用来建立 data-based 标识符,计算性能索引功能,近似最佳的控制政策并且分别地解决稳定的控制。模拟例子被提供验证介绍最佳的追踪的控制计划的有效性。 展开更多
关键词 最优跟踪控制 离散时间系统 饱和执行器 DP算法 控制方案 神经网络 性能指标 系统动力学
在线阅读 下载PDF
基于改进遗传算法的动载荷识别研究 被引量:1
3
作者 秦远田 唐甜 张炉平 《振动.测试与诊断》 北大核心 2025年第1期146-153,205,206,共10页
针对同时识别动载荷位置和大小中的矩阵病态问题,以及将反问题转化为正向识别的最值问题,采用自适应算法和非线性规划对遗传算法(genetic algorithm,简称GA)进行改进,将改进后的混合算法用于求解最值问题,得到动载荷参数。首先,建立频... 针对同时识别动载荷位置和大小中的矩阵病态问题,以及将反问题转化为正向识别的最值问题,采用自适应算法和非线性规划对遗传算法(genetic algorithm,简称GA)进行改进,将改进后的混合算法用于求解最值问题,得到动载荷参数。首先,建立频域识别模型,把理论值与测量值的差值的二范数最小化作为优化目标函数;其次,将该目标函数作为混合算法的评价函数来识别动载荷参数;最后,进行简支梁动载荷识别的仿真和实验,对比了正向识别和逆系统法,讨论了非线性规划代数和噪音对混合算法的影响。研究结果表明:正向识别避免了矩阵求逆病态问题;相比遗传算法和自适应遗传算法,所提出算法可同时更准确和稳定地识别多个动载荷参数,且抗噪性更强。 展开更多
关键词 动载荷识别 遗传算法 自适应算法 非线性规划
在线阅读 下载PDF
基于模糊神经网络在线自学习的多智能体一致性控制 被引量:1
4
作者 张宪霞 唐胜杰 俞寅生 《自动化学报》 北大核心 2025年第3期590-603,共14页
针对多智能体系统分布式一致性控制问题,提出一种新的融合动态模糊神经网络(Dynamic fuzzy neural network,DFNN)和自适应动态规划(Adaptive dynamic programming,ADP)算法的无模型自适应控制方法.类似于强化学习中执行者-评论家结构,D... 针对多智能体系统分布式一致性控制问题,提出一种新的融合动态模糊神经网络(Dynamic fuzzy neural network,DFNN)和自适应动态规划(Adaptive dynamic programming,ADP)算法的无模型自适应控制方法.类似于强化学习中执行者-评论家结构,DFNN和神经网络(Neural network,NN)分别逼近控制策略和性能指标.每个智能体的DFNN执行者从零规则开始,通过在线学习,与其局部邻域的智能体交互而生成和合并规则.最终,每个智能体都有一个独特的DFNN控制器,具有不同的结构和参数,实现了最优的分布式同步控制律.仿真结果表明,本文提出的在线算法在非线性多智能体系统分布式一致性控制中优于传统基于NN的ADP算法. 展开更多
关键词 多智能体系统 自适应动态规划 动态模糊神经网络 分布式一致性控制 在线学习
在线阅读 下载PDF
基于策略迭代ADP的碳纤维角联织机张力控制 被引量:4
5
作者 刘薇 张黎 李想 《天津工业大学学报》 CAS 北大核心 2023年第1期72-80,共9页
针对碳纤维角联织机经纱张力控制问题,考虑开口等不确定因素对经纱张力的影响,建立了离散非线性送经系统张力控制模型,提出了策略迭代自适应动态规划(ADP),并对ADP中评价网络设计了自适应权值更新率;证明了策略迭代ADP在离散系统的收敛... 针对碳纤维角联织机经纱张力控制问题,考虑开口等不确定因素对经纱张力的影响,建立了离散非线性送经系统张力控制模型,提出了策略迭代自适应动态规划(ADP),并对ADP中评价网络设计了自适应权值更新率;证明了策略迭代ADP在离散系统的收敛性,削减了非线性及不确定因素对经纱张力的影响,实现了对经纱张力的稳定控制,提高了系统鲁棒性。仿真结果表明:相比传统ADP,策略迭代ADP可以使经纱张力在2 s内快速无波动的到达稳定状态,使系统性能指标函数收敛更优。 展开更多
关键词 碳纤维角联织机 送经系统 策略迭代adp 自适应权值更新率
在线阅读 下载PDF
基于ADP的一类时滞离散系统跟踪控制 被引量:1
6
作者 林小峰 杨晓娜 +1 位作者 黄清宝 宋春宁 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第6期994-999,共6页
时滞现象是自然界中广泛存在的一种物理现象,时滞的存在使得被控量不能及时反映系统的变化,从而使控制系统的稳定性变差,给时滞系统控制器的设计带来很大困难。针对一类状态和控制输入均含有时滞的离散仿射系统的跟踪控制进行研究,采用... 时滞现象是自然界中广泛存在的一种物理现象,时滞的存在使得被控量不能及时反映系统的变化,从而使控制系统的稳定性变差,给时滞系统控制器的设计带来很大困难。针对一类状态和控制输入均含有时滞的离散仿射系统的跟踪控制进行研究,采用自适应动态规划迭代算法求解时滞系统的跟踪控制,在自适应动态规划的基础上,建立系统性能指标函数,通过系统变换将跟踪问题转化成为最优调节问题,并采用自适应动态规划迭代算法对性能指标函数进行迭代求解,得到最优控制策略。并给出了一个仿真算例,结果证明了所提出的跟踪控制方案是有效的。 展开更多
关键词 时滞 跟踪 迭代 离散非线性系统 自适应动态规划
在线阅读 下载PDF
基于ELM的水泥立磨生料细度ADP控制 被引量:6
7
作者 林小峰 孔伟凯 《系统仿真学报》 CAS CSCD 北大核心 2016年第11期2764-2770,共7页
水泥生产中的立磨粉磨过程具有非线性、强耦合、大滞后等特点,对其进行精确的建模和实现生料细度的控制比较困难。提出一种基于极限学习机(ELM,extreme learning machine)的自适应动态规划(ADP,adaptive dynamic programming)优化控制... 水泥生产中的立磨粉磨过程具有非线性、强耦合、大滞后等特点,对其进行精确的建模和实现生料细度的控制比较困难。提出一种基于极限学习机(ELM,extreme learning machine)的自适应动态规划(ADP,adaptive dynamic programming)优化控制算法。采用极限学习机建立立磨生料粉磨过程的生料细度预测模型,将其作为ADP算法中的模型网络,并以在线序列极限学习机实现ADP的执行网络和评价网络。结果表明:在仿真意义上,所提算法能够对生料细度进行有效地控制,对立磨稳定生产,降低该生产过程的能耗具有一定理论指导意义。 展开更多
关键词 水泥立磨 生料 自适应动态规划 极限学习机
在线阅读 下载PDF
一种高超声速飞行器的纵向变形与飞行最优协调控制方法 被引量:1
8
作者 陈宇腾 常晶 +2 位作者 陈为胜 李小平 包为民 《宇航学报》 北大核心 2025年第3期485-498,共14页
针对高超声速变形飞行器的变形与飞行一体化控制系统设计问题,提出了一种将变形率作为其关键动态参数的纵向最优协调控制方法。首先,建立后掠角可变化的高超声速飞行器的动力学模型,并推导了具有严格反馈形式的变形飞行一体化控制模型... 针对高超声速变形飞行器的变形与飞行一体化控制系统设计问题,提出了一种将变形率作为其关键动态参数的纵向最优协调控制方法。首先,建立后掠角可变化的高超声速飞行器的动力学模型,并推导了具有严格反馈形式的变形飞行一体化控制模型。其次,利用自适应动态面控制生成基础控制,采用自适应动态规划(ADP)为补偿优化控制,形成变形与飞行一体化最优协调控制方法,并基于李雅普诺夫稳定性理论证明了权值误差的一致最终有界和闭环系统的渐近稳定性。最后,通过对比仿真结果验证了所提方法的控制性能。 展开更多
关键词 高超声速变形飞行器 自适应动态规划(adp) 动态面 协调控制 变形与飞行一体化
在线阅读 下载PDF
未知大规模互联系统在线分散式动态事件触发控制
9
作者 何怡睿 苏涵光 +1 位作者 张化光 栾鑫洋 《自动化学报》 北大核心 2025年第9期2011-2026,共16页
针对一类系统动态未知且受互联项影响的非线性互联大规模系统,提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control,DETC)方案.首先,构建基于神经网络的辨识器来重构互联系统的未知内部动态.其次,使用自适应评判... 针对一类系统动态未知且受互联项影响的非线性互联大规模系统,提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control,DETC)方案.首先,构建基于神经网络的辨识器来重构互联系统的未知内部动态.其次,使用自适应评判网络在事件触发机制下学习近似最优控制策略.在所设计的动态事件触发控制机制下,各子系统独立地设计自己的控制策略,且各控制策略的更新是异步进行的.也就是说,各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息,而无需频繁获取相邻子系统的信息,从而规避通过通信网络在子系统间传递状态信息的需求.然后,借助李雅普诺夫稳定性定理,从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的.最后,通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性. 展开更多
关键词 自适应动态规划 动态事件触发控制 大规模系统 控制受限
在线阅读 下载PDF
数据驱动自适应评判控制研究进展
10
作者 王鼎 赵明明 +2 位作者 刘德荣 乔俊飞 宋世杰 《自动化学报》 北大核心 2025年第6期1170-1190,共21页
最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法.通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法,ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展.然而... 最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法.通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法,ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展.然而,实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型,对最优控制器的设计提出挑战.近年来,具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注,它能够在不依赖动态模型的情况下,仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器,符合智能自动化的发展潮流.通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理,着重介绍了最新的研究进展,包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习,并涵盖数据学习范式、稳定性、收敛性以及最优性的分析.此外,为提高学习效率和控制性能,设计了一些改进的评判机制和效用函数.最后,以污水处理过程为背景,总结数据驱动ADP方法在实际工业系统中的应用效果和存在问题,并展望一些未来的研究方向. 展开更多
关键词 自适应评判控制 自适应动态规划 数据驱动设计 在线Q学习 迭代Q学习
在线阅读 下载PDF
基于SQP和GRNN的商用客车动力学参数自适应辨识
11
作者 房熙博 宁一高 +1 位作者 赵轩 周猛 《汽车安全与节能学报》 北大核心 2025年第4期648-656,共9页
提出了一种基于广义回归神经网络(GRNN)模型和序列二次规划(SQP)算法的自适应辨识策略,用于获取商用客车动力学参数并对其实时辨识。建立GRNN模型,用SQP算法获取GRNN模型的训练集对其进行训练,使其根据车辆的运行状态,自适应辨识出关键... 提出了一种基于广义回归神经网络(GRNN)模型和序列二次规划(SQP)算法的自适应辨识策略,用于获取商用客车动力学参数并对其实时辨识。建立GRNN模型,用SQP算法获取GRNN模型的训练集对其进行训练,使其根据车辆的运行状态,自适应辨识出关键参数;搭建TruckSim与Matlab/Simulink联合仿真平台,在不同工况下进行仿真试验。结果表明:相较于固定参数模型,在正弦波转角工况下,采用该模型的质心侧偏角与TruckSim模型的最大值误差减小73.9%;其侧倾角与TruckSim模型的最大值误差减少了76.7%;在双移线工况下,这2个误差分别减小98.0%和63.1%。从而,证明了本文方法的可行性和有效性。 展开更多
关键词 汽车安全 商用客车 序列二次规划(SQP)算法 广义回归神经网络(GRNN)模型 动力学参数 自适应辨识
在线阅读 下载PDF
DP-ADPSO算法在机组负荷优化组合分配问题中的应用
12
作者 闫旺 李郁侠 +3 位作者 师彪 孟欣 李鹏 牛艳利 《沈阳农业大学学报》 CAS CSCD 北大核心 2010年第1期64-68,共5页
针对离散粒子群应用于机组负荷优化问题中存在早熟收敛的难题,提出了动态规划-自适应离散粒子群算法求解机组负荷优化组合问题。该方法首先保证所有随机生成的粒子均为满足基本约束条件的可行解,使整个算法只在可行解区域内进行动态优... 针对离散粒子群应用于机组负荷优化问题中存在早熟收敛的难题,提出了动态规划-自适应离散粒子群算法求解机组负荷优化组合问题。该方法首先保证所有随机生成的粒子均为满足基本约束条件的可行解,使整个算法只在可行解区域内进行动态优化搜索,缩短了计算时间。计算实例表明:动态规划-自适应离散粒子群算法能较好地收敛到最优解,而且该方法得出的解具有精度高、收敛速度快的优点,应用效果优于动态规划法和离散粒子群算法,说明该方法是有效的、合理的,具有较好的应用前景。 展开更多
关键词 离散粒子群算法 动态规划-自适应离散粒子群算法 机组优化组合 负荷分配 全局最优解
在线阅读 下载PDF
基于动态规划算法和改进的自适应遗传算法的“多泵-多马达”液压系统全局功率匹配研究
13
作者 邹博识 宋昕宇 钟宇航 《机床与液压》 北大核心 2025年第9期203-214,共12页
针对“多泵-多马达”液压系统运行过程中因功率匹配而导致的低效率问题,提出一种基于反向传播(BP)神经网络算法、动态规划算法(DP)与改进自适应遗传算法(IAGA)的智能优化协同方法,以实现系统全局功率匹配和节能目标。针对遗传算法寻优... 针对“多泵-多马达”液压系统运行过程中因功率匹配而导致的低效率问题,提出一种基于反向传播(BP)神经网络算法、动态规划算法(DP)与改进自适应遗传算法(IAGA)的智能优化协同方法,以实现系统全局功率匹配和节能目标。针对遗传算法寻优效率低、无法对离散变量进行优化的问题,在前人提出的遗传算法优化输出的最佳发动机转速和液压泵排量进行功率匹配的基础上,采用在多泵输油系统节能中应用广泛的动态规划算法,近一步对马达的投入排量、马达和发动机投入数量进行优化。利用具有较强非线性映射能力和高拟合精度的BP神经网络算法建立泵和马达效率模型以及发动机燃油消耗模型,采用动态规划算法确定当前工况下马达和发动机最优投入数量,确定变量泵和变量马达的高效排量范围。利用改进自适应遗传算法搜索当前工况下泵和马达最佳排量组合,并通过提高功率传递路径上各元件的效率,实现全局效率最高。最后,通过在具有“多泵-多马达”液压系统的工程车辆进行实车油耗测试验,以验证该方案的可行性。结果表明:新方案与原控制方案相比,马达和泵的效率提升明显,具有较好的节油效果。 展开更多
关键词 多泵多马达 神经网络功率预测模型 动态规划算法 改进自适应遗传算法 全局功率匹配
在线阅读 下载PDF
基于迭代ADP算法的污水处理过程最优控制 被引量:3
14
作者 乔俊飞 王亚清 柴伟 《北京工业大学学报》 CAS CSCD 北大核心 2018年第2期200-206,共7页
针对污水处理过程(wastewater treatment process,WWTP)中溶解氧质量浓度和硝态氮质量浓度的最优控制问题,提出了一种基于迭代自适应动态规划(adaptive dynamic programming,ADP)算法的最优控制策略.该策略无须知道污水处理过程的非线... 针对污水处理过程(wastewater treatment process,WWTP)中溶解氧质量浓度和硝态氮质量浓度的最优控制问题,提出了一种基于迭代自适应动态规划(adaptive dynamic programming,ADP)算法的最优控制策略.该策略无须知道污水处理过程的非线性动力学模型,只需污水处理系统的输入输出观测信息,设计基于ADP强化学习原理的控制体系结构,并利用神经网络辨识特性,通过在线迭代来逼近性能评价指标和最优控制策略.实验结果表明:该控制器相对于传统的PID控制策略,提高了污水处理过程的控制精度,系统鲁棒性也明显增强,控制性能更优. 展开更多
关键词 自适应动态规划 性能评价指标 最优控制策略 迭代自适应动态规划(adp)算法
在线阅读 下载PDF
基于IDP的重型商用车自适应距离域预见性巡航控制策略 被引量:2
15
作者 李兴坤 王国晖 +3 位作者 卢紫旺 王玉海 王语风 田光宇 《汽车工程》 EI CSCD 北大核心 2024年第8期1346-1356,共11页
为降低重型商用车燃油消耗、减少运输成本,本文协调“人-车-路”交互体系,将车辆与智能网联环境下的多维度信息进行融合,提出了一种基于迭代动态规划(iterative dynamic programming,IDP)的自适应距离域预见性巡航控制策略(adaptive ran... 为降低重型商用车燃油消耗、减少运输成本,本文协调“人-车-路”交互体系,将车辆与智能网联环境下的多维度信息进行融合,提出了一种基于迭代动态规划(iterative dynamic programming,IDP)的自适应距离域预见性巡航控制策略(adaptive range predictive cruise control strategy,ARPCC)。首先结合车辆状态与前方环境多维度信息,基于车辆纵向动力学建立自适应距离域模型对路网重构,简化网格数量并利用IDP求取全局最优速度序列。其次,在全局最优速度序列的基础上,求取自适应距离域内的分段最优速度序列,实现车辆控制状态的快速求解。最后,利用Matlab/Simulink进行验证。结果表明,通过多次迭代缩小网格,该算法有效提高了计算效率和车辆燃油经济性。 展开更多
关键词 重型商用车 自适应距离域 预见性巡航 迭代动态规划
在线阅读 下载PDF
永磁同步电动机速度伺服系统最优输出反馈控制器设计 被引量:4
16
作者 王忠阳 梁丽 王友清 《自动化学报》 EI CAS CSCD 北大核心 2024年第9期1794-1803,共10页
针对永磁同步电动机(Permanent magnet synchronous motor,PMSM)模型参数未知以及电枢电流和负载转矩无法直接测量的问题,设计一种基于自适应动态规划(Adaptive dynamic programming,ADP)的输出反馈控制方案,实现PMSM最优速度跟踪控制.... 针对永磁同步电动机(Permanent magnet synchronous motor,PMSM)模型参数未知以及电枢电流和负载转矩无法直接测量的问题,设计一种基于自适应动态规划(Adaptive dynamic programming,ADP)的输出反馈控制方案,实现PMSM最优速度跟踪控制.首先,根据PMSM内部特性确定其数学模型的结构,构建与原始系统相对应的辅助系统,引入新的线性二次指标来实现速度最优跟踪调节.其次,设计一种嵌入式观测器,该观测器能够在系统模型未知情况下用可测量数据重构系统全部状态.此外,提出一种离线策略的ADP方法逼近最优控制增益的解.最后,仿真结果验证所提控制方案在模型参数未知以及电枢电流和负载转矩不可测量的情况下,实现了精确的速度跟踪性能和良好的瞬态响应,同时降低了电压的冲击. 展开更多
关键词 永磁同步电动机 自适应动态规划 输出反馈 线性二次指标
在线阅读 下载PDF
深度学习在控制领域的研究现状与展望 被引量:154
17
作者 段艳杰 吕宜生 +2 位作者 张杰 赵学亮 王飞跃 《自动化学报》 EI CSCD 北大核心 2016年第5期643-654,共12页
深度学习在特征提取与模型拟合方面显示了其潜力和优势.对于存在高维数据的控制系统,引入深度学习具有一定的意义.近年来,已有一些研究关注深度学习在控制领域的应用.本文介绍了深度学习在控制领域的研究方向和现状,包括控制目标识别、... 深度学习在特征提取与模型拟合方面显示了其潜力和优势.对于存在高维数据的控制系统,引入深度学习具有一定的意义.近年来,已有一些研究关注深度学习在控制领域的应用.本文介绍了深度学习在控制领域的研究方向和现状,包括控制目标识别、状态特征提取、系统参数辨识和控制策略计算.并对相关的深度控制以及自适应动态规划与平行控制的方法和思想进行了描述.总结了深度学习在控制领域研究中的主要作用和存在的问题,展望了未来值得研究的方向. 展开更多
关键词 深度学习 控制 特征 自适应动态规划
在线阅读 下载PDF
自适应动态规划综述 被引量:84
18
作者 张化光 张欣 +1 位作者 罗艳红 杨珺 《自动化学报》 EI CSCD 北大核心 2013年第4期303-311,共9页
自适应动态规划(Adaptive dynamic programming,ADP)是最优控制领域新兴起的一种近似最优方法,是当前国际最优化领域的研究热点.ADP方法利用函数近似结构来近似哈密顿–雅可比–贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程的解,采用离线... 自适应动态规划(Adaptive dynamic programming,ADP)是最优控制领域新兴起的一种近似最优方法,是当前国际最优化领域的研究热点.ADP方法利用函数近似结构来近似哈密顿–雅可比–贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程的解,采用离线迭代或者在线更新的方法,来获得系统的近似最优控制策略,从而能够有效地解决非线性系统的优化控制问题.本文按照ADP的结构变化、算法的发展和应用三个方面介绍ADP方法.对目前ADP方法的研究成果加以总结,并对这一研究领域仍需解决的问题和未来的发展方向作了进一步的展望. 展开更多
关键词 自适应动态规划 神经网络 非线性系统 稳定性
在线阅读 下载PDF
基于数据的自学习优化控制:研究进展与展望 被引量:23
19
作者 刘德荣 李宏亮 王鼎 《自动化学报》 EI CSCD 北大核心 2013年第11期1858-1870,共13页
自适应动态规划(Adaptive dynamic programming,ADP)方法可以解决传统动态规划中的"维数灾"问题,已经成为控制理论和计算智能领域最新的研究热点.ADP方法采用函数近似结构来估计系统性能指标函数,然后依据最优性原理来获得近... 自适应动态规划(Adaptive dynamic programming,ADP)方法可以解决传统动态规划中的"维数灾"问题,已经成为控制理论和计算智能领域最新的研究热点.ADP方法采用函数近似结构来估计系统性能指标函数,然后依据最优性原理来获得近优的控制策略.ADP是一种具有学习和优化能力的智能控制方法,在求解复杂非线性系统的最优控制问题中具有极大的潜力.本文对ADP的理论研究、算法实现、相关应用等方面进行了全面的梳理,涵盖了最新的研究进展,并对ADP的未来发展趋势进行了分析和展望. 展开更多
关键词 自适应动态规划 近似动态规划 强化学习 神经网络 智能控制
在线阅读 下载PDF
微电网多目标随机动态优化调度算法 被引量:23
20
作者 王雅平 林舜江 +2 位作者 杨智斌 孙兴鲁 刘明波 《电工技术学报》 EI CSCD 北大核心 2018年第10期2196-2207,共12页
针对含风光发电和储能电池的微电网多目标随机动态优化调度问题,建立以微电源总运行费用和系统总网损为目标函数,同时以多个蓄电池剩余电量的和作为资源存储量的微电网多目标随机型存储模型。模型中采用交流潮流模型准确描述配电线路的... 针对含风光发电和储能电池的微电网多目标随机动态优化调度问题,建立以微电源总运行费用和系统总网损为目标函数,同时以多个蓄电池剩余电量的和作为资源存储量的微电网多目标随机型存储模型。模型中采用交流潮流模型准确描述配电线路的传输功率安全约束,并考虑了各种分布式电源的电压无功特性。结合自适应加权和法(AWS)和近似动态规划法(ADP)求解多目标随机动态优化调度问题,先采用AWS法将多目标随机动态优化模型转化为一系列单目标随机动态优化模型,再采用ADP的近似值函数迭代算法实现对单目标随机动态优化模型的逐时段递推解耦求解,并通过对AWS法中分割段新增Pareto点对应权值的调整以得到均匀分布的Pareto前沿。通过某一实际微电网的算例仿真,证明了所提出模型与算法的正确性和有效性。 展开更多
关键词 微电网调度 随机优化 多目标优化 近似动态规划 自适应加权和法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部