期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于分布式自适应内模的多智能体系统协同最优输出调节 被引量:1
1
作者 董昱辰 高伟男 姜钟平 《自动化学报》 北大核心 2025年第3期678-691,共14页
针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最... 针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最优控制器,实现多智能体系统的协同输出调节.考虑到跟随者只能访问领导者的估计值进行在线学习,对闭环系统的稳定性和学习算法的收敛性进行严格的理论分析,证明所学习的控制增益可以收敛到最优控制增益.仿真结果验证了所提控制方法的有效性. 展开更多
关键词 自适应动态规划 分布式自适应内模 强化学习 协同输出调节 多智能体系统
在线阅读 下载PDF
带有输入时滞的非线性系统基于学习的输出反馈控制
2
作者 刘思彤 高伟男 姜钟平 《自动化学报》 北大核心 2025年第10期2293-2301,共9页
针对具有输入时滞的非线性系统直接自适应最优控制问题,提出一种新的数据驱动输出反馈控制方法.该方法通过融合Q学习与值迭代和策略迭代,在学习过程中无需依赖系统动力学知识.在系统满足一致可观性的条件下,提出一种基于输出数据和带有... 针对具有输入时滞的非线性系统直接自适应最优控制问题,提出一种新的数据驱动输出反馈控制方法.该方法通过融合Q学习与值迭代和策略迭代,在学习过程中无需依赖系统动力学知识.在系统满足一致可观性的条件下,提出一种基于输出数据和带有时滞的输入数据的系统状态重构方法,基于值迭代和策略迭代来学习自适应最优控制策略.最后,将该方法应用于范德波尔振荡器这一经典非线性系统的控制,并通过仿真结果充分验证了该方法的有效性. 展开更多
关键词 最优控制 输出反馈 时滞 自适应动态规划
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部