期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于分布式自适应内模的多智能体系统协同最优输出调节
被引量:
1
1
作者
董昱辰
高伟男
姜钟平
《自动化学报》
北大核心
2025年第3期678-691,共14页
针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最...
针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最优控制器,实现多智能体系统的协同输出调节.考虑到跟随者只能访问领导者的估计值进行在线学习,对闭环系统的稳定性和学习算法的收敛性进行严格的理论分析,证明所学习的控制增益可以收敛到最优控制增益.仿真结果验证了所提控制方法的有效性.
展开更多
关键词
自适应动态规划
分布式自适应内模
强化学习
协同输出调节
多智能体系统
在线阅读
下载PDF
职称材料
带有输入时滞的非线性系统基于学习的输出反馈控制
2
作者
刘思彤
高伟男
姜钟平
《自动化学报》
北大核心
2025年第10期2293-2301,共9页
针对具有输入时滞的非线性系统直接自适应最优控制问题,提出一种新的数据驱动输出反馈控制方法.该方法通过融合Q学习与值迭代和策略迭代,在学习过程中无需依赖系统动力学知识.在系统满足一致可观性的条件下,提出一种基于输出数据和带有...
针对具有输入时滞的非线性系统直接自适应最优控制问题,提出一种新的数据驱动输出反馈控制方法.该方法通过融合Q学习与值迭代和策略迭代,在学习过程中无需依赖系统动力学知识.在系统满足一致可观性的条件下,提出一种基于输出数据和带有时滞的输入数据的系统状态重构方法,基于值迭代和策略迭代来学习自适应最优控制策略.最后,将该方法应用于范德波尔振荡器这一经典非线性系统的控制,并通过仿真结果充分验证了该方法的有效性.
展开更多
关键词
最优控制
输出反馈
时滞
自适应动态规划
在线阅读
下载PDF
职称材料
题名
基于分布式自适应内模的多智能体系统协同最优输出调节
被引量:
1
1
作者
董昱辰
高伟男
姜钟平
机构
东北
大学
流程工业综合自动化全国重点实验室
纽约大学坦登工程学院电子与计算机工程系
出处
《自动化学报》
北大核心
2025年第3期678-691,共14页
基金
国家自然科学基金(62373090)
国家重点研发计划(2024YFA1012702)资助。
文摘
针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最优控制器,实现多智能体系统的协同输出调节.考虑到跟随者只能访问领导者的估计值进行在线学习,对闭环系统的稳定性和学习算法的收敛性进行严格的理论分析,证明所学习的控制增益可以收敛到最优控制增益.仿真结果验证了所提控制方法的有效性.
关键词
自适应动态规划
分布式自适应内模
强化学习
协同输出调节
多智能体系统
Keywords
Adaptive dynamic programming
distributed adaptive internal model
reinforcement learning
cooperative output regulation
multi-agent systems
分类号
O224 [理学—运筹学与控制论]
TP18 [自动化与计算机技术—控制理论与控制工程]
TP13 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
带有输入时滞的非线性系统基于学习的输出反馈控制
2
作者
刘思彤
高伟男
姜钟平
机构
东北
大学
流程工业综合自动化全国重点实验室
纽约大学坦登工程学院电子与计算机工程系
出处
《自动化学报》
北大核心
2025年第10期2293-2301,共9页
基金
国家重点研发计划(2024YFA1012702)
国家自然科学基金(62373090,62521001)
辽宁省兴辽英才计划(XLYC2403177)资助。
文摘
针对具有输入时滞的非线性系统直接自适应最优控制问题,提出一种新的数据驱动输出反馈控制方法.该方法通过融合Q学习与值迭代和策略迭代,在学习过程中无需依赖系统动力学知识.在系统满足一致可观性的条件下,提出一种基于输出数据和带有时滞的输入数据的系统状态重构方法,基于值迭代和策略迭代来学习自适应最优控制策略.最后,将该方法应用于范德波尔振荡器这一经典非线性系统的控制,并通过仿真结果充分验证了该方法的有效性.
关键词
最优控制
输出反馈
时滞
自适应动态规划
Keywords
Optimal control
output-feedback
time-delay
adaptive dynamic programming
分类号
TP13 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于分布式自适应内模的多智能体系统协同最优输出调节
董昱辰
高伟男
姜钟平
《自动化学报》
北大核心
2025
1
在线阅读
下载PDF
职称材料
2
带有输入时滞的非线性系统基于学习的输出反馈控制
刘思彤
高伟男
姜钟平
《自动化学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部