期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于分布式自适应内模的多智能体系统协同最优输出调节
1
作者 董昱辰 高伟男 姜钟平 《自动化学报》 北大核心 2025年第3期678-691,共14页
针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最... 针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最优控制器,实现多智能体系统的协同输出调节.考虑到跟随者只能访问领导者的估计值进行在线学习,对闭环系统的稳定性和学习算法的收敛性进行严格的理论分析,证明所学习的控制增益可以收敛到最优控制增益.仿真结果验证了所提控制方法的有效性. 展开更多
关键词 自适应动态规划 分布式自适应内模 强化学习 协同输出调节 多智能体系统
在线阅读 下载PDF
带有输入时滞的非线性系统基于学习的输出反馈控制
2
作者 刘思彤 高伟男 姜钟平 《自动化学报》 北大核心 2025年第10期2293-2301,共9页
针对具有输入时滞的非线性系统直接自适应最优控制问题,提出一种新的数据驱动输出反馈控制方法.该方法通过融合Q学习与值迭代和策略迭代,在学习过程中无需依赖系统动力学知识.在系统满足一致可观性的条件下,提出一种基于输出数据和带有... 针对具有输入时滞的非线性系统直接自适应最优控制问题,提出一种新的数据驱动输出反馈控制方法.该方法通过融合Q学习与值迭代和策略迭代,在学习过程中无需依赖系统动力学知识.在系统满足一致可观性的条件下,提出一种基于输出数据和带有时滞的输入数据的系统状态重构方法,基于值迭代和策略迭代来学习自适应最优控制策略.最后,将该方法应用于范德波尔振荡器这一经典非线性系统的控制,并通过仿真结果充分验证了该方法的有效性. 展开更多
关键词 最优控制 输出反馈 时滞 自适应动态规划
在线阅读 下载PDF
时空行为视角下道路拥堵机制与策略研究——以上海翔殷路隧道为例 被引量:1
3
作者 胡杨 王德 +2 位作者 任熙元 陈子浩 张扬帆 《城市规划》 CSSCI CSCD 北大核心 2024年第8期55-66,共12页
城市道路拥堵是时间与空间交织形成的复杂问题。在城市空间格局基本定型的背景下,从往往被忽视的时间维度切入,有望提升城市运行效率并促进可持续发展。以上海翔殷路隧道为例,利用手机信令数据,从时空行为视角深入剖析道路拥堵的形成机... 城市道路拥堵是时间与空间交织形成的复杂问题。在城市空间格局基本定型的背景下,从往往被忽视的时间维度切入,有望提升城市运行效率并促进可持续发展。以上海翔殷路隧道为例,利用手机信令数据,从时空行为视角深入剖析道路拥堵的形成机制,并提出“因时因地”的缓堵策略。研究发现,人群活动产生的交通流在局部路段存在复杂的时空叠加和时空转换关系。多组不同出发地和目的地的交通流,经过时间和空间等效转换后发生流量叠加,且叠加后的总流量超过道路承载能力,从而形成拥堵高峰。针对这一问题,根据不同人群出行模式的时空特征,提出刚性错峰和弹性引导等差异化策略,通过多情景设定评估不同策略的优化潜力,为缓堵政策制定提供多情景参考。基于时空行为特征的分析方法和策略思路不仅为道路拥堵治理提供借鉴,也可推广应用于理解和解决城市中的其他复杂问题,为城市精细化管理和可持续发展提供新的思路。 展开更多
关键词 时空行为 交通拥堵 时空叠加 时空转换
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部