-
题名数据驱动自适应评判控制研究进展
- 1
-
-
作者
王鼎
赵明明
刘德荣
乔俊飞
宋世杰
-
机构
北京工业大学信息科学技术学院
计算智能与智能系统北京市重点实验室
智慧环保北京实验室
北京人工智能研究院
南方科技大学自动化与智能制造学院
西南交通大学智慧城市与交通学院
-
出处
《自动化学报》
北大核心
2025年第6期1170-1190,共21页
-
基金
国家自然科学基金(62222301,62473012,62021003)
国家科技重大专项(2021ZD0112302)资助。
-
文摘
最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法.通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法,ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展.然而,实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型,对最优控制器的设计提出挑战.近年来,具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注,它能够在不依赖动态模型的情况下,仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器,符合智能自动化的发展潮流.通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理,着重介绍了最新的研究进展,包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习,并涵盖数据学习范式、稳定性、收敛性以及最优性的分析.此外,为提高学习效率和控制性能,设计了一些改进的评判机制和效用函数.最后,以污水处理过程为背景,总结数据驱动ADP方法在实际工业系统中的应用效果和存在问题,并展望一些未来的研究方向.
-
关键词
自适应评判控制
自适应动态规划
数据驱动设计
在线Q学习
迭代Q学习
-
Keywords
Adaptive critic control
adaptive dynamic programming
data-driven design
online Q-learning
iterative Q-learning
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于多无人机协作通感一体化的隐蔽通信设计
- 2
-
-
作者
袁伟杰
伍军
时玉叶
-
机构
南方科技大学自动化与智能制造学院
-
出处
《雷达学报(中英文)》
北大核心
2025年第4期797-808,共12页
-
基金
国家自然科学基金(62471208)。
-
文摘
无人机隐蔽通信在实现可持续低空经济方面引起了相当大的关注。该文基于通感一体化(ISAC)框架,研究了多无人机协作隐蔽通信网络的系统策略和资源分配,其中多个无人机进行协作感知并在移动监管者(Willie)存在的情况下同时向多个地面用户(GUs)隐蔽传输下行信息。为了提高通信隐蔽性,无人机在干扰无人机(JUAV)模式和信息无人机(IUAV)模式之间自适应切换。为了应对Willie的移动性,采用基于无迹卡尔曼滤波的方法,利用从ISAC回波中提取的时延和多普勒频移来预测和跟踪Willie的位置。通过联合优化JUAV选择策略、IUAV-GU调度、通信/干扰功率分配,该文提出了一个实时公平性传输最大化问题。采用交替优化方法,将原始问题分解为一系列子问题,从而获得有效的次优解。仿真结果表明,所提出的方案能够准确跟踪Willie并有效保证下行隐蔽传输。
-
关键词
通感一体化
无人机
隐蔽通信
干扰选择
无迹卡尔曼滤波
-
Keywords
Integrated Sensing And Communication(ISAC)
Unmanned Aerial Vehicle(UAV)
Covert communication
Jammer selection
Unscented Kalman Filtering(UKF)
-
分类号
TN958
[电子电信—信号与信息处理]
-