-
题名具有反馈延迟分布式在线复合优化的动态遗憾性能
- 1
-
-
作者
侯瑞捷
李修贤
易新蕾
洪奕光
谢立华
-
机构
同济大学电子与信息工程学院控制科学与工程系
自主智能无人系统全国重点实验室
麻省理工学院信息与决策系统实验室
南洋理工大学电气与电子工程学院
-
出处
《自动化学报》
北大核心
2025年第4期835-856,共22页
-
基金
国家自然科学基金(62473292,62088101)
上海市科技重大专项(2021SHZDZX0100)资助。
-
文摘
研究分布式在线复合优化场景中的几种反馈延迟,包括梯度反馈、单点Bandit反馈和两点Bandit反馈.其中,每个智能体的局部目标函数由一个强凸光滑函数与一个凸的非光滑正则项组成.在分布式场景下,研究每个智能体具有不同时变延迟的场景.基于近端梯度下降算法,分别设计这三种延迟反馈的分布式在线复合优化算法,并且对动态遗憾上界进行分析.分析结果表示,延迟梯度反馈和延迟两点Bandit反馈的动态遗憾上界阶数在期望意义下相同,而延迟单点Bandit反馈的动态遗憾上界稍差于前两者.这表明,存在延迟时,两点Bandit反馈可以在期望意义下达到与梯度反馈相同阶数的动态遗憾上界,且在步长选择合适的情况下,三种反馈类型的平均延迟在动态遗憾上具有相同的阶数.最后通过仿真实验验证了算法的性能和理论分析结果.
-
关键词
分布式在线凸优化
复合优化
反馈延迟
BANDIT
反馈
动态遗憾
-
Keywords
Distributed online convex optimization
composite optimization
feedback delays
Bandit feedback
dynamic regret
-
分类号
O224
[理学—运筹学与控制论]
-