期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
具有反馈延迟分布式在线复合优化的动态遗憾性能
1
作者 侯瑞捷 李修贤 +2 位作者 易新蕾 洪奕光 谢立华 《自动化学报》 北大核心 2025年第4期835-856,共22页
研究分布式在线复合优化场景中的几种反馈延迟,包括梯度反馈、单点Bandit反馈和两点Bandit反馈.其中,每个智能体的局部目标函数由一个强凸光滑函数与一个凸的非光滑正则项组成.在分布式场景下,研究每个智能体具有不同时变延迟的场景.基... 研究分布式在线复合优化场景中的几种反馈延迟,包括梯度反馈、单点Bandit反馈和两点Bandit反馈.其中,每个智能体的局部目标函数由一个强凸光滑函数与一个凸的非光滑正则项组成.在分布式场景下,研究每个智能体具有不同时变延迟的场景.基于近端梯度下降算法,分别设计这三种延迟反馈的分布式在线复合优化算法,并且对动态遗憾上界进行分析.分析结果表示,延迟梯度反馈和延迟两点Bandit反馈的动态遗憾上界阶数在期望意义下相同,而延迟单点Bandit反馈的动态遗憾上界稍差于前两者.这表明,存在延迟时,两点Bandit反馈可以在期望意义下达到与梯度反馈相同阶数的动态遗憾上界,且在步长选择合适的情况下,三种反馈类型的平均延迟在动态遗憾上具有相同的阶数.最后通过仿真实验验证了算法的性能和理论分析结果. 展开更多
关键词 分布式在线优化 复合优化 反馈延迟 BANDIT 反馈 动态遗憾
在线阅读 下载PDF
面向智能电网信息安全与隐私保护的分布式经济调度算法研究
2
作者 张彦军 宋明曙 马晓磊 《电测与仪表》 北大核心 2025年第1期149-157,共9页
针对微电网中考虑隐私保护和梯度信息未知的分布式经济调度问题,提出了一种基于差分隐私机制和单点反馈的分布式在线经济调度算法。与现有忽略隐私保护的分布式经济调度算法不同,文章通过引入符合拉普拉斯分布的随机噪声对节点的状态进... 针对微电网中考虑隐私保护和梯度信息未知的分布式经济调度问题,提出了一种基于差分隐私机制和单点反馈的分布式在线经济调度算法。与现有忽略隐私保护的分布式经济调度算法不同,文章通过引入符合拉普拉斯分布的随机噪声对节点的状态进行扰动,有效的保护了节点的隐私信息。该算法基于单点反馈估计真实的梯度信息来指导决策变量的更新,避免了精确地梯度计算,适应于梯度信息不可用的场景。此外,文章将经济调度问题扩展到分布式在线框架中,适应于成本函数时变的场景。在所提出的算法下,经济调度问题能够以一种在线的方式被解决,且算法能够实现次线性遗憾O(√T),仿真结果验证了该算法的有效性。 展开更多
关键词 分布式在线优化 经济调度 差分隐私 微电网
在线阅读 下载PDF
基于边缘动态事件触发的在线分布式复合Bandit优化算法
3
作者 熊梦辉 杨春雨 +2 位作者 赵建国 张保勇 袁德明 《自动化学报》 2025年第8期1811-1828,共18页
研究带宽受限的非平衡有向多智能体网络环境下的在线分布式复合Bandit优化问题.该问题中每个智能体的局部目标函数具有复合结构:其一为梯度信息不可获取的时变损失函数,其二为具有特定结构的正则化项.为应对网络带宽的受限,设计具有控... 研究带宽受限的非平衡有向多智能体网络环境下的在线分布式复合Bandit优化问题.该问题中每个智能体的局部目标函数具有复合结构:其一为梯度信息不可获取的时变损失函数,其二为具有特定结构的正则化项.为应对网络带宽的受限,设计具有控制因子的边缘动态事件触发通信协议,以降低通信开销.同时,针对局部损失函数梯度信息难以获取的挑战,分别引入单点和两点梯度估计方法,以支撑损失函数梯度信息的获取.基于此,结合近端算子,分别设计仅要求加权邻接矩阵满足行随机性质的在线分布式复合单点和两点Bandit优化算法,并使用动态遗憾指标分析两种算法的收敛性.结果表明,在合理的假设和参数设定下,两种算法在期望意义下分别可获得O(K^(3/4)(1+P_(K)))和O(K^(1/2)(1+P_(K)))的动态遗憾上界,其中K是总迭代次数,P_(K)是路径变差度量.进一步,当P_(K)能够被提前估计时,两种算法分别可获得O(K^(3/4)√1+P_(K))和O(K^(1/2)√1+P_(K))的期望动态遗憾上界.最后,通过对在线分布式岭回归问题的仿真实验,验证了算法的收敛性以及理论结果的正确性. 展开更多
关键词 在线分布式优化 复合优化 动态事件触发通信 Bandit反馈 动态遗憾
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部