检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

分布式在线鞍点问题的Bandit反馈优化算法: 1; 作者张文韬张保勇 +1 位作者袁德明徐胜元《自动化学报》北大核心 2025年第4期857-874,共18页; 本文研究了多智能体时变网络上基于Bandit反馈的分布式在线鞍点问题,其中每个智能体通过本地计算和局部信息交流去协作最小化全局损失函数.在Bandit反馈下,包括梯度在内的损失函数信息是不可用的,每个智能体仅能获得和使用在某决策或其... 展开更多; 关键词 BANDIT 反馈分布式优化在线鞍点问题镜面下降动态鞍点遗憾; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	分布式在线鞍点问题的Bandit反馈优化算法	张文韬张保勇袁德明徐胜元	《自动化学报》北大核心	2025	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析