检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于不确定度的多智能体信用分配方法: 1; 作者杨光开陈皓 +2 位作者张茗奕尹奇跃黄凯奇《中国科学院大学学报（中英文）》 CAS CSCD 北大核心 2024年第2期231-240,共10页; 近年来,部分可观测条件下多智能体协同受到广泛关注。中心化训练分布式执行作为处理这类任务的通用范式面临信用分配这一核心问题。值分解是该范式中的代表性方法,通过混合网络将联合状态动作值函数分解为多个局部观察动作值函数以实现... 展开更多; 关键词多智能体协同深度强化学习信用分配贝叶斯超网络; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于不确定度的多智能体信用分配方法	杨光开陈皓张茗奕尹奇跃黄凯奇	《中国科学院大学学报（中英文）》 CAS CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析