检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于平均场内生奖励的多智能体强化学习算法: 1; 作者孙文绮李大鹏 +1 位作者田峰丁良辉《无线电通信技术》 2023年第3期556-565,共10页; 针对复杂的多智能体应用场景中只依靠根据最终目标设计的简单奖励函数无法对智能体学习策略做出有效引导的问题,提出了一种基于平均场内生奖励的多智能体强化学习(Model-based Multi-agent Mean-field Intrinsic Reward Upper Confidenc... 展开更多; 关键词多智能体系统平均场控制基于模型的强化学习内生奖励; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于平均场内生奖励的多智能体强化学习算法	孙文绮李大鹏田峰丁良辉	《无线电通信技术》	2023	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析