检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

改进MADDPG算法的非凸环境下多智能体自组织协同围捕被引量：1: 1; 作者张红强石佳航 +5 位作者吴亮红王汐左词立陈祖国刘朝华陈磊《计算机科学与探索》 CSCD 北大核心 2024年第8期2080-2090,共11页; 针对多智能体在非凸环境下的围捕效率问题,提出基于改进经验回放的多智能体强化学习算法。利用残差网络(ResNet)来改善网络退化问题,并与多智能体深度确定性策略梯度算法(MADDPG)相结合,提出了RW-MADDPG算法。为解决多智能体在训练过程... 展开更多; 关键词深度强化学习 rw-maddpg 残差网络经验池围捕奖励函数; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	改进MADDPG算法的非凸环境下多智能体自组织协同围捕	张红强石佳航吴亮红王汐左词立陈祖国刘朝华陈磊	《计算机科学与探索》 CSCD 北大核心	2024	1	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析