检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于多重指数移动平均评估的DDPG算法被引量：1: 1; 作者范晶晶陈建平 +2 位作者傅启明陆悠吴宏杰《计算机工程与设计》北大核心 2021年第11期3084-3090,共7页; 针对深度确定性策略梯度算法中双网络结构的不稳定及单评论家评估不准确的问题,提出基于多重指数移动平均评估的DDPG算法。介绍EMA-Q网络和目标Q网络合作得出目标更新值,对多个评论家给出的Q值求平均,降低单评论家评估的不准确性。样本... 展开更多; 关键词深度学习强化学习指数移动平均平均评估双重经验回放; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于多重指数移动平均评估的DDPG算法	范晶晶陈建平傅启明陆悠吴宏杰	《计算机工程与设计》北大核心	2021	1	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析