检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于优先经验回放的多智能体协同算法被引量：5: 1; 作者黄子蓉甯彦淞王莉《太原理工大学学报》 CAS 北大核心 2021年第5期747-753,共7页; 针对多智能体协同训练中存在的经验缓存机制构建和回放问题,提出一种基于优先经验回放的多智能体协同算法(prioritized experience replayfor multi-agent cooperation,PEMAC)。该算法在MAAC(actor-attention-critic for multi-agent re... 展开更多; 关键词深度强化学习多智能体协同优先经验缓存回放 TD误差; 在线阅读下载PDF 职称材料

噪声干扰环境下的深度强化学习故障诊断方法: 2; 作者刘小峰徐全桂 +1 位作者金燕柏林《电子测量与仪器学报》 CSCD 北大核心 2024年第12期145-154,共10页; 针对深度强化学习在噪声干扰环境下故障诊断鲁棒性差问题,提出了一种噪声干扰环境自适应的强化学习故障诊断方法。该方法以高效通道注意力机制-深度残差收缩网络为Q网络基本模型,避免Q网络结构复杂导致的梯度消失现象。采用高效通道注... 展开更多; 关键词故障诊断深度残差网络阈值软化深度Q学习竞争网络经验优先回放; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部