期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法 被引量:7
1
作者 赵知劲 朱家晟 +1 位作者 叶学义 尚俊娜 《电子与信息学报》 EI CSCD 北大核心 2022年第8期2814-2823,共10页
为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法。针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数。为... 为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法。针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数。为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架。该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题。采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率。仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性。 展开更多
关键词 异步组网 多智能体 深度强化学习 集中式学习和分散式执行 模糊推理系统
在线阅读 下载PDF
部分可观测条件下的策略迁移强化学习方法
2
作者 王忠禹 徐晓鹏 王东 《现代防御技术》 北大核心 2024年第2期63-71,共9页
针对多智能体强化学习算法在部分可观测条件下难以形成有效协同策略的问题,基于集中式训练与分散式执行范式(CTDE)提出一种策略迁移强化学习方法。该方法在全局观测下训练可以探索到良好协同策略的教师模块,在部分可观测条件下,学生模... 针对多智能体强化学习算法在部分可观测条件下难以形成有效协同策略的问题,基于集中式训练与分散式执行范式(CTDE)提出一种策略迁移强化学习方法。该方法在全局观测下训练可以探索到良好协同策略的教师模块,在部分可观测条件下,学生模块依据最大化累计回报的期望为目标函数在线训练的同时,利用策略蒸馏技术从教师模块进行策略迁移,并自适应调整教师策略对学生策略的影响比重。在多个地图场景中对所提出的方法进行仿真验证,实验结果表明部分可观测条件下学生模块的胜率高于所对比的基线算法的胜率。研究成果可以应用于多智能体合作任务,提升智能体在分散式执行时的协同性能。 展开更多
关键词 多智能体 强化学习 部分观测 策略迁移 集中式训练与分散式执行
在线阅读 下载PDF
超常学生的压力及其调适(下)
3
作者 王泓 《现代特殊教育》 1998年第1期38-,42,共2页
首先要设置有利、合理的学习情境,尽量减少压力来源。虽然压力有时是客观环境的产物,在人力能为的情况下,我们可以努力减少它。目前,我国的超常学生以集中式或分散式教学为主。这两种各有其利弊。集中式教学使水平相当的学生聚集在同质... 首先要设置有利、合理的学习情境,尽量减少压力来源。虽然压力有时是客观环境的产物,在人力能为的情况下,我们可以努力减少它。目前,我国的超常学生以集中式或分散式教学为主。这两种各有其利弊。集中式教学使水平相当的学生聚集在同质集体中,学生的归属感较强烈。但学生的竞争压力更甚,而且教学内容和方式不可能完全兼顾每一个学生的资质和兴趣。 展开更多
关键词 超常学生 分散式教学 压力来源 竞争压力 集中式 客观环境 学习情境 超常生 教学内容 归属感
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部