期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法
被引量:
7
1
作者
赵知劲
朱家晟
+1 位作者
叶学义
尚俊娜
《电子与信息学报》
EI
CSCD
北大核心
2022年第8期2814-2823,共10页
为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法。针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数。为...
为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法。针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数。为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架。该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题。采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率。仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性。
展开更多
关键词
异步组网
多智能体
深度强化
学习
集中式学习和分散式执行
模糊推理系统
在线阅读
下载PDF
职称材料
部分可观测条件下的策略迁移强化学习方法
2
作者
王忠禹
徐晓鹏
王东
《现代防御技术》
北大核心
2024年第2期63-71,共9页
针对多智能体强化学习算法在部分可观测条件下难以形成有效协同策略的问题,基于集中式训练与分散式执行范式(CTDE)提出一种策略迁移强化学习方法。该方法在全局观测下训练可以探索到良好协同策略的教师模块,在部分可观测条件下,学生模...
针对多智能体强化学习算法在部分可观测条件下难以形成有效协同策略的问题,基于集中式训练与分散式执行范式(CTDE)提出一种策略迁移强化学习方法。该方法在全局观测下训练可以探索到良好协同策略的教师模块,在部分可观测条件下,学生模块依据最大化累计回报的期望为目标函数在线训练的同时,利用策略蒸馏技术从教师模块进行策略迁移,并自适应调整教师策略对学生策略的影响比重。在多个地图场景中对所提出的方法进行仿真验证,实验结果表明部分可观测条件下学生模块的胜率高于所对比的基线算法的胜率。研究成果可以应用于多智能体合作任务,提升智能体在分散式执行时的协同性能。
展开更多
关键词
多智能体
强化
学习
部分观测
策略迁移
集中式
训练与
分散式
执行
在线阅读
下载PDF
职称材料
超常学生的压力及其调适(下)
3
作者
王泓
《现代特殊教育》
1998年第1期38-,42,共2页
首先要设置有利、合理的学习情境,尽量减少压力来源。虽然压力有时是客观环境的产物,在人力能为的情况下,我们可以努力减少它。目前,我国的超常学生以集中式或分散式教学为主。这两种各有其利弊。集中式教学使水平相当的学生聚集在同质...
首先要设置有利、合理的学习情境,尽量减少压力来源。虽然压力有时是客观环境的产物,在人力能为的情况下,我们可以努力减少它。目前,我国的超常学生以集中式或分散式教学为主。这两种各有其利弊。集中式教学使水平相当的学生聚集在同质集体中,学生的归属感较强烈。但学生的竞争压力更甚,而且教学内容和方式不可能完全兼顾每一个学生的资质和兴趣。
展开更多
关键词
超常学生
分散式
教学
压力来源
竞争压力
集中式
客观环境
学习
情境
超常生
教学内容
归属感
在线阅读
下载PDF
职称材料
题名
基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法
被引量:
7
1
作者
赵知劲
朱家晟
叶学义
尚俊娜
机构
中国电子科技集团第
杭州电子科技大学通信工程学院
出处
《电子与信息学报》
EI
CSCD
北大核心
2022年第8期2814-2823,共10页
基金
国家自然科学基金(U19B2016)。
文摘
为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法。针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数。为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架。该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题。采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率。仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性。
关键词
异步组网
多智能体
深度强化
学习
集中式学习和分散式执行
模糊推理系统
Keywords
Asynchronous network
Multi agent
Deep reinforcement learning
Centralized Training with Decentralized Execution(CTDE)
Fuzzy inference system
分类号
TN914 [电子电信—通信与信息系统]
TN973 [电子电信—信号与信息处理]
在线阅读
下载PDF
职称材料
题名
部分可观测条件下的策略迁移强化学习方法
2
作者
王忠禹
徐晓鹏
王东
机构
大连理工大学控制科学与工程学院
出处
《现代防御技术》
北大核心
2024年第2期63-71,共9页
基金
国家自然科学基金(61973050,62173061)。
文摘
针对多智能体强化学习算法在部分可观测条件下难以形成有效协同策略的问题,基于集中式训练与分散式执行范式(CTDE)提出一种策略迁移强化学习方法。该方法在全局观测下训练可以探索到良好协同策略的教师模块,在部分可观测条件下,学生模块依据最大化累计回报的期望为目标函数在线训练的同时,利用策略蒸馏技术从教师模块进行策略迁移,并自适应调整教师策略对学生策略的影响比重。在多个地图场景中对所提出的方法进行仿真验证,实验结果表明部分可观测条件下学生模块的胜率高于所对比的基线算法的胜率。研究成果可以应用于多智能体合作任务,提升智能体在分散式执行时的协同性能。
关键词
多智能体
强化
学习
部分观测
策略迁移
集中式
训练与
分散式
执行
Keywords
multi-agent
reinforcement learning
partial observation
policy transfer
centralized training and decentralized execution(CTDE)
分类号
V19 [航空宇航科学与技术—人机与环境工程]
TP391.9 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
超常学生的压力及其调适(下)
3
作者
王泓
出处
《现代特殊教育》
1998年第1期38-,42,共2页
文摘
首先要设置有利、合理的学习情境,尽量减少压力来源。虽然压力有时是客观环境的产物,在人力能为的情况下,我们可以努力减少它。目前,我国的超常学生以集中式或分散式教学为主。这两种各有其利弊。集中式教学使水平相当的学生聚集在同质集体中,学生的归属感较强烈。但学生的竞争压力更甚,而且教学内容和方式不可能完全兼顾每一个学生的资质和兴趣。
关键词
超常学生
分散式
教学
压力来源
竞争压力
集中式
客观环境
学习
情境
超常生
教学内容
归属感
分类号
G441 [哲学宗教—发展与教育心理学]
G763 [文化科学—特殊教育学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法
赵知劲
朱家晟
叶学义
尚俊娜
《电子与信息学报》
EI
CSCD
北大核心
2022
7
在线阅读
下载PDF
职称材料
2
部分可观测条件下的策略迁移强化学习方法
王忠禹
徐晓鹏
王东
《现代防御技术》
北大核心
2024
0
在线阅读
下载PDF
职称材料
3
超常学生的压力及其调适(下)
王泓
《现代特殊教育》
1998
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部