期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于组稀疏优化的强化学习稀疏表征
被引量:
1
1
作者
蔡林逸
冯翔
虞慧群
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2024年第6期913-919,共7页
强化学习由于具有出色的数据效率和快速学习的能力,开始应用于许多实际问题以学习复杂策略。但是高维环境中的强化学习常常受限于维度灾难或者灾难性干扰,性能表现不佳甚至导致学习失败。围绕表征学习,提出了一种符合Lasso类型优化的稀...
强化学习由于具有出色的数据效率和快速学习的能力,开始应用于许多实际问题以学习复杂策略。但是高维环境中的强化学习常常受限于维度灾难或者灾难性干扰,性能表现不佳甚至导致学习失败。围绕表征学习,提出了一种符合Lasso类型优化的稀疏卷积深度强化学习方法。首先,对稀疏表征的理论和优势进行综述,将稀疏卷积方法引入深度强化学习中,提出了一种新的稀疏表征方法;其次,对由稀疏卷积编码定义的可微优化层进行了数学推导并给出了优化算法,为了验证新的稀疏表征方法的有效性,将其应用于相关文献常见的基准环境中进行测试。实验结果表明,应用稀疏卷积编码的算法具有更好的性能和鲁棒性,在降低了50%以上模型开销的前提下,取得了相当甚至更优的性能。此外,还研究了稀疏程度对算法性能的影响,结果显示适当的稀疏度能获得更优的性能。
展开更多
关键词
强化学习
灾难性干扰
稀疏表征
隐式层
Lasso优化
在线阅读
下载PDF
职称材料
题名
基于组稀疏优化的强化学习稀疏表征
被引量:
1
1
作者
蔡林逸
冯翔
虞慧群
机构
华东理工大学计算机科学与工程系
上海智慧能源工程技术研究中心
出处
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2024年第6期913-919,共7页
基金
国家自然科学基金面上项目(62276097,62372174)
国家自然科学基金重点项目(62136003)
+2 种基金
国家重点研发计划(2020YFB1711700)
上海市经信委“信息化发展专项资金”(XX-XXFZ-02-20-2463)
上海市科技创新行动计划(21002411000)。
文摘
强化学习由于具有出色的数据效率和快速学习的能力,开始应用于许多实际问题以学习复杂策略。但是高维环境中的强化学习常常受限于维度灾难或者灾难性干扰,性能表现不佳甚至导致学习失败。围绕表征学习,提出了一种符合Lasso类型优化的稀疏卷积深度强化学习方法。首先,对稀疏表征的理论和优势进行综述,将稀疏卷积方法引入深度强化学习中,提出了一种新的稀疏表征方法;其次,对由稀疏卷积编码定义的可微优化层进行了数学推导并给出了优化算法,为了验证新的稀疏表征方法的有效性,将其应用于相关文献常见的基准环境中进行测试。实验结果表明,应用稀疏卷积编码的算法具有更好的性能和鲁棒性,在降低了50%以上模型开销的前提下,取得了相当甚至更优的性能。此外,还研究了稀疏程度对算法性能的影响,结果显示适当的稀疏度能获得更优的性能。
关键词
强化学习
灾难性干扰
稀疏表征
隐式层
Lasso优化
Keywords
reinforcement learning
catastrophic interference
sparse representation
implicit layer
Lasso optimization
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于组稀疏优化的强化学习稀疏表征
蔡林逸
冯翔
虞慧群
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部