期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于图嵌入编码形态信息的非均匀多任务强化学习方法
1
作者
贺晓
王文学
《计算机应用研究》
CSCD
北大核心
2024年第4期1022-1028,共7页
传统强化学习方法存在效率低下、泛化性能差、策略模型不可迁移的问题。针对此问题,提出了一种非均匀多任务强化学习方法,通过学习多个强化任务提升效率和泛化性能,将智能体形态构建为图,利用图神经网络能处理任意连接和大小的图来解决...
传统强化学习方法存在效率低下、泛化性能差、策略模型不可迁移的问题。针对此问题,提出了一种非均匀多任务强化学习方法,通过学习多个强化任务提升效率和泛化性能,将智能体形态构建为图,利用图神经网络能处理任意连接和大小的图来解决状态和动作空间维度不同的非均匀任务,突破模型不可迁移的局限,充分发挥图神经网络天然地利用图结构归纳偏差的优点,实现了模型高效训练和泛化性能提升,并可快速迁移到新任务。多任务学习实验结果表明,与以往方法相比,该方法在多任务学习和迁移学习实验中均表现出更好的性能,在迁移学习实验中展现出更准确的知识迁移。通过引入图结构偏差,使该方法具备更高的效率和更好的迁移泛化性能。
展开更多
关键词
多任务强化学习
图神经网络
变分图自编码器
形态信息编码
迁移
学习
在线阅读
下载PDF
职称材料
融合电网运行场景聚类的多任务深度强化学习优化调度
被引量:
17
2
作者
邓柏荣
陈俊斌
+4 位作者
丁巧宜
潘振宁
余涛
王克英
侯佳萱
《电网技术》
EI
CSCD
北大核心
2023年第3期978-987,共10页
“双碳”目标和新型电力系统建设背景下,新能源的高渗透率接入导致电力系统随机性显著增大、运行方式的分布复杂多样,传统单任务深度强化学习难以自适应源荷两侧的高随机性,调度决策难以满足新型电力系统对风光消纳、功率平衡需求。为此...
“双碳”目标和新型电力系统建设背景下,新能源的高渗透率接入导致电力系统随机性显著增大、运行方式的分布复杂多样,传统单任务深度强化学习难以自适应源荷两侧的高随机性,调度决策难以满足新型电力系统对风光消纳、功率平衡需求。为此,该文提出融合电网运行场景聚类的多任务深度强化学习优化调度方法。该方法离线训练时利用空间聚类和决策树辨识海量调度运行数据的典型运行场景与重要特征,并构建甄别场景类别的多层感知机分类器;再依据场景类别建立和划分融合聚类多任务深度强化学习模型,从数据源到状态动作设计差异化训练各子任务学习器与模型;在线决策时利用分类器辨识有限运行数据的场景类别,调用模型快速求解实时调度任务,实现高随机场景下的多任务快速迁移学习,保证电力系统优化调度决策的最优性。该文通过算例验证了该方法的解的可行性与经济性。实验结果表明,融合电网运行场景聚类的多任务深度强化学习优化调度算法较单任务算法能够明显提升调度决策经济效益。
展开更多
关键词
数据驱动模式
场景聚类
多任务
深度
强化
学习
迁移
学习
优化调度
在线阅读
下载PDF
职称材料
题名
基于图嵌入编码形态信息的非均匀多任务强化学习方法
1
作者
贺晓
王文学
机构
中国科学院沈阳自动化研究所机器人学国家重点实验室
中国科学院机器人与智能制造创新研究院
中国科学院大学
出处
《计算机应用研究》
CSCD
北大核心
2024年第4期1022-1028,共7页
基金
国家自然科学基金资助项目(U1908215)
辽宁省“兴辽英才计划”资助项目(XLYC2002014)。
文摘
传统强化学习方法存在效率低下、泛化性能差、策略模型不可迁移的问题。针对此问题,提出了一种非均匀多任务强化学习方法,通过学习多个强化任务提升效率和泛化性能,将智能体形态构建为图,利用图神经网络能处理任意连接和大小的图来解决状态和动作空间维度不同的非均匀任务,突破模型不可迁移的局限,充分发挥图神经网络天然地利用图结构归纳偏差的优点,实现了模型高效训练和泛化性能提升,并可快速迁移到新任务。多任务学习实验结果表明,与以往方法相比,该方法在多任务学习和迁移学习实验中均表现出更好的性能,在迁移学习实验中展现出更准确的知识迁移。通过引入图结构偏差,使该方法具备更高的效率和更好的迁移泛化性能。
关键词
多任务强化学习
图神经网络
变分图自编码器
形态信息编码
迁移
学习
Keywords
multi-task reinforcement learning
graph neural network
variational graph autoencoder
morphology information encoding
transfer learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合电网运行场景聚类的多任务深度强化学习优化调度
被引量:
17
2
作者
邓柏荣
陈俊斌
丁巧宜
潘振宁
余涛
王克英
侯佳萱
机构
华南理工大学电力学院
广东省电网智能量测与先进计量企业重点实验室
南方电网数字电网研究院有限公司
出处
《电网技术》
EI
CSCD
北大核心
2023年第3期978-987,共10页
基金
国家自然科学基金项目(U2066212)
南方电网科技项目(670000KK52210021)。
文摘
“双碳”目标和新型电力系统建设背景下,新能源的高渗透率接入导致电力系统随机性显著增大、运行方式的分布复杂多样,传统单任务深度强化学习难以自适应源荷两侧的高随机性,调度决策难以满足新型电力系统对风光消纳、功率平衡需求。为此,该文提出融合电网运行场景聚类的多任务深度强化学习优化调度方法。该方法离线训练时利用空间聚类和决策树辨识海量调度运行数据的典型运行场景与重要特征,并构建甄别场景类别的多层感知机分类器;再依据场景类别建立和划分融合聚类多任务深度强化学习模型,从数据源到状态动作设计差异化训练各子任务学习器与模型;在线决策时利用分类器辨识有限运行数据的场景类别,调用模型快速求解实时调度任务,实现高随机场景下的多任务快速迁移学习,保证电力系统优化调度决策的最优性。该文通过算例验证了该方法的解的可行性与经济性。实验结果表明,融合电网运行场景聚类的多任务深度强化学习优化调度算法较单任务算法能够明显提升调度决策经济效益。
关键词
数据驱动模式
场景聚类
多任务
深度
强化
学习
迁移
学习
优化调度
Keywords
data-driven mode
scenario clustering
multi-task deep reinforcement learning
transfer learning
optimal dispatching
分类号
TM721 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于图嵌入编码形态信息的非均匀多任务强化学习方法
贺晓
王文学
《计算机应用研究》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
融合电网运行场景聚类的多任务深度强化学习优化调度
邓柏荣
陈俊斌
丁巧宜
潘振宁
余涛
王克英
侯佳萱
《电网技术》
EI
CSCD
北大核心
2023
17
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部