期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于专家知识嵌入强化学习的配电系统灾后恢复决策方法
1
作者
萧文聪
陈俊斌
+3 位作者
余涛
潘振宁
吴毓峰
罗庆全
《电力系统自动化》
北大核心
2025年第12期91-100,共10页
安全、高效的配电系统恢复(DSR)决策方法对于提升配电系统的韧性具有重大意义。传统的混合整数规划方法依赖于精准数学模型,且求解时间较长,难以在线应用。尽管深度强化学习具有不依赖于建模和决策效率高等优点,但面对DSR问题时仍面临...
安全、高效的配电系统恢复(DSR)决策方法对于提升配电系统的韧性具有重大意义。传统的混合整数规划方法依赖于精准数学模型,且求解时间较长,难以在线应用。尽管深度强化学习具有不依赖于建模和决策效率高等优点,但面对DSR问题时仍面临寻优空间巨大、安全性难以保证等挑战。针对上述问题,提出了一种基于专家知识嵌入强化学习的配电系统灾后恢复决策方法,专家知识包括专家经验知识与专家机理知识。首先,提出基于专家示范的值函数预训练技术,利用专家经验知识为智能体提供较好的初始寻优点。其次,提出结合专家示范的多重优先经验回放技术,避免智能体遗忘专家知识。最后,提出基于专家机理知识的无效动作屏蔽技术,有效缩减寻优空间,同时确保生成动作满足辐射状运行等安全约束。改进的IEEE 37节点算例和中国南方某区域的配电系统362节点算例分析表明,所提方法能够快速收敛,生成满足安全约束的接近最优解的供电恢复决策方案,同时决策效率满足实际DSR决策的要求。
展开更多
关键词
配电系统
灾后恢复
韧性
深度强化学习
专家知识
无效动作屏蔽
在线阅读
下载PDF
职称材料
题名
基于专家知识嵌入强化学习的配电系统灾后恢复决策方法
1
作者
萧文聪
陈俊斌
余涛
潘振宁
吴毓峰
罗庆全
机构
华南理工大学电力学院
汕头大学工学院
出处
《电力系统自动化》
北大核心
2025年第12期91-100,共10页
基金
国家自然科学基金企业创新发展联合基金资助项目(U24B6010)
国家自然科学基金资助项目(52207105)
广东省基础与应用基础研究基金资助项目(2025A1515010118)。
文摘
安全、高效的配电系统恢复(DSR)决策方法对于提升配电系统的韧性具有重大意义。传统的混合整数规划方法依赖于精准数学模型,且求解时间较长,难以在线应用。尽管深度强化学习具有不依赖于建模和决策效率高等优点,但面对DSR问题时仍面临寻优空间巨大、安全性难以保证等挑战。针对上述问题,提出了一种基于专家知识嵌入强化学习的配电系统灾后恢复决策方法,专家知识包括专家经验知识与专家机理知识。首先,提出基于专家示范的值函数预训练技术,利用专家经验知识为智能体提供较好的初始寻优点。其次,提出结合专家示范的多重优先经验回放技术,避免智能体遗忘专家知识。最后,提出基于专家机理知识的无效动作屏蔽技术,有效缩减寻优空间,同时确保生成动作满足辐射状运行等安全约束。改进的IEEE 37节点算例和中国南方某区域的配电系统362节点算例分析表明,所提方法能够快速收敛,生成满足安全约束的接近最优解的供电恢复决策方案,同时决策效率满足实际DSR决策的要求。
关键词
配电系统
灾后恢复
韧性
深度强化学习
专家知识
无效动作屏蔽
Keywords
distribution system
post-disaster restoration
resilience
deep reinforcement learning
expert knowledge
invalid action masking
分类号
TM73 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于专家知识嵌入强化学习的配电系统灾后恢复决策方法
萧文聪
陈俊斌
余涛
潘振宁
吴毓峰
罗庆全
《电力系统自动化》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部