期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于专家知识嵌入强化学习的配电系统灾后恢复决策方法
1
作者 萧文聪 陈俊斌 +3 位作者 余涛 潘振宁 吴毓峰 罗庆全 《电力系统自动化》 北大核心 2025年第12期91-100,共10页
安全、高效的配电系统恢复(DSR)决策方法对于提升配电系统的韧性具有重大意义。传统的混合整数规划方法依赖于精准数学模型,且求解时间较长,难以在线应用。尽管深度强化学习具有不依赖于建模和决策效率高等优点,但面对DSR问题时仍面临... 安全、高效的配电系统恢复(DSR)决策方法对于提升配电系统的韧性具有重大意义。传统的混合整数规划方法依赖于精准数学模型,且求解时间较长,难以在线应用。尽管深度强化学习具有不依赖于建模和决策效率高等优点,但面对DSR问题时仍面临寻优空间巨大、安全性难以保证等挑战。针对上述问题,提出了一种基于专家知识嵌入强化学习的配电系统灾后恢复决策方法,专家知识包括专家经验知识与专家机理知识。首先,提出基于专家示范的值函数预训练技术,利用专家经验知识为智能体提供较好的初始寻优点。其次,提出结合专家示范的多重优先经验回放技术,避免智能体遗忘专家知识。最后,提出基于专家机理知识的无效动作屏蔽技术,有效缩减寻优空间,同时确保生成动作满足辐射状运行等安全约束。改进的IEEE 37节点算例和中国南方某区域的配电系统362节点算例分析表明,所提方法能够快速收敛,生成满足安全约束的接近最优解的供电恢复决策方案,同时决策效率满足实际DSR决策的要求。 展开更多
关键词 配电系统 灾后恢复 韧性 深度强化学习 专家知识 无效动作屏蔽
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部