-
题名考虑参数共享的深度强化学习双阶段分布式电源优化
- 1
-
-
作者
高放
姚浩天
高庆
殷林飞
蔡运翔
金岩
潘宇
-
机构
广西大学电气工程学院
北京航空航天大学杭州创新研究院
工业控制技术国家重点实验室(浙江大学)
-
出处
《中国电机工程学报》
北大核心
2025年第19期7493-7509,I0019,共18页
-
基金
国家重点研发计划项目(2022YFB3304700)
国家自然科学基金项目(62463001)
工业控制技术全国重点实验室开放课题(ICT2024B21)。
-
文摘
随着风光等可再生能源为主的分布式电源高比例接入,在解决分布式电源出力优化调度等问题时,系统拓扑频繁变化,给配电网的稳定运行与经济调度带来挑战。现有方法多适用于固定拓扑的系统,依赖精确模型,计算耗时,难以实现在线控制。现行基于深度强化学习的方法难以兼顾分布式训练和离散-连续混合动作空间。该文提出一种考虑参数共享的多智能体深度双阶段强化学习的分布式电源优化策略。首先,对整体问题纵向解耦,在第1阶段构建含分布式电源的动态配电网重构模型,利用混合整数二阶锥规划解得拓扑结果;然后,将配电网环境横向解耦为若干分区,在第2阶段以一天为周期,提出一种考虑参数共享的集中式训练-分布式执行框架,并融入优先经验回放机制的多智能体优先双延迟深度确定性策略梯度算法;将拓扑信息嵌入配电网环境中,通过潮流计算映射给智能体,以最小化网络有功损耗构建优化调度模型。算例分析表明所提算法考虑了配电网拓扑结构的变化,通过智能体间的策略与经验共享以及优先经验回放机制提高学习效率,降低训练难度,可以满足在线实时决策的效率要求,相比其他策略表现出更加优异的稳压减损控制效果。
-
关键词
深度强化学习
参数共享
动态重构
拓扑变化
分布式电源优化调度
-
Keywords
deep reinforcement learning
parameter sharing
dynamic reconfiguration
topological changes
distributed generation optimization scheduling
-
分类号
TM73
[电气工程—电力系统及自动化]
-