期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于优势函数分解多智能体深度强化学习的电力系统暂态稳定预防控制方法
1
作者
牛哲文
冀岳
+3 位作者
李柏堉
党志芳
武宇翔
韩肖清
《电网技术》
北大核心
2025年第6期2311-2321,I0035,I0036,共13页
传统暂态稳定预防控制方法求解复杂、运算时间长,难以满足现阶段新型电力系统预防控制的策略高准确性与实时性的要求。针对以上问题,提出了一种基于优势函数分解多智能体强化学习的电力系统暂态稳定预防控制方法。该方法以发电机调整总...
传统暂态稳定预防控制方法求解复杂、运算时间长,难以满足现阶段新型电力系统预防控制的策略高准确性与实时性的要求。针对以上问题,提出了一种基于优势函数分解多智能体强化学习的电力系统暂态稳定预防控制方法。该方法以发电机调整总量最小为目标,考虑电力系统暂态稳定运行的多种约束,将分散式资源调控问题转变为多智能体的分布式协同优化问题进行求解,分区独立地给出最优的暂态稳定预防控制动作。针对分区控制导致智能体观测视野受限而引发的优化方向混乱、收敛速度降低的问题,引入优势函数分解定理,提高单个智能体的全局观察能力,使其在接收局部区域信息的情况下,仍能够广泛地探索环境并在学习中较稳定地提升策略网络效果。此外,该文采用柔性动作-评价强化学习算法,引入最大熵的概念以进一步增强多智能体方法的鲁棒性和探索能力。最后,在IEEE 39节点系统与某省级电网系统中验证了所提方法在暂态稳定预防控制决策中的有效性。
展开更多
关键词
暂态稳定
预防控制
优势函数分解
深度学习
多智能体深度强化学习
在线阅读
下载PDF
职称材料
题名
基于优势函数分解多智能体深度强化学习的电力系统暂态稳定预防控制方法
1
作者
牛哲文
冀岳
李柏堉
党志芳
武宇翔
韩肖清
机构
煤电清洁控制教育部重点实验室(太原理工大学)
出处
《电网技术》
北大核心
2025年第6期2311-2321,I0035,I0036,共13页
基金
山西省自然科学基金青年项目(202203021212296)
煤电清洁智能控制教育部重点实验室开放基金(CICCE202413)。
文摘
传统暂态稳定预防控制方法求解复杂、运算时间长,难以满足现阶段新型电力系统预防控制的策略高准确性与实时性的要求。针对以上问题,提出了一种基于优势函数分解多智能体强化学习的电力系统暂态稳定预防控制方法。该方法以发电机调整总量最小为目标,考虑电力系统暂态稳定运行的多种约束,将分散式资源调控问题转变为多智能体的分布式协同优化问题进行求解,分区独立地给出最优的暂态稳定预防控制动作。针对分区控制导致智能体观测视野受限而引发的优化方向混乱、收敛速度降低的问题,引入优势函数分解定理,提高单个智能体的全局观察能力,使其在接收局部区域信息的情况下,仍能够广泛地探索环境并在学习中较稳定地提升策略网络效果。此外,该文采用柔性动作-评价强化学习算法,引入最大熵的概念以进一步增强多智能体方法的鲁棒性和探索能力。最后,在IEEE 39节点系统与某省级电网系统中验证了所提方法在暂态稳定预防控制决策中的有效性。
关键词
暂态稳定
预防控制
优势函数分解
深度学习
多智能体深度强化学习
Keywords
transient stability
preventive control
advantage decomposition
deep learning
multi-agent deep reinforcement learning
分类号
TM721 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于优势函数分解多智能体深度强化学习的电力系统暂态稳定预防控制方法
牛哲文
冀岳
李柏堉
党志芳
武宇翔
韩肖清
《电网技术》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部