期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于优势柔性策略-评价算法和迁移学习的区域综合能源系统优化调度 被引量:10
1
作者 罗文健 张靖 +5 位作者 何宇 古庭赟 聂祥论 范璐钦 袁旭峰 李博文 《电网技术》 EI CSCD 北大核心 2023年第4期1601-1611,共11页
为提高清洁能源消纳率及减少碳排放对环境的污染,实现更具泛化能力、鲁棒性和高效性的区域综合能源系统优化调度,该文提出了基于优势柔性策略–评价(advantage learning soft actor-critic,ALSAC)算法和迁移学习的区域综合能源系统优化... 为提高清洁能源消纳率及减少碳排放对环境的污染,实现更具泛化能力、鲁棒性和高效性的区域综合能源系统优化调度,该文提出了基于优势柔性策略–评价(advantage learning soft actor-critic,ALSAC)算法和迁移学习的区域综合能源系统优化调度方法。利用环境信息与智能体进行通信交互,以低碳、经济为目标实现区域综合能源系统的优化调度。在文中分析了提升柔性策略–评价(soft actor-critic,SAC)鲁棒性的最大熵机制,并与基于策略梯度的多种深度强化学习算法和启发式算法进行了性能对比,随后将优势学习的思想引入SAC的Q值函数更新中,解决了算法对Q值的过估计问题,提升了算法的性能。为提高智能体的学习效率和应对新场景的泛化能力,加入了迁移学习的参数迁移。算例表明,基于ALSAC算法和迁移学习的优化调度策略具有较好的鲁棒性、泛化能力和高效的学习效率,实现区域综合能源系统的灵活高效调度。 展开更多
关键词 区域综合能源系统 深度强化学习 柔性策略-评价 迁移学习 优势学习
在线阅读 下载PDF
基于柔性策略-评价网络的微电网源储协同优化调度策略 被引量:25
2
作者 刘林鹏 朱建全 +1 位作者 陈嘉俊 叶汉芳 《电力自动化设备》 EI CSCD 北大核心 2022年第1期79-85,共7页
近年来,微电网中的可再生能源与储能占比不断增大,给其优化调度带来了新的挑战。针对微电网源储协同调度问题中非凸非线性约束带来的求解困难,利用深度强化学习算法构建基于数据的策略函数,通过不断地与环境进行交互学习寻找最优策略,... 近年来,微电网中的可再生能源与储能占比不断增大,给其优化调度带来了新的挑战。针对微电网源储协同调度问题中非凸非线性约束带来的求解困难,利用深度强化学习算法构建基于数据的策略函数,通过不断地与环境进行交互学习寻找最优策略,避免了对原非凸非线性问题的直接求解。考虑到训练过程中策略函数可能不满足安全约束,进一步提出了一种利用部分模型信息的微电网源储协同优化调度安全策略学习方法,得到了满足网络安全约束的优化策略。此外,针对强化学习的智能体在训练过程中与环境的交互耗时较长的问题,采用神经网络对环境进行建模以提高学习效率。 展开更多
关键词 微电网 可再生能源 储能 柔性策略-评价网络 强化学习 深度学习 安全约束
在线阅读 下载PDF
基于图深度强化学习的有源配电网故障恢复方法
3
作者 何小龙 高红均 +4 位作者 王仁浚 罗龙波 叶萌 黄媛 刘俊勇 《电网技术》 北大核心 2025年第10期4342-4352,I0090-I0094,共16页
配电网的拓扑结构变动频繁,负荷水平和分布式电源(distributed generator,DG)出力的不确定性使得运行场景愈加复杂多变。基于此,提出了一种基于图深度强化学习的有源配电网故障恢复方法。首先,考虑DG与负荷的时变性,构建起基于图注意力... 配电网的拓扑结构变动频繁,负荷水平和分布式电源(distributed generator,DG)出力的不确定性使得运行场景愈加复杂多变。基于此,提出了一种基于图深度强化学习的有源配电网故障恢复方法。首先,考虑DG与负荷的时变性,构建起基于图注意力网络(graph attention network,GAT)与柔性策略-评价(soft actor-critic,SAC)算法相结合的配电网故障恢复框架,介绍故障恢复方法及其算法原理。然后,建立面向配电网故障恢复的图深度强化学习模型,通过将GAT嵌入到SAC算法的前置神经网络来提高智能体对配电网运行状态和拓扑结构的感知能力,并创新性地引入无效动作掩盖机制以规避非法动作,通过智能体与环境进行交互,寻找最优开关动作控制策略,实现高渗透率DG接入下的故障恢复趋优学习。最后,在IEEE33节点和148节点算例进行验证,并与多种基线方法进行对比测试,所提方法可以实现最快毫秒级故障恢复,具有更加高效优越的恢复效果,在拓扑变动下的负荷供电率相较于基准模型提升了4%~5%。 展开更多
关键词 有源配电网 分布式电源 故障恢复 图注意力网络 柔性策略-评价 无效动作掩盖
在线阅读 下载PDF
基于多智能体强化学习的差异化产销者参与社区能源交易方法
4
作者 梁泽庭 郑杰辉 +2 位作者 方家琨 李志刚 吴青华 《电网技术》 北大核心 2025年第5期1826-1836,I0016,I0017,共13页
考虑到新型电力系统中产消者特征各异,产消者对能源交易中的隐私性高度重视以及传统基于模型的优化方法在多重不确定性环境下的局限性,该文提出一种面向社区能源交易考虑特征差异和隐私保护的多智能体强化学习方法。首先,分析不同产消... 考虑到新型电力系统中产消者特征各异,产消者对能源交易中的隐私性高度重视以及传统基于模型的优化方法在多重不确定性环境下的局限性,该文提出一种面向社区能源交易考虑特征差异和隐私保护的多智能体强化学习方法。首先,分析不同产消者的地理位置、分布式资源种类和主体类型等特征差异,建立相应的典型产消者模型;其次,以社区型市场结构为基础,构建基于市场中端费率定价的社区能源交易模型;最后,以市场收益和运行成本为优化目标,将产消者参与社区能源交易的能源交易优化问题构建成部分可观测马尔可夫决策过程。针对储能的荷电状态循环约束引入的稀疏奖励问题,该文提出采用基于余弦距离的动态奖励整形对奖励函数进行改进。针对其中的多智能体环境非平稳性问题,该文提出采用平均场近似机制对柔性策略-评价算法的Q函数进行近似,并采用该算法求解得到产消者的能量管理决策。通过算例验证,所提算法解决考虑特征差异和隐私保护的能源交易问题能够提高1.39%~54.32%的训练效率和降低0.46%~50.34%的平均累积日成本。 展开更多
关键词 社区能源交易 特征差异 隐私保护 强化学习 柔性策略-评价算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部