期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于约束强化学习的综合能源系统优化调度研究
1
作者 李天明 王小君 +3 位作者 窦嘉铭 刘曌 司方远 和敬涵 《电力系统保护与控制》 北大核心 2025年第6期1-14,共14页
“双碳”目标下,分布式能源高比例渗透与异质能源耦合加剧迫使综合能源系统(integrated energy system,IES)优化调度问题的求解难度提升,深度强化学习为解决上述问题提供了有效手段。然而,传统深度强化学习通常将安全约束以惩罚项形式... “双碳”目标下,分布式能源高比例渗透与异质能源耦合加剧迫使综合能源系统(integrated energy system,IES)优化调度问题的求解难度提升,深度强化学习为解决上述问题提供了有效手段。然而,传统深度强化学习通常将安全约束以惩罚项形式加权添加至奖励函数,加权系数一般由人工确定且在迭代过程中保持固定,一定程度上影响了算法的收敛性能与约束处理能力。对此,提出一种基于约束强化学习的IES优化调度方法。首先,构建了基于IES机组运行与系统潮流约束的安全价值网络,并通过拉格朗日乘子与经济价值网络动态并行协同,分别评估智能体决策的安全与经济价值。其次,利用原始对偶的思路,交替更新智能体策略与拉格朗日乘子,以规避人工设置惩罚系数引起的主观偏差对IES调度决策的影响。同时,利用专家知识引导智能体开展训练,防止其盲目寻优造成算力浪费。最后,基于电-热耦合系统开展仿真算例对比分析,验证了所提方法的安全性与高效性。 展开更多
关键词 综合能源系统 优化调度 深度强化学习 约束强化学习
在线阅读 下载PDF
基于分层约束强化学习的综合能源多微网系统优化调度 被引量:16
2
作者 董雷 杨子民 +3 位作者 乔骥 陈盛 王新迎 蒲天骄 《电工技术学报》 EI CSCD 北大核心 2024年第5期1436-1453,共18页
构建多微网系统是消纳可再生能源、提升电网稳定性的有效方式。通过各微网的协调调度,可有效提升微网的运行效益以及可再生能源的消纳水平。现有多微网优化问题场景多元,变量众多,再加上源荷不确定性及多微网主体的数据隐私保护等问题,... 构建多微网系统是消纳可再生能源、提升电网稳定性的有效方式。通过各微网的协调调度,可有效提升微网的运行效益以及可再生能源的消纳水平。现有多微网优化问题场景多元,变量众多,再加上源荷不确定性及多微网主体的数据隐私保护等问题,为模型的高效求解带来了巨大挑战。为此,该文提出了一种分层约束强化学习优化方法。首先,构建了多微网分层强化学习优化框架,上层由智能体给出各微网储能优化策略和微网间功率交互策略;下层各微网以上层策略为约束,基于自身状态信息采用数学规划法对各微网内部的分布式电源出力进行自治优化。通过分层架构,减小通信压力,保护微网内部数据隐私,充分发挥强化学习对源荷不确定性的自适应能力,大幅提升了模型求解速度,并有效兼顾了数学规划法的求解精度。此外,将拉格朗日乘子法与传统强化学习方法相结合,提出一种约束强化学习求解方法,有效地解决了传统强化学习方法难以处理的约束越限问题。最后通过算例验证了该方法的有效性和优势。 展开更多
关键词 多微网系统 分层约束强化学习 不确定性 数据隐私保护
在线阅读 下载PDF
基于强化学习算法的水库优化调度研究 被引量:10
3
作者 胡鹤轩 尹苏明 +3 位作者 胡强 张晔 胡震云 义崇政 《水电能源科学》 北大核心 2022年第1期73-77,共5页
为解决复杂现实环境下的水库优化调度问题,采用强化学习的Q-learning算法,以哈希表作为核心数据结构,在逐幕生成水库可行调度方案的同时,单时段优化Q值,最终依据各时段的最优Q值生成水库最优调度方案。试验分析结果表明,当迭代次数达到... 为解决复杂现实环境下的水库优化调度问题,采用强化学习的Q-learning算法,以哈希表作为核心数据结构,在逐幕生成水库可行调度方案的同时,单时段优化Q值,最终依据各时段的最优Q值生成水库最优调度方案。试验分析结果表明,当迭代次数达到一定数量时,Q-learning算法能够达到理论上的最优解;依据水库调度历史数据建立最优搜索廊道,Q-learning算法可在缩短优化时间的同时获得高质量的解。 展开更多
关键词 水库优化调度 约束强化学习 Q-LEARNING 哈希表
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部