期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于多智能体迁移强化学习算法的电力系统最优碳–能复合流求解 被引量:23
1
作者 陈艺璇 张孝顺 +1 位作者 郭乐欣 余涛 《高电压技术》 EI CAS CSCD 北大核心 2019年第3期863-872,共10页
为避免碳排放责任的重复计算,首次在电力系统最优碳–能复合流模型中提出发电侧、电网侧、用户侧之间的碳排放责任分摊机制。并进一步提出一种全新的多智能体迁移强化学习算法,以实现电力系统最优碳–能复合流模型的快速、高质量求解。... 为避免碳排放责任的重复计算,首次在电力系统最优碳–能复合流模型中提出发电侧、电网侧、用户侧之间的碳排放责任分摊机制。并进一步提出一种全新的多智能体迁移强化学习算法,以实现电力系统最优碳–能复合流模型的快速、高质量求解。此算法同时组织多个智能体执行优化任务,并将知识学习机制、多智能体交互机制和知识迁移机制相结合,不仅使每个智能体都具有较强的自主学习能力,还通过多个智能体之间的协调实现了问题的合作求解;知识迁移可以复用历史任务学习经验,使新任务学习效率大幅提升。IEEE 57节点系统、IEEE 300节点系统及深圳电网模型仿真结果均表明,此算法在保证最优解质量和寻优稳定性的同时,收敛速度可达其他算法的4.7~50.5倍,具有明显的优势和实用价值。 展开更多
关键词 多智能体迁移强化学习算法 碳-能复合流 碳排放责任分摊 迁移学习 强化学习
在线阅读 下载PDF
基于可迁移强化学习的断面输电极限计算方法 被引量:2
2
作者 李康文 邱高 +3 位作者 刘挺坚 刘友波 刘俊勇 丁理杰 《电网技术》 EI CSCD 北大核心 2023年第12期5147-5157,共11页
断面输电极限是电网安全边界在断面割集的降维投影,其实质是考虑电压无功优化和多类稳定约束的复杂混合整数非凸非线性问题,而新能源的引入进一步扩大了其计算维度,传统方法难以求解。为此,提出一种基于可迁移强化学习的断面输电极限计... 断面输电极限是电网安全边界在断面割集的降维投影,其实质是考虑电压无功优化和多类稳定约束的复杂混合整数非凸非线性问题,而新能源的引入进一步扩大了其计算维度,传统方法难以求解。为此,提出一种基于可迁移强化学习的断面输电极限计算方法。首先,考虑暂态功角及电压稳定约束,计及包括电容器组等无功资源,建立含微分代数方程的输电极限混合整数计算模型;然后,将该模型转化为混合整数的马尔科夫决策过程,提出基于混合Categorical分布的近端策略优化求解方法;最后,引入策略分布熵最大化目标,确保智能计算模型在未见运行方式下的迁移能力,实现运行方式或边界条件切换下的输电极限快速分析。IEEE39节点系统的算例结果表明,相比传统元启发式黑盒优化算法,所提方法在几乎不牺牲精度的前提下效率提升了97.15%。 展开更多
关键词 输电极限 无功优化 迁移强化学习 近端策略优化 策略分布熵
在线阅读 下载PDF
多智能体编队控制中的迁移强化学习算法研究 被引量:1
3
作者 胡鹏林 潘泉 +1 位作者 郭亚宁 赵春晖 《西北工业大学学报》 EI CAS CSCD 北大核心 2023年第2期389-399,共11页
针对多障碍环境下的多智能体系统协同编队避障与防撞问题,提出一种迁移学习与强化学习相结合的编队控制算法。在源任务学习阶段,利用值函数近似方法避免Q-表格求解法所需的大规模存储空间问题,有效降低对存储空间的需求,提升算法求解速... 针对多障碍环境下的多智能体系统协同编队避障与防撞问题,提出一种迁移学习与强化学习相结合的编队控制算法。在源任务学习阶段,利用值函数近似方法避免Q-表格求解法所需的大规模存储空间问题,有效降低对存储空间的需求,提升算法求解速度;在目标任务学习阶段,采用高斯聚类算法对源任务进行分类,根据聚类中心和目标任务之间的距离,选择最优的源任务类进行目标任务学习,有效避免了负迁移现象,进而提升了强化学习算法的泛化能力及收敛速度。仿真实验结果表明,所提方法能使多智能体系统在复杂的障碍环境下有效地形成并保持编队构型,同时实现避障与防撞。 展开更多
关键词 多智能体系统 迁移强化学习 值函数近似 编队控制 高斯聚类
在线阅读 下载PDF
基于分布式深度强化学习的微网群有功无功协调优化调度 被引量:13
4
作者 巨云涛 陈希 +1 位作者 李嘉伟 王杰 《电力系统自动化》 EI CSCD 北大核心 2023年第1期115-125,共11页
针对微网群的分布式有功无功协调优化调度问题,提出一种分布式多智能体深度强化学习方法,可训练智能体在与环境交互的过程中学习到最优调度策略,并克服传统优化方法对模型的依赖。相较于已有基于“集中训练”框架的多智能体深度强化学... 针对微网群的分布式有功无功协调优化调度问题,提出一种分布式多智能体深度强化学习方法,可训练智能体在与环境交互的过程中学习到最优调度策略,并克服传统优化方法对模型的依赖。相较于已有基于“集中训练”框架的多智能体深度强化学习方法,该方法无须收集全局信息,能够更好地保障各子微网信息的隐私,减轻通信压力,并且在训练和执行阶段均表现出对通信故障的鲁棒性。此外,考虑到微网群存在拓扑变化而强化学习模型泛化能力差,提出一种迁移强化学习方法,利用已有智能体知识为每种拓扑高效训练一组智能体。最后,通过改进的IEEE 33节点系统算例,验证了所提方法在解决微网群分布式有功无功协调优化调度问题上的有效性。 展开更多
关键词 微网群 有功无功协调调度 多智能体 深度强化学习 迁移强化学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部