基于Spark和梯度提升树模型的短期负荷预测被引量：41

Short-term load forecasting based on Spark and gradient boosting decision tree model

导出

摘要利用Spark平台对电力用户侧的大数据进行分析,提出基于梯度提升树的并行负荷预测方法.首先对历史负荷和天气数据集进行并行化分割处理,并采用特征提取与转换方法获取到预测模型所需的特征向量;然后合理设定Spark集群节点数以及调节Hadoop分布式文件系统(HDFS)分块大小;最后将参数调优后的梯度提升树模型部署到Spark分布式平台上进行训练与预测,并将该模型预测结果与其他预测模型进行精度比较.研究结果表明:通过合理划分HDFS中存储块的大小能有效提高集群对于大数据处理的效率,分布式梯度提升树算法在快速性与准确性上均有比较大的优势,能够满足电力负荷预测的要求. A parallel load forecasting method based on gradient boosting decision tree was proposed and Spark platform was used to analyze big data of user-side.Firstly,the historical load and weather data set were parallelized and segmented,and the feature extraction and transformation methods were used to obtain the feature vector required by the prediction model.Then,the number of Spark cluster nodes and the HDFS(Hadoop distributed file system)block size were adjusted.Finally,the parameter-tuned gradient lifting tree model was deployed to the Spark distributed platform for training and prediction,and the model prediction results were compared with other prediction models.Research results show that the cluster processing efficiency for large data sets can be improved effectively by dividing the size of the storage block reasonably in HDFS.It is also demonstrated that the distributed gradient boosting decision tree algorithm has some advantages in rapidity and accuracy,which could meet requirements of the power load forecasting quite well.

作者许贤泽刘静施元谭盛煌 XU Xianze;LIU Jing;SHI Yuan;TAN Shenghuang(School of Electronic Information,Wuhan University,Wuhan 430072,China)

机构地区武汉大学电子信息学院

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2019年第5期84-89,共6页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金国家自然科学基金资助项目(51705375)

关键词负荷预测分布式计算大数据梯度提升树 Spark平台 load forecasting distributed computing big data gradient boosting decision tree Spark platform

分类号 TM715 [电气工程—电力系统及自动化] TP311.13 [自动化与计算机技术—计算机软件与理论]

作者简介许贤泽(1967-),男,教授,E-mail:xxz@whu.edu.cn.

引文网络
相关文献

参考文献8

1王德文,孙志伟.电力用户侧大数据分析与并行负荷预测[J].中国电机工程学报,2015,35(3):527-537. 被引量：277
2刘琪琛,雷景生,郝珈玮,黄燕刚,李强,罗海波.基于Spark平台和并行随机森林回归算法的短期电力负荷预测[J].电力建设,2017,38(10):84-92. 被引量：31
3宋易阳,李存斌,祁之强.基于云模型和模糊聚类的电力负荷模式提取方法[J].电网技术,2014,38(12):3378-3383. 被引量：55
4万昆,柳瑞禹.区间时间序列向量自回归模型在短期电力负荷预测中的应用[J].电网技术,2012,36(11):77-81. 被引量：91
5何耀耀,闻才喜,许启发,撖奥洋.考虑温度因素的中期电力负荷概率密度预测方法[J].电网技术,2015,39(1):176-181. 被引量：43
6胡俊,胡贤德,程家兴.基于Spark的大数据混合计算模型[J].计算机系统应用,2015,24(4):214-218. 被引量：57
7黄廷辉,王玉良,汪振,崔更申.基于Spark的分布式交通流数据预测系统[J].计算机应用研究,2018,35(2):405-409. 被引量：20
8马天男,牛东晓,黄雅莉,杜振东.基于Spark平台和多变量L_2-Boosting回归模型的分布式能源系统短期负荷预测[J].电网技术,2016,40(6):1642-1649. 被引量：34

二级参考文献117

1李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34. 被引量：925
2袁晓辉,王乘,张传勇,袁晓辉,袁艳斌.电力系统短期负荷预测方法的进展[J].电气自动化,2004,26(6):3-6. 被引量：6
3李钷,李敏,刘涤尘.基于改进回归法的电力负荷预测[J].电网技术,2006,30(1):99-104. 被引量：58
4栗然,刘宇,黎静华,顾雪平,牛东晓,刘永奇.基于改进决策树算法的日特征负荷预测研究[J].中国电机工程学报,2005,25(23):36-41. 被引量：30
5李培强,李欣然,陈辉华,唐外文.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,25(24):73-78. 被引量：133
6程瑜,张粒子.基于ARCH模型的电价联动建模研究[J].中国电机工程学报,2006,26(9):126-130. 被引量：17
7张前进.基于支持向量机回归的电力负荷预测研究[J].航空计算技术,2006,36(4):105-107. 被引量：10
8熊浩,李卫国,黄彦浩,张海峰,畅广辉.基于模糊粗糙集理论的综合数据挖掘方法在空间负荷预测中的应用[J].电网技术,2007,31(14):36-40. 被引量：13
9胡宗义,汪建均.基于ADL-GARCH的电价预测模型及其应用[J].湖南大学学报（自然科学版）,2007,34(8):37-40. 被引量：4
10张晓利,贺国光.基于主成分分析和组合神经网络的短时交通流预测方法[J].系统工程理论与实践,2007,27(8):167-171. 被引量：26

共引文献567

1邱臣铭,王群京,谢芳,钱喆.基于XGBoost的电动汽车用异步电机全工况及高精度的电流预测方法研究[J].中国电机工程学报,2020,40(S01):313-322. 被引量：6
2罗澍忻,麻敏华,蒋林,靳冰洁,林勇,刁旭昊,黎灿兵,杨波.考虑多时间尺度数据的中长期负荷预测方法[J].中国电机工程学报,2020,40(S01):11-19. 被引量：46
3张新阳,帅强,李伟.基于高阶矩模型的电力负荷预测研究[J].云南大学学报（自然科学版）,2020,42(S02):60-64. 被引量：1
4谢春,许伟.基于随机森林回归算法的锅炉沾污因数预测方法[J].上海电气技术,2022,15(1):29-32. 被引量：2
5俞伟,陈晨.基于大数据的配电网运行状态评估与预警[J].企业管理,2018,0(S01):410-411. 被引量：1
6Meiqin MAO,Shengliang ZHANG,Liuchen CHANG,Nikos D.HATZIARGYRIOU.Schedulable capacity forecasting for electric vehicles based on big data analysis[J].Journal of Modern Power Systems and Clean Energy,2019,7(6):1651-1662. 被引量：7
7席骊瑭,赵静,邓扶摇,温丽丽.大数据分析技术的应用[J].电子技术（上海）,2020(4):82-83.
8葛琼宇,王致杰.基于ISSA-ELM的短期电力负荷预测研究[J].国外电子测量技术,2022,41(4):119-125. 被引量：7
9姚栋方,吴瀛,罗磊,阎帅,武文广,丁宏.基于深度学习的短期电力负荷预测[J].国外电子测量技术,2020,39(1):44-48. 被引量：18
10李永毅,石蓉,郎锐,王开艳,贾嵘,杨海波.基于对数平均迪氏指数分解法的陕西省居民用电影响因素分析[J].电网与清洁能源,2019,35(6):40-45. 被引量：4

同被引文献313

1崇爱新,尹辉,刘艳婷,刘秀波,许宏丽.基于双目视觉的无缝线路钢轨纵向位移测量方法研究[J].仪器仪表学报,2019,40(11):82-89. 被引量：26
2段明明,杨捷,李沛霖.基于小波和径向基函数神经网络的电力负荷预测研究[J].云南大学学报（自然科学版）,2020,42(S02):18-25. 被引量：15
3车辉,邢慧芬,樊玉琦,郑淑丽.基于大数据的火灾智能预警系统[J].计算机系统应用,2020(10):120-126. 被引量：11
4陈明华,刘群英,张家枢,陈树恒,张昌华.基于XGBoost的电力系统暂态稳定预测方法[J].电网技术,2020,44(3):1026-1034. 被引量：58
5陈振宇,刘金波,李晨,季晓慧,李大鹏,黄运豪,狄方春,高兴宇,徐立中.基于LSTM与XGBoost组合模型的超短期电力负荷预测[J].电网技术,2020,44(2):614-620. 被引量：251
6吕海灿,王伟峰,赵兵,张毅,郭秋婷,胡伟.基于Wide&Deep-LSTM模型的短期台区负荷预测[J].电网技术,2020,44(2):428-436. 被引量：58
7任翔.混凝土桥塔温度场的时变分析及温度梯度模式研究[J].铁道标准设计,2012,32(6):40-45. 被引量：6
8王丽,刘会金,王陈.瞬时无功功率理论的研究综述[J].高电压技术,2006,32(2):98-100. 被引量：66
9徐得超,李亚楼,郭剑,于之虹,金丽.消去树理论及其在潮流计算中的应用[J].电网技术,2007,31(22):12-16. 被引量：13
10龚海鹏,宋华芬.基于小波包IRN网络的燃气轮机转子故障诊断[J].燃气轮机技术,2007,20(4):54-56. 被引量：1

引证文献41

1谢俭,陈毅波.变电站短期负荷在线预测模型分析[J].电子技术（上海）,2020(4):132-133.
2田贵平.企业内部审计发展新路刍议[J].企业之友,2000(2):26-27.
3王飞,辛海松.站用直流电源智能监测系统设计[J].新一代信息技术,2019,2(20):36-41.
4罗杰.基于SD模型的电力项目风险管理研究[J].新一代信息技术,2019,2(19):79-82.
5罗宁,高华,贺墨琳.基于神经网络的电力负荷预测方法研究[J].自动化与仪器仪表,2020,0(1):157-160. 被引量：11
6杜茗茗,韩大为,范利刚.泛在电力物联网中安全信息实时调度方法研究[J].信息技术,2020,44(3):104-108. 被引量：7
7王德真.基于流程组态的微电网系统多指标非线性控制建模研究[J].绥化学院学报,2020,40(3):157-160.
8高阳,李汐,华书蓓,李立伟,汪涛,于洋洋.基于智能电表数据的低电压电流优化算法[J].电子设计工程,2020,28(3):133-137. 被引量：2
9程雅梦,江明,马玉龙.基于元数据的电力客户流量数据实时监测设计[J].信息技术,2020,44(4):164-168. 被引量：2
10林密,李博,何书毅,陈龙,洪杰.基于扁平化管理模式的配电通信网管理及运维模式[J].微型电脑应用,2020,36(4):146-149. 被引量：5

二级引证文献232

1陆国路.输电线路在线监测技术研究[J].光源与照明,2023(4):162-164. 被引量：4
2董红军.长输管道网格化管理实现基础与实施设想[J].油气储运,2020,39(6):601-611. 被引量：21
3夏田,詹瑶,郭建斌.基于小波包和梯度提升决策树的轴承故障诊断[J].陕西科技大学学报,2020,38(5):144-149. 被引量：8
4张烁.高压电气设备检修试验中的问题及措施分析[J].中国设备工程,2021(2):70-71. 被引量：4
5李博,张焕域,林密,何书毅,张宇,刘小敏.多通信方式下的配电通信网融合管理信息模型[J].计算机系统应用,2021,30(5):298-303. 被引量：3
6杨晓刚,姚艳.数控铣削加工参数优选神经网络模型的研究[J].自动化与仪器仪表,2021(4):174-178.
7周骅森.柔性配电网功率调制技术研究[J].电力系统装备,2021(6):47-48.
8刘学艳.基于层次分析的建筑工程造价控制方法研究[J].建筑与装饰,2021(15):90-90.
9张福军.基于供应链的电力物资物流配送系统研究[J].中国科技投资,2021(7):14-15.
10牛耕.虚拟现实认知驱动下的实践类课程设计[J].电脑知识与技术,2021,17(13):136-137.

1谷云东,马冬芬,程红超.基于相似数据选取和改进梯度提升决策树的电力负荷预测[J].电力系统及其自动化学报,2019,31(5):64-69. 被引量：55
2侯明哲.内容营销:分布式平台大起底[J].企业家信息,2019,0(4):64-66.
3曾子晗,郑凤朝,伍瑞泽,苏雨婷,翁正瀚.基于历史负荷因子分析的短期负荷预测方法应用[J].低碳世界,2019,9(5):89-90. 被引量：1
4葛凯梁,许巍,叶佳青.电力用户侧大数据分析与并行负荷预测[J].电力系统装备,2018(6):180-181.
5黄天恩,郭庆来,孙宏斌,赵乃岩,王彬,郭文鑫.模型-数据混合驱动的电网安全特征选择和知识发现关键技术与工程应用[J].电力系统自动化,2019,43(1):95-101. 被引量：54
6孟凡煦,张琰骏.基于VMD和ELM的超短期负荷预测方法[J].国外电子测量技术,2019,38(1):24-28. 被引量：9
7李黄珍.聚焦服务创新,推动转型发展——论如何实现传统出版与数字出版的有效融合[J].科技传播,2019,11(11):178-179. 被引量：6
8潘琳.浅谈钢琴即兴伴奏的训练[J].福建歌声,2019,0(1):44-45.
9陈亮,刘晓东.基于深度ELM网络的电力变压器故障诊断[J].科学大众（科技创新）,2018,0(9):33-34.
10薛博召.Hadoop大数据架构技术研究[J].科学与信息化,2019,0(16):50-50.

华中科技大学学报（自然科学版）

2019年第5期

浏览历史

内容加载中请稍等...

基于Spark和梯度提升树模型的短期负荷预测被引量：41

参考文献8

二级参考文献117

共引文献567

同被引文献313

引证文献41

二级引证文献232

相关作者

相关机构

相关主题

浏览历史

基于Spark和梯度提升树模型的短期负荷预测 被引量：41

参考文献8

二级参考文献117

共引文献567

同被引文献313

引证文献41

二级引证文献232

相关作者

相关机构

相关主题

浏览历史

基于Spark和梯度提升树模型的短期负荷预测被引量：41