针对电力负荷数据中存在的不平衡小类样本导致负荷预测精度不高问题,提出一种基于K-means-SyMProD-PCA数据预处理及NPMA-LSSVM模型的电力负荷预测方法。通过改进的K均值(K-means)方法根据电力负荷特性对其进行预分类,并构建分类标签作...针对电力负荷数据中存在的不平衡小类样本导致负荷预测精度不高问题,提出一种基于K-means-SyMProD-PCA数据预处理及NPMA-LSSVM模型的电力负荷预测方法。通过改进的K均值(K-means)方法根据电力负荷特性对其进行预分类,并构建分类标签作为输入特征;针对电力负荷分类后的样本类别不平衡问题,采用基于概率分布合成小类样本(synthetic minority based on probabilistic distribution,SyMProD)方法扩充小类样本数据以平衡样本类别;为了消除具有重复信息的特征,基于主成分分析(principal component analysis,PCA)方法提取电力负荷主要特征;最后建立最小二乘支持向量机(least square support vector machine,LSSVM)电力负荷预测模型,采用非线性惯性因子和多项式变异的蜉蝣算法对模型参数进行优化,以提高负荷预测精度。分别采用第9届电工杯建模大赛数据和扬中市2015年1443家企业的用电量数据作为验证数据,结果表明,结合K-means-SyMProD-PCA负荷数据预处理,NPMA-LSSVM预测模型有效降低了电力负荷预测误差,能够较好地解决不平衡小类样本情况下的中短期电力负荷预测问题,具有一定的适用性。展开更多
针对中长期电力负荷序列噪声含量高、难以直接提取序列周期规律从而影响预测精度的问题,提出了一种基于完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)和奇异谱分析(sin...针对中长期电力负荷序列噪声含量高、难以直接提取序列周期规律从而影响预测精度的问题,提出了一种基于完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)和奇异谱分析(singular spectrum analysis,SSA)双重分解的双向长短时记忆网络(bidirectional long and short time memory,BiLSTM)预测模型。首先,采用CEEMDAN对历史负荷进行分解,以得到若干个周期规律更为清晰的子序列;再利用多尺度熵(multiscale entropy,MSE)计算所有子序列的复杂程度,根据不同时间尺度上的样本熵值将相似的子序列重构聚合;然后,利用SSA去噪的功能,对高度复杂的新序列进行二次分解,去除序列中的噪声并提取更为主要的规律,从而进一步提高中长序列预测精度;再将得到的最终一组子序列输入BiLSTM进行预测;最后,考虑到天气、节假日等外部因素对电力负荷的影响,提出了一种误差修正技术。选取了巴拿马某地区的用电负荷进行实验,实验结果表明,经过双重分解可以将均方根误差降低87.4%;预测未来一年的负荷序列时,采用的BiLSTM模型将拟合系数最高提高2.5%;所提出的误差修正技术可将均方根误差降低9.7%。展开更多
文摘针对电力负荷数据中存在的不平衡小类样本导致负荷预测精度不高问题,提出一种基于K-means-SyMProD-PCA数据预处理及NPMA-LSSVM模型的电力负荷预测方法。通过改进的K均值(K-means)方法根据电力负荷特性对其进行预分类,并构建分类标签作为输入特征;针对电力负荷分类后的样本类别不平衡问题,采用基于概率分布合成小类样本(synthetic minority based on probabilistic distribution,SyMProD)方法扩充小类样本数据以平衡样本类别;为了消除具有重复信息的特征,基于主成分分析(principal component analysis,PCA)方法提取电力负荷主要特征;最后建立最小二乘支持向量机(least square support vector machine,LSSVM)电力负荷预测模型,采用非线性惯性因子和多项式变异的蜉蝣算法对模型参数进行优化,以提高负荷预测精度。分别采用第9届电工杯建模大赛数据和扬中市2015年1443家企业的用电量数据作为验证数据,结果表明,结合K-means-SyMProD-PCA负荷数据预处理,NPMA-LSSVM预测模型有效降低了电力负荷预测误差,能够较好地解决不平衡小类样本情况下的中短期电力负荷预测问题,具有一定的适用性。
文摘针对中长期电力负荷序列噪声含量高、难以直接提取序列周期规律从而影响预测精度的问题,提出了一种基于完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)和奇异谱分析(singular spectrum analysis,SSA)双重分解的双向长短时记忆网络(bidirectional long and short time memory,BiLSTM)预测模型。首先,采用CEEMDAN对历史负荷进行分解,以得到若干个周期规律更为清晰的子序列;再利用多尺度熵(multiscale entropy,MSE)计算所有子序列的复杂程度,根据不同时间尺度上的样本熵值将相似的子序列重构聚合;然后,利用SSA去噪的功能,对高度复杂的新序列进行二次分解,去除序列中的噪声并提取更为主要的规律,从而进一步提高中长序列预测精度;再将得到的最终一组子序列输入BiLSTM进行预测;最后,考虑到天气、节假日等外部因素对电力负荷的影响,提出了一种误差修正技术。选取了巴拿马某地区的用电负荷进行实验,实验结果表明,经过双重分解可以将均方根误差降低87.4%;预测未来一年的负荷序列时,采用的BiLSTM模型将拟合系数最高提高2.5%;所提出的误差修正技术可将均方根误差降低9.7%。