为解决光伏序列的强噪音干扰以及单一模型在光伏功率预测方面精度偏低和泛化性较差的问题,提出了一种基于特征优化和混合改进灰狼算法优化双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)的短期光伏功率预测方法。首...为解决光伏序列的强噪音干扰以及单一模型在光伏功率预测方面精度偏低和泛化性较差的问题,提出了一种基于特征优化和混合改进灰狼算法优化双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)的短期光伏功率预测方法。首先,运用互信息算法进行输入数据的变量选择,以消除冗余变量。其次,通过互补集合经验模态分解和改进的小波阈值算法对筛选后的数据进行特征重构,旨在降低数据中的噪声干扰并完成输入变量的特征优化。随后,结合改进的Tent混沌映射、非线性递减因子、动态权重策略和差分进化算法对标准灰狼优化算法进行混合优化,以确定双向长短期记忆神经网络的最优超参数组合,并引入注意力机制以挖掘数据中的关键时序信息,最终构建出一种新型的短期光伏功率预测模型。仿真实验表明,相较于最小二乘支持向量机、长短期记忆网络和双向长短期记忆网络,所提模型在晴天、多云、阴天和降雨等不同工况下的均方根误差平均分别降低了12.45%、7.95%和5.37%,显示出优秀的预测性能、良好的泛化能力和潜在的工程应用价值。展开更多
随机森林算法是根据Bagging抽样和随机特征子集划分策略,由多棵决策树组成的集成算法。与其他分类算法相比,随机森林算法有更高的分类精度、更低的泛化误差以及训练速度快等特点,因此在数据挖掘领域得到了多方面的应用。然而随机森林算...随机森林算法是根据Bagging抽样和随机特征子集划分策略,由多棵决策树组成的集成算法。与其他分类算法相比,随机森林算法有更高的分类精度、更低的泛化误差以及训练速度快等特点,因此在数据挖掘领域得到了多方面的应用。然而随机森林算法在分类预测特征维度高且不平衡的数据时,分类性能受到了极大限制。为了更好地处理高维不平衡数据,文中提出了一种基于混合采样和特征选择的改进随机森林算法(Hybrid Samping&Feature Selection Random Forest,HF_RF)。该算法首先从数据层面出发,通过SMOTE算法和随机欠采样相结合的方式对高维不平衡数据集进行预处理,同时引入聚类算法对SMOTE算法进行改进,提高对负类样本的处理性能;然后从算法层面出发,通过ReliefF算法对平衡后的高维数据赋予不同的权值,剔除不相关和冗余特征,对高维数据进行维度约简;最后采用加权投票原则进一步提高算法的分类性能。实验结果显示,改进后的算法与原算法相比,在处理高维不平衡数据方面的各评价指标更高,证明HF_RF算法对于高维不平衡数据的分类性能高于传统随机森林算法。展开更多
文摘为解决光伏序列的强噪音干扰以及单一模型在光伏功率预测方面精度偏低和泛化性较差的问题,提出了一种基于特征优化和混合改进灰狼算法优化双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)的短期光伏功率预测方法。首先,运用互信息算法进行输入数据的变量选择,以消除冗余变量。其次,通过互补集合经验模态分解和改进的小波阈值算法对筛选后的数据进行特征重构,旨在降低数据中的噪声干扰并完成输入变量的特征优化。随后,结合改进的Tent混沌映射、非线性递减因子、动态权重策略和差分进化算法对标准灰狼优化算法进行混合优化,以确定双向长短期记忆神经网络的最优超参数组合,并引入注意力机制以挖掘数据中的关键时序信息,最终构建出一种新型的短期光伏功率预测模型。仿真实验表明,相较于最小二乘支持向量机、长短期记忆网络和双向长短期记忆网络,所提模型在晴天、多云、阴天和降雨等不同工况下的均方根误差平均分别降低了12.45%、7.95%和5.37%,显示出优秀的预测性能、良好的泛化能力和潜在的工程应用价值。
文摘随机森林算法是根据Bagging抽样和随机特征子集划分策略,由多棵决策树组成的集成算法。与其他分类算法相比,随机森林算法有更高的分类精度、更低的泛化误差以及训练速度快等特点,因此在数据挖掘领域得到了多方面的应用。然而随机森林算法在分类预测特征维度高且不平衡的数据时,分类性能受到了极大限制。为了更好地处理高维不平衡数据,文中提出了一种基于混合采样和特征选择的改进随机森林算法(Hybrid Samping&Feature Selection Random Forest,HF_RF)。该算法首先从数据层面出发,通过SMOTE算法和随机欠采样相结合的方式对高维不平衡数据集进行预处理,同时引入聚类算法对SMOTE算法进行改进,提高对负类样本的处理性能;然后从算法层面出发,通过ReliefF算法对平衡后的高维数据赋予不同的权值,剔除不相关和冗余特征,对高维数据进行维度约简;最后采用加权投票原则进一步提高算法的分类性能。实验结果显示,改进后的算法与原算法相比,在处理高维不平衡数据方面的各评价指标更高,证明HF_RF算法对于高维不平衡数据的分类性能高于传统随机森林算法。