期刊文献+
共找到294篇文章
< 1 2 15 >
每页显示 20 50 100
基于加权与动态选择的不平衡数据流分类算法
1
作者 韩萌 李春鹏 +3 位作者 李昂 孟凡兴 何菲菲 张瑞华 《计算机工程与应用》 北大核心 2025年第10期79-95,共17页
在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别... 在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别不平衡比和概念漂移等实际挑战,会极大地降低分类器的性能。针对这些问题,提出了一种基于加权与动态选择的不平衡数据流分类算法(sample difficulty weighting and dynamic ensemble selection,SDW-DES),通过综合考虑样本难度和数据动态性,为实时应用提供可靠解决方案。引入一种基于样本分类难度的加权策略,结合样本的边际值和Focal Loss,以更有效地关注易分类错误的样本和少数类样本,从而提高分类器的准确性。提出一种灵活的动态集成选择方法,通过设计样本滑动窗口和困难样本滑动窗口,来综合分析分类器在不同窗口上的表现并加权,选出集成中最好的分类器进行预测,以适应数据分布的动态变化。在多种数据流环境和评估指标上与9种先进的算法进行了全面的实验评估,实验结果表明SDW-DES在4个评估指标中平均排名第一,并且更能够适应数据流中的不平衡和概念漂移问题。 展开更多
关键词 数据流分类 多类不平衡 概念漂移 样本加权 动态集成选择
在线阅读 下载PDF
适应拓扑变化的数据驱动电力系统暂态主导失稳模式识别方法 被引量:1
2
作者 周芮 杨燕 +4 位作者 余娟 杨知方 朱晟毅 余亚南 孙昕炜 《中国电机工程学报》 北大核心 2025年第9期3436-3447,I0013,共13页
电力系统暂态电压与功角混合失稳下的主导失稳模式(dominant instability mode,DIM)识别对制定快速调整措施至关重要。然而,现有数据驱动方法因拓扑变化适应能力不足,导致识别精度下降甚至失效。由此,该文提出一种适应拓扑变化的数据驱... 电力系统暂态电压与功角混合失稳下的主导失稳模式(dominant instability mode,DIM)识别对制定快速调整措施至关重要。然而,现有数据驱动方法因拓扑变化适应能力不足,导致识别精度下降甚至失效。由此,该文提出一种适应拓扑变化的数据驱动DIM识别方法。首先,提出基于K-means聚类和多随机卷积核变换的DIM高精度智能识别基础模型,利用K-means自适应选取关键暂态曲线,基于多随机卷积核变换表征暂态曲线斜率、失稳持续时间等重要DIM判断特征,从而适应拓扑变化并高效提取暂态曲线时序特征。其次,针对单个基础模型输出不确定性、可信度不足问题,提出基于Bagging集成学习和误差-分歧分解理论的DIM智能识别框架,自适应最优选择多个基础模型共同决策,提高结果的稳定性和可信性。最后,在中国电力科学研究院有限公司36节点系统及其修改系统、某实际电网8897节点系统上的算例分析表明,所提方法可在保证较高DIM识别精度的情况下适应拓扑变化,验证了方法的有效性。 展开更多
关键词 暂态稳定 主导失稳模式 关键曲线选取 多随机卷积核变换 集成学习
在线阅读 下载PDF
融合特征选择与多模型软投票集成学习的代码异味检测方法 被引量:1
3
作者 黄晨峻 高建华 《小型微型计算机系统》 北大核心 2025年第2期504-512,共9页
代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,... 代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,并在剩余度量中使用XGBoost特征重要性筛选相关度大的度量.然后,针对仅使用单一机器学习模型泛化性能不佳的问题,提出一种基于5种较成熟机器学习模型的软投票集成学习模型,完成代码异味分类检测任务.实验基于CK度量,利用含7个开源项目、4种代码异味的数据集,实验结果表明,此种方法能够减少特征维度,且在性能指标上优于其它分类模型,其中F1值最高提升3.24%,AUC最高提升2.32%. 展开更多
关键词 代码异味 特征选择 CK度量 投票模型 集成学习
在线阅读 下载PDF
稳定性特征选择研究综述
4
作者 刘梓萱 杜建强 +4 位作者 罗计根 黄强 贺佳 李益雯 秦紫瑜 《计算机工程与应用》 北大核心 2025年第7期81-95,共15页
特征选择在高维数据预处理中扮演着重要角色,通过从原始特征集中挑选出最有利于模型性能提升的特征,可以有效地降低数据维数,提高模型的准确性和降低过拟合风险。稳定性是特征选择领域中一个不容忽视的关键研究内容,它指的是特征选择方... 特征选择在高维数据预处理中扮演着重要角色,通过从原始特征集中挑选出最有利于模型性能提升的特征,可以有效地降低数据维数,提高模型的准确性和降低过拟合风险。稳定性是特征选择领域中一个不容忽视的关键研究内容,它指的是特征选择方法对训练样本的微小扰动具有一定的鲁棒性。深入剖析了特征选择过程中产生不稳定性的多重成因;系统归纳并对比了多种提升稳定性的方法,详细阐述了各类方法的目标和评估标准及其独特优势和潜在缺陷;详尽介绍了评估特征选择稳定性的指标的性质,并对稳定性指标进行解析和细致分类;探讨了稳定性特征选择领域存在的问题及对未来的展望,以期为后续的研究和实践提供有价值的参考。 展开更多
关键词 特征选择 稳定性度量 集成特征选择 不稳定性
在线阅读 下载PDF
基于SMOTE-ENN结合改进动态集成选择算法构建DLBCL患者2年内复发预测模型
5
作者 张高源 赵瑞青 +9 位作者 张岩波 余红梅 周洁 乔宇 王俊霞 王雪嫚 于凯 郭玉娇 赵志强 罗艳虹 《中国卫生统计》 北大核心 2025年第1期50-55,61,共7页
目的构建基于FIRE动态集成选择(frienemy indecision region dynamic ensemble selection,FIRE-DES)的弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者治疗达到完全缓解后两年内复发情况的预测模型,为患者的治疗提供决策... 目的构建基于FIRE动态集成选择(frienemy indecision region dynamic ensemble selection,FIRE-DES)的弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者治疗达到完全缓解后两年内复发情况的预测模型,为患者的治疗提供决策依据。方法收集山西省某三甲医院2010年1月至2020年1月经治疗后达到完全缓解的498名患者信息,构建基于四种常见类别不平衡处理方法的FIRE-DES复发预测模型,并与传统的五种单一分类器与两种集成分类器进行比较。结果四种类别不平衡算法中SMOTE-ENN(synthetic minority oversampling technique and edited nearest neighbor)算法取得了最优分类性能,在此基础上采用DESP(dynamic ensemble selection performance)、KNORAU(K-nearest oracle union)和META-DES(meta-learning for dynamic ensemble selection)动态集成选择算法的分类效果明显优于传统的单一分类器以及集成分类器模型,基于FIRE改进的DESP、KNORAU和META-DES动态选择算法的分类效果在其基础上实现了进一步提升,且FIRE-META-DES取得了最优的分类性能(准确率=0.909,精确率=0.906,召回率=0.967,ROC曲线下面积=0.879,F1-Score=0.936,Brier Score=0.088)。结论针对DLBCL实际数据集,本文SMOTE-ENN+FIRE-META-DES的复发预测模型在性能上达到最优,可为DLBCL复发预测提供有力参考。 展开更多
关键词 弥漫大B细胞淋巴瘤 复发预测 类别不平衡 动态集成选择
在线阅读 下载PDF
基于特征选择的集成极限学习机故障辨识方法
6
作者 马驰 赵荣珍 +1 位作者 原健辉 郑玉巧 《兰州理工大学学报》 北大核心 2025年第2期44-50,共7页
针对传统极限学习机神经网络在处理复杂数据时无法获得最佳分类性能的问题,提出了基于特征选择的集成极限学习机故障辨识方法.首先,选择合适的尺度对振动信号进行粗粒化分解,在不同尺度上计算振动信号的模糊近似熵,并构成高维数据集.然... 针对传统极限学习机神经网络在处理复杂数据时无法获得最佳分类性能的问题,提出了基于特征选择的集成极限学习机故障辨识方法.首先,选择合适的尺度对振动信号进行粗粒化分解,在不同尺度上计算振动信号的模糊近似熵,并构成高维数据集.然后,通过邻域粗糙集算法对高维数据集进行属性约简,并且采用不同的邻域半径对数据集进行约简,从而产生不同的特征子集,同时将每个特征子集划分为训练集和测试集,进而输入极限学习机进行模式识别.最后,整合多个极限学习机的预测结果,依据相对多数投票法决定最终的辨识结果.实验证明,相比传统极限学习机,该方法可以提高滚动轴承故障类别的辨识精度,使故障分类结果更准确、更有效. 展开更多
关键词 模糊近似熵 特征选择 分类器集成 极限学习机
在线阅读 下载PDF
基于特征过滤法和Stacking集成学习的无人机影像作物精细分类
7
作者 刘朝辉 杨风暴 张琳 《现代电子技术》 北大核心 2025年第7期1-10,共10页
针对目前多种典型作物分类中特征冗余导致同科作物混淆、分类精度低的问题,文中提出一种结合特征过滤法筛选特征和Stacking集成学习的作物精细分类方法。首先,结合敏感波段构造新型植被指数并进行阈值分割,实现作物区域提取;然后,提取... 针对目前多种典型作物分类中特征冗余导致同科作物混淆、分类精度低的问题,文中提出一种结合特征过滤法筛选特征和Stacking集成学习的作物精细分类方法。首先,结合敏感波段构造新型植被指数并进行阈值分割,实现作物区域提取;然后,提取不同作物的颜色和纹理特征,进而计算单类作物特征系数和作物间特征差异系数,实现各典型作物的分类特征过滤法优选;最后,构建融合多种机器学习算法的Stacking集成学习作物分类模型,其中第一层的基学习器选择随机森林、支持向量机、K⁃最近邻算法,第二层的元学习器选择逻辑回归模型,实现多种典型作物精细分类。实验结果表明,所提方法对7种典型作物的总体分类精度和Kappa系数分别为85.2%和83.34%,相比于未进行特征选择的分类结果分别提升了2.18%和3.68%,具有较高的分类精度,为多种典型作物的精细分类提供了新方法。 展开更多
关键词 作物分类 特征选择 Stacking集成学习 植被指数 阈值分割 衍生特征
在线阅读 下载PDF
基于特征选择和机器学习的森林蓄积量估算
8
作者 赵娅冰 彭道黎 +2 位作者 郭发苗 王荫 黄静娴 《北京林业大学学报》 北大核心 2025年第4期155-167,共13页
【目的】基于多源遥感数据,评估不同特征选择方法和机器学习算法组合构建的森林蓄积量估算模型的准确性,挖掘其协同互补潜力,以期有效提高森林蓄积量的估算精度。【方法】以河北省第九次国家森林资源连续清查数据为基础,结合GF-1、Senti... 【目的】基于多源遥感数据,评估不同特征选择方法和机器学习算法组合构建的森林蓄积量估算模型的准确性,挖掘其协同互补潜力,以期有效提高森林蓄积量的估算精度。【方法】以河北省第九次国家森林资源连续清查数据为基础,结合GF-1、Sentinel-2、Sentinel-1和ASTER GDEM 4种遥感数据,采用随机森林变量选择(VSURF)、递归特征消除(RFE)和Boruta 3种特征选择方法,以及支持向量回归(SVR)、K-最近邻(KNN)、随机森林(RF)、分类提升(CatBoost)和极端梯度提升(XGBoost)5种机器学习算法,构建蓄积量模型,并筛选出最优模型。此外,通过方差分析量化数据集、特征选择和机器学习算法这3个因素对森林蓄积量估算的影响。【结果】(1)方差分析结果表明,数据集、特征选择和机器学习算法均对蓄积量估算性能有显著影响。(2)多源遥感数据的结合能有效提高森林蓄积量的估算性能。与其他数据集相比,联合GF-1、Sentinel-2、Sentinel-1和ASTER GDEM数据构建的模型表现出更高的估算精度。从整体来看,Boruta特征选择方法优于VSURF和RFE。CatBoost在建模中的表现优于其他算法(SVR、KNN、RF和XGBoost)。(3)基于GF-1、Sentinel-2、Sentinel-1和ASTER GDEM的组合,使用Boruta特征选择方法和CatBoost机器学习算法构建的估算模型实现了最高的准确性(R^(2)=0.6385,RMSE=13.3053 m^(3)/hm^(2))。【结论】基于多源遥感数据估算保定市森林蓄积量时,结合特征选择和机器学习算法可显著优化模型的估算效果,得到更精准的蓄积量估算结果。研究结果不仅改进了当前应用多源遥感数据估算森林蓄积量的方法,还为大范围森林蓄积量监测提供了新的思路和参考依据。 展开更多
关键词 森林蓄积量 多源遥感数据 特征选择 机器学习算法 集成学习
在线阅读 下载PDF
基于特征优化和混合改进灰狼算法优化BiLSTM网络的短期光伏功率预测 被引量:2
9
作者 赵如意 王晓辉 +3 位作者 郑碧煌 李道兴 高毅 郭鹏天 《电网技术》 北大核心 2025年第1期209-222,I0080-I0084,共19页
为解决光伏序列的强噪音干扰以及单一模型在光伏功率预测方面精度偏低和泛化性较差的问题,提出了一种基于特征优化和混合改进灰狼算法优化双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)的短期光伏功率预测方法。首... 为解决光伏序列的强噪音干扰以及单一模型在光伏功率预测方面精度偏低和泛化性较差的问题,提出了一种基于特征优化和混合改进灰狼算法优化双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)的短期光伏功率预测方法。首先,运用互信息算法进行输入数据的变量选择,以消除冗余变量。其次,通过互补集合经验模态分解和改进的小波阈值算法对筛选后的数据进行特征重构,旨在降低数据中的噪声干扰并完成输入变量的特征优化。随后,结合改进的Tent混沌映射、非线性递减因子、动态权重策略和差分进化算法对标准灰狼优化算法进行混合优化,以确定双向长短期记忆神经网络的最优超参数组合,并引入注意力机制以挖掘数据中的关键时序信息,最终构建出一种新型的短期光伏功率预测模型。仿真实验表明,相较于最小二乘支持向量机、长短期记忆网络和双向长短期记忆网络,所提模型在晴天、多云、阴天和降雨等不同工况下的均方根误差平均分别降低了12.45%、7.95%和5.37%,显示出优秀的预测性能、良好的泛化能力和潜在的工程应用价值。 展开更多
关键词 变量选择 互补集合经验模态分解 特征重构 混合改进优化灰狼算法 双向长短期记忆网络 注意力机制
在线阅读 下载PDF
Ensemble-SISPLS近红外光谱变量选择方法 被引量:1
10
作者 李四海 赵磊 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2019年第4期1047-1052,共6页
近红外光谱具有高维小样本的特点,变量选择是提高定量分析模型稳健性和可解释性的一种有效方法。确定独立筛选(SIS)是一种基于边际相关性的超高维数据变量选择方法,广泛用于基因微阵列数据的变量选择。SIS具有将数据维度降低至样本大小... 近红外光谱具有高维小样本的特点,变量选择是提高定量分析模型稳健性和可解释性的一种有效方法。确定独立筛选(SIS)是一种基于边际相关性的超高维数据变量选择方法,广泛用于基因微阵列数据的变量选择。SIS具有将数据维度降低至样本大小规模的能力,其降维能力与LASSO相当,在相当宽泛的近似条件下,由于具有安全筛选性质,所有重要变量被保留的概率趋于1。基于确定独立筛选偏最小二乘(SIS-SPLS)的变量选择是一种迭代式的SIS变量选择方法,首先利用SIS方法完成光谱重要变量的初选;然后根据重要变量的边际相关性大小进行逐步前向选择:建立偏最小二乘回归模型,依据贝叶斯信息准则(BIC)确定最终的变量选择结果。SIS-SPLS以逐步前向选择的方式实现对重要变量的增量式筛选,随着潜变量个数的增加及因变量残差的逐步减小, SIS-SPLS方法选择的变量个数将趋于稳定。然而仅以边际相关性对变量重要性进行评价,当光谱变量个数远大于样本数时,该方法也存在选择的变量过多、变量选择结果不够稳健等问题。为进一步提高小样本情况下变量选择的稳健性,将集成学习引入SIS-SPLS方法之中,提出了一种集成SIS-SPLS变量选择方法(Ensemble-SISPLS)。该方法首先对校正集样本进行自助重采样,对采样得到的每一个校正子集分别使用SIS-SPLS方法进行变量筛选,通过投票机制并设置频次阈值对所有校正子集的变量选择结果进行集成,选择出现频次大于给定阈值的变量并建立偏最小二乘回归模型,计算5折交叉验证均方根误差。对频次阈值和潜变量个数两个关键参数使用网格搜索法进行优选,根据子模型的交叉验证均方根误差和变量个数对子模型性能进行综合评价,以最优子模型包含的变量作为最终的变量选择结果。分别在Corn数据集和当归数据集上进行变量选择实验,比较Ensemble-SISPLS, SIS-SPLS和UVE-PLS三种变量选择方法的性能。其中当归数据集共77个样本,样本采自甘肃岷县和渭源县,使用Nicolet-6700型近红外光谱仪扫描得到所有样本的近红外光谱并对当归中的阿魏酸含量进行预测。Ensemble-SISPLS方法在Corn数据集上选择的变量个数、 RMSEP和决定系数分别为22, 0.000 8和0.999 8; SIS-SPLS方法在Corn数据集上选择的变量个数、 RMSEP和决定系数分别为97, 0.007 3和0.998 8。Ensemble-SISPLS方法在当归数据集上选择的变量个数、 RMSEP和决定系数分别为24, 0.018 1和0.996 3; SIS-SPLS方法在当归数据集上选择的变量个数、 RMSEP和决定系数分别为38, 0.022 6和0.994 3。结果表明,该方法进一步提高了变量选择结果的稳健性和预测能力。Ensemble-SISPLS变量选择方法有效结合了SIS-SPLS较强的变量选择能力和集成学习良好的泛化能力,提高了变量选择的稳健性。此外,由于在子模型的预测能力和变量个数之间进行了折中,一定程度上减少了选择变量的个数,提高了模型的可解释性。 展开更多
关键词 近红外光谱 变量选择 确定独立筛选 偏最小二乘 集成学习
在线阅读 下载PDF
基于无源领域自适应的低光照显著性目标检测
11
作者 李书玮 黄正翔 +5 位作者 胡云 刘兴 卢笑 郭畅 吴成中 王耀南 《计算机工程》 北大核心 2025年第4期75-84,共10页
为了解决低光照条件下校园环境等场景监控摄像头图像质量和监控效果受影响而带来的安全问题,提出一种低光照显著性目标检测(SOD)方法,以提高低光照条件下目标检测能力。针对低光照条件下图像的显著性特征弱化和缺乏大规模标注数据的问题... 为了解决低光照条件下校园环境等场景监控摄像头图像质量和监控效果受影响而带来的安全问题,提出一种低光照显著性目标检测(SOD)方法,以提高低光照条件下目标检测能力。针对低光照条件下图像的显著性特征弱化和缺乏大规模标注数据的问题,提出一种无源领域自适应(SFDA)方法,将正常光照图像(源域)下训练的模型知识迁移至低光照条件图像(目标域)。该方法采用两阶段策略:在第一阶段,利用源域模型生成低光照图像的伪标签,为提高伪标签生成的质量,提出集合熵最小化损失抑制高熵区域,同时引入选择性投票方法来增强伪标签的生成;在第二阶段,采用基于增强引导一致性的教师-学生网络自训练方法对显著图进行精细化,进一步提高检测结果的精度。在SOD-LL数据集上的实验结果表明,所提出的方法在低光照场景下总体性能优于其他图像显著性检测方法,相较于正常光照的SOD方法,其平均绝对误差(MAE)降低15.15%,加权F1值(wFm)提高4.73%。 展开更多
关键词 显著性目标检测 低光照场景 无源领域自适应 伪标签 教师-学生网络 集合熵最小化 选择性投票
在线阅读 下载PDF
基于聚类集成选择的随机森林聚类方法
12
作者 李金玉 刘静玮 +1 位作者 杜明晶 吴福玉 《计算机工程与设计》 北大核心 2025年第4期990-996,共7页
为解决一些决策树受到数据噪声等因素的影响,导致它们对随机森林聚类产生有限甚至负面贡献这一问题,提出一种基于聚类集成选择的随机森林聚类方法(random forest clustering method based on cluster ensemble selection,RFCCES)。将每... 为解决一些决策树受到数据噪声等因素的影响,导致它们对随机森林聚类产生有限甚至负面贡献这一问题,提出一种基于聚类集成选择的随机森林聚类方法(random forest clustering method based on cluster ensemble selection,RFCCES)。将每一棵决策树视为一个基聚类器,根据基聚类器集合的稳定和不稳定性设计两种不同的聚类集成选择方法,将评估单个决策树对随机森林的增益问题,转化为基聚类器对最终的聚类集成结果的增益问题。该算法与5种对比方法在10个数据集上进行比较,实验结果验证了RFCCES的独特优势和整体有效性。 展开更多
关键词 随机森林 聚类 决策树 稳定性 聚类集成 基聚类器 聚类集成选择
在线阅读 下载PDF
面向不平衡数据的特征子空间增强的异质集成学习
13
作者 陈丽芳 白云 +1 位作者 施永辉 代琪 《计算机工程与科学》 北大核心 2025年第5期940-950,共11页
对于不平衡数据,传统分类器趋向于保证多数类的准确率,而牺牲少数类的准确率,造成算法的整体性能下降。针对这一问题,提出一种面向不平衡数据的特征子空间增强的异质集成学习算法HEL-FSA。首先利用XGBoost算法学习特征的重要性,并选择... 对于不平衡数据,传统分类器趋向于保证多数类的准确率,而牺牲少数类的准确率,造成算法的整体性能下降。针对这一问题,提出一种面向不平衡数据的特征子空间增强的异质集成学习算法HEL-FSA。首先利用XGBoost算法学习特征的重要性,并选择重要的特征,形成数据集的特征子空间;其次使用SMOTE算法在特征子空间中生成新样本,获得更加平衡的训练数据;最后,采用逻辑回归、决策树、多层感知器、支持向量机和XGBoost这5种基模型,并使用if_any算法融合异质基模型。在9个不平衡数据集上的实验结果验证了该算法的可行性,同时,将提出的算法用于宫颈癌风险预测,增强了其对宫颈癌风险的理解和预测能力。 展开更多
关键词 不平衡数据 特征选择 集成学习 合成少数类过采样技术
在线阅读 下载PDF
基于ISSA-Stacking集成学习的共享单车租赁量预测
14
作者 张泽 韩晓明 韩晓霞 《控制工程》 北大核心 2025年第1期39-50,共12页
针对共享单车供需不平衡问题,结合Stacking算法和改进麻雀搜索算法(improved sparrow search algorithm,ISSA),提出了一种基于ISSA-Stacking算法的共享单车租赁量预测模型。首先,利用相关性分析法和轻量级梯度提升机进行特征选择;然后,... 针对共享单车供需不平衡问题,结合Stacking算法和改进麻雀搜索算法(improved sparrow search algorithm,ISSA),提出了一种基于ISSA-Stacking算法的共享单车租赁量预测模型。首先,利用相关性分析法和轻量级梯度提升机进行特征选择;然后,建立多种异质回归预测模型并采用ISSA对各模型的关键超参数进行优化,通过引入精英反向学习策略和自适应种群比例因子来提高麻雀搜索算法的全局搜索能力和收敛速度;最后,利用Stacking算法的集成学习思想对各模型进行融合。实验使用美国华盛顿地区的共享单车出行数据进行租赁量预测,通过对比分析验证了所提融合模型相比单一模型在共享单车租赁量预测方面具有更高的预测精度。 展开更多
关键词 共享单车租赁量预测 集成学习 改进麻雀搜索算法 特征选择
在线阅读 下载PDF
基于Res-BiLSTM的柔性直流配电网故障选极
15
作者 郑超文 吴浩 +2 位作者 吴川兰 唐丹 钟长华 《科学技术与工程》 北大核心 2025年第5期1954-1962,共9页
针对传统的选极方法存在着抗噪、抗高阻能力弱以及阈值整定复杂等问题,提出一种基于Res-BiLSTM网络的柔性直流配电线路故障选极方法。首先,对原始故障信号进行完全自适应噪声模态分解,再采用相关系数和香农熵进行重构得到重构信号;其次... 针对传统的选极方法存在着抗噪、抗高阻能力弱以及阈值整定复杂等问题,提出一种基于Res-BiLSTM网络的柔性直流配电线路故障选极方法。首先,对原始故障信号进行完全自适应噪声模态分解,再采用相关系数和香农熵进行重构得到重构信号;其次,搭建Res-BiLSTM网络模型进行选极,为提高网络精度与收敛速度,在分裂注意力网络中引入通道注意力模块,并使用卷积双向长短期记忆网络与改进分裂注意力网络同时提取重构信号特征,使用注意力特征融合模块融合提取到的特征,并对融合特征进行分类;最后,利用PSCAD/EMTDC搭建模型并验证所提方法。仿真结果表明所提选极方法准确性高,抗干扰能力强,不受故障距离影响。 展开更多
关键词 柔性直流配电网 故障选极 完全自适应噪声模态分解 神经网络
在线阅读 下载PDF
Ensemble feature selection integrating elitist roles and quantum game model 被引量:1
16
作者 Weiping Ding Jiandong Wang +1 位作者 Zhijin Guan Quan Shi 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2015年第3期584-594,共11页
To accelerate the selection process of feature subsets in the rough set theory (RST), an ensemble elitist roles based quantum game (EERQG) algorithm is proposed for feature selec- tion. Firstly, the multilevel eli... To accelerate the selection process of feature subsets in the rough set theory (RST), an ensemble elitist roles based quantum game (EERQG) algorithm is proposed for feature selec- tion. Firstly, the multilevel elitist roles based dynamics equilibrium strategy is established, and both immigration and emigration of elitists are able to be self-adaptive to balance between exploration and exploitation for feature selection. Secondly, the utility matrix of trust margins is introduced to the model of multilevel elitist roles to enhance various elitist roles' performance of searching the optimal feature subsets, and the win-win utility solutions for feature selec- tion can be attained. Meanwhile, a novel ensemble quantum game strategy is designed as an intriguing exhibiting structure to perfect the dynamics equilibrium of multilevel elitist roles. Finally, the en- semble manner of multilevel elitist roles is employed to achieve the global minimal feature subset, which will greatly improve the fea- sibility and effectiveness. Experiment results show the proposed EERQG algorithm has superiority compared to the existing feature selection algorithms. 展开更多
关键词 ensemble quantum game utility matrix of trust mar-gin dynamics equilibrium strategy multilevel elitist role feature selection and classification.
在线阅读 下载PDF
基于LCPSO与异构集成学习模型的输电线路覆冰等级预警方法 被引量:3
17
作者 尚秋峰 谷元宇 +2 位作者 樊小凯 王健健 姚国珍 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第9期157-165,共9页
基于Φ-OTDR的分布式光纤传感技术,通过分析OPGW中光纤的振动特征,可以实现输电线路全线路、全天候的在线健康监测。采用Φ-OTDR采集了无覆冰、1级覆冰和2级覆冰3种工况下的振动信号,充分挖掘了相位和幅值信号的时域、频域、时频域特征... 基于Φ-OTDR的分布式光纤传感技术,通过分析OPGW中光纤的振动特征,可以实现输电线路全线路、全天候的在线健康监测。采用Φ-OTDR采集了无覆冰、1级覆冰和2级覆冰3种工况下的振动信号,充分挖掘了相位和幅值信号的时域、频域、时频域特征及其对应的统计学特性。为提升覆冰工况的识别准确率,提出基于LCPSO-AdaBoost-MCG的最优特征子集选择算法,以AdaBoost-MCG的分类错误率为适应度函数,采用LCPSO算法迭代计算最优特征子集。采用AdaBoost集成SCN、KNN、PNN、SVM 4种弱分类器,构成了异构强分类器,利用每种弱分类器的优势,提高了模型泛化性能和识别准确率。经现场数据集验证,本文方法对覆冰等级的识别准确率达到了98.7%。根据本文确定的最优特征子集,可以构建覆冰等级预警特征库,为输电线路智能巡检提供有益参考。 展开更多
关键词 输电线路覆冰 光纤传感 特征选择 集成学习 优化算法
在线阅读 下载PDF
基于Bagging集成的高维不平衡数据特征选择方法 被引量:1
18
作者 王劲波 刘礼 《统计与决策》 CSSCI 北大核心 2024年第22期53-58,共6页
随着大数据的发展,很多应用领域样本都以高维形式呈现,而数据集的高维特性会削减不平衡学习的分类效果。针对高维不平衡数据的分类问题,文章提出了一种基于SVM-RFE与Bagging集成的自适应特征选择方法WAFS,该算法结合嵌入式与包装式的特... 随着大数据的发展,很多应用领域样本都以高维形式呈现,而数据集的高维特性会削减不平衡学习的分类效果。针对高维不平衡数据的分类问题,文章提出了一种基于SVM-RFE与Bagging集成的自适应特征选择方法WAFS,该算法结合嵌入式与包装式的特征选择方法,能够自适应地选择最优特征构成特征空间。在5个不同维度(100~5000)的高维不平衡公开数据集上与基于过滤式的CSFS特征选择算法和基于嵌入式的ASG特征选择算法进行了对比分析,并探究了适合不同数据集的最佳采样方式以及不同维度数据集的最优特征空间率。以AUC、Acc、Recall、F1-score和G-mean为评估指标,实验结果表明,WAFS算法在不同维度数据集上都有比较好的表现,尤其是在分类高维小样本的不平衡数据集上具有巨大优势,在保证了准确率的前提下,该模型也有很强的稳定性和泛化性。 展开更多
关键词 自适应 特征选择 Bagging集成 高维不平衡
在线阅读 下载PDF
应用集成极限学习机的电站SCR脱硝系统建模与分析 被引量:1
19
作者 马宁 尚勇 +4 位作者 尤默 杨振勇 李展 刘磊 康静秋 《中国测试》 CAS 北大核心 2024年第1期185-192,共8页
针对火电机组普遍采用的选择性催化还原(selective catalytic reduction,SCR)脱硝反应容易受到环境因素影响,且具有非线性、大迟延、强扰动特点,难以建立准确反应模型的问题,提出一种基于集成极限学习机的SCR脱硝系统建模方法。首先,选... 针对火电机组普遍采用的选择性催化还原(selective catalytic reduction,SCR)脱硝反应容易受到环境因素影响,且具有非线性、大迟延、强扰动特点,难以建立准确反应模型的问题,提出一种基于集成极限学习机的SCR脱硝系统建模方法。首先,选择4种具有不同激活函数的极限学习机和核极限学习机作为基学习器,分别建立SCR脱硝系统模型;然后,利用偏最小二乘算法将各基学习器的结果进行集成;最后,采用某1000 MW超超临界机组实际运行数据与所提建模方法相结合建立SCR脱硝系统模型。实验结果验证模型的有效性;与其他方法所建模型对比,结果表明基于集成极限学习机的SCR脱硝系统模型具有更好的模型泛化能力。 展开更多
关键词 火电机组 选择性催化还原 极限学习机 集成
在线阅读 下载PDF
基于高光谱成像技术与异构集成学习的龟甲药材生长年限鉴别 被引量:1
20
作者 位云朋 胡会强 +3 位作者 毛晓波 赵宇平 张蕾 盛文涛 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第9期2613-2619,共7页
龟甲是常见的集药、食两用的中药之一,富含维生素、氨基酸、胶原蛋白及大量矿物质成分,被广泛应用于贫血、骨质疏松、免疫力低下等临床症状的医疗与日常饮片炮制。研究表明,龟甲的生长年限越长,其滋阴有效部位及微量元素含量越充足。由... 龟甲是常见的集药、食两用的中药之一,富含维生素、氨基酸、胶原蛋白及大量矿物质成分,被广泛应用于贫血、骨质疏松、免疫力低下等临床症状的医疗与日常饮片炮制。研究表明,龟甲的生长年限越长,其滋阴有效部位及微量元素含量越充足。由于对生长规律认识不足、培育不规范等因素,市场上普遍存在以次充好的现象。目前对龟甲生长年限的鉴别主要通过经验法与理化手段。经验法具有较强的主观性,不利于推广应用;理化技术操作周期长,会破坏样本的完整性。考虑到传统经验、理化检验等鉴别方法的局限性,该研究构建了一种基于高光谱成像技术的龟甲年限鉴别模型。以不同生长年限的龟甲药材为研究对象,采用高光谱成像系统采集原始龟甲药材在可见近红外(VNIR)与短波红外(SWIR)透镜下的高光谱图像,并建立基于支持向量机(SVM)、逻辑回归(LR)与K近邻(KNN)分类策略的异构集成学习模型。结果表明,基于VNIR与SWIR融合波段下的高光谱图像包含更丰富的光谱信息,采用异构集成学习模型可以有效地对龟甲年限实现精确鉴别。模型在龟甲背甲与腹甲样本的测试集准确率分别达到96.14%与93.82%,表明龟甲背甲对其生长年限的鉴别更有优势。考虑到快速性检测的因素,采用波段选择方法剔除冗余特征,降低龟甲药材图像的复杂度,并采用特征波段表征龟甲药材的光谱信息,进一步提升模型分类性能。结果表明,模型在波段数目为32时的背甲样本可以达到96.35%的分类准确率,超过了全波段光谱数据的鉴别精度,表明波段选择策略对提取有效光谱信息的可行性。基于高光谱成像技术的异构集成学习模型可以快速、准确地鉴别龟甲药材的生长年限,为龟甲及其他药材属性的检测提供新的技术参考。 展开更多
关键词 龟甲 高光谱图像 波段选择 集成学习
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部