期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于集成学习算法的尾气处理装置SO_(2)排放预测模型 被引量:1
1
作者 张宝东 杜支文 +1 位作者 闫昭 侯磊 《石油与天然气化工》 北大核心 2025年第1期9-17,共9页
目的精确预测天然气净化厂尾气处理装置烟气中二氧化硫(SO_(2))排放质量浓度。方法利用某天然气净化厂2018—2023年每小时44000条尾气处理日报数据构建数据集,进行数据处理,并利用重要性分析方法提取27个重要特征。针对烟气中SO_(2)排... 目的精确预测天然气净化厂尾气处理装置烟气中二氧化硫(SO_(2))排放质量浓度。方法利用某天然气净化厂2018—2023年每小时44000条尾气处理日报数据构建数据集,进行数据处理,并利用重要性分析方法提取27个重要特征。针对烟气中SO_(2)排放质量浓度的预测任务,采用了随机森林(Random Forest)、梯度提升(Gradient Boost)和极值梯度提升(XGBoost)3种集成学习算法,以及基于径向基(RBF)内核的支持向量机(SVM)替代仿真模型进行建模。结果3种集成学习模型比SVM单模型的预测效果更为精准,而Random Forest模型展现出最佳性能,决定系数为0.89,均方误差为1250.59,相对于8800个真实测试集样本数据,其预测偏差为9.86%,相比于Random Forest模型(数据未处理),其决定系数提高了61.82%。结论Random Forest模型在准确预测尾气处理装置SO_(2)排放质量浓度方面具有实际生产应用价值,可为后续尾气处理装置的工艺参数优化提供可靠的模型支持。 展开更多
关键词 天然气净化 硫磺回收 尾气处理 二氧化硫排放 预测模型 集成学习算法
在线阅读 下载PDF
基于集成学习算法和Optuna调优的江西省森林碳储量遥感估测 被引量:2
2
作者 王可月 王轶夫 +3 位作者 陈馨 郑峻鹏 李杰 孙玉军 《生态学报》 北大核心 2025年第2期685-700,共16页
了解森林碳储量对于完整、准确地量化碳排放及气候变化背景下的环境监测至关重要,借助遥感数据源是估算区域尺度碳储量的有效方法。以江西省为研究区,基于第七次国家森林资源连续清查样地数据与Landsat-5 TM遥感数据,通过GEE平台对影像... 了解森林碳储量对于完整、准确地量化碳排放及气候变化背景下的环境监测至关重要,借助遥感数据源是估算区域尺度碳储量的有效方法。以江西省为研究区,基于第七次国家森林资源连续清查样地数据与Landsat-5 TM遥感数据,通过GEE平台对影像进行处理,将递归特征消除(RFE)、Boruta两种特征选择方法与支持向量机(SVR),包括随机森林(RF)、极端梯度提升(XGBoost)和堆叠集成(Stacking)在内的三种集成学习算法相结合,分析不同模型的估测精度。此外,运用Optuna超参数优化框架来确定各模型的超参数。根据最优估测模型来反演江西省森林碳储量并绘制空间分布图,选用地理探测器对碳储量的空间分布格局进行驱动力分析。结果表明:(1)根据特征重要性排名,RFE筛选出30个变量,Boruta筛选出11个变量,合适的特征子集与回归算法相结合能显著提升估测的准确性。(2)基于Optuna对各模型的超参数进行迭代调优,发现不同特征子集与机器学习算法相结合,超参数取值和重要性在模型中差异较大。其中RFE筛选的最优特征子集与Stacking算法结合进行回归拟合时获得了最好的估测效果(R^(2)=0.527,RMSE=15.85Mg/hm^(2),MAE=12.31Mg/hm^(2)),该模型有效利用训练数据,结合多种算法的优点以减少偏差,显著改善森林碳密度高值低估和低值高估的问题。(3)最优估测模型反演得到江西省2006年的森林碳密度平均值为33.356Mg/hm^(2)(2.585—88.943Mg/hm^(2)),森林碳储量总量为321.507Tg。(4)自然环境因子中海拔和坡度是影响碳储量空间分布格局的主要驱动因子;所有因子在交互作用下呈非线性增强和双因子增强,其空间分布格局是自然因素和人为因素协同作用的结果。 展开更多
关键词 森林碳储量遥感估测 集成学习算法 Optuna超参数调优 堆叠集成算法 碳密度 地理探测器
在线阅读 下载PDF
基于集成学习算法和WOFOST模型的小麦生长模拟分析与产量预测 被引量:2
3
作者 李博 张婧婧 +1 位作者 雷嘉诚 杜云 《湖北农业科学》 2024年第8期85-91,共7页
针对传统单一作物生长模型和机器学习模型在预测上的限制,将WOFOST模型与灌溉模型结合,利用集成学习算法建立多模型耦合系统(WOFOST耦合模型),选用美国航空航天局(NASA)1990—2020年数据进行模拟试验,选取2006年、2018年展示试验成果。... 针对传统单一作物生长模型和机器学习模型在预测上的限制,将WOFOST模型与灌溉模型结合,利用集成学习算法建立多模型耦合系统(WOFOST耦合模型),选用美国航空航天局(NASA)1990—2020年数据进行模拟试验,选取2006年、2018年展示试验成果。结果表明,WOFOST耦合模型的小麦叶面积指数、总生物量均高于WOFOST模型,WOFOST耦合模型更贴近实际生产活动。耦合算法的MAE、MSE均低于Bagging、Boosting、Stacking算法,分别为2.836、7.581,R~2均高于Bagging、Boosting、Stacking算法,高达0.942。WOFOST耦合模型更全面和准确地模拟作物生长状态,提高产量预测的准确性与可信度。 展开更多
关键词 集成学习算法 WOFOST模型 小麦生长 模拟 产量预测 耦合
在线阅读 下载PDF
基于集成学习算法的可持续模块划分方法 被引量:1
4
作者 邹光宇 李中凯 《机床与液压》 北大核心 2024年第11期87-92,共6页
随着客户对可持续产品需求的增加,针对产品功能和结构属性的传统模块化设计,正逐步转向可持续模块化设计。然而当前的模块划分方法更注重于对模块化指数的优化迭代,忽略了产品多组件间的信息传递和反馈。为此,提出一种集成学习算法的可... 随着客户对可持续产品需求的增加,针对产品功能和结构属性的传统模块化设计,正逐步转向可持续模块化设计。然而当前的模块划分方法更注重于对模块化指数的优化迭代,忽略了产品多组件间的信息传递和反馈。为此,提出一种集成学习算法的可持续模块划分方法。首先,面向组件间的回收性、材料和寿命因素,构建产品的综合DSM模型。其次,提出集成学习算法的弱分类器构建规则和强分类器结合策略。最后,通过颚式破碎机案例验证了所提模块划分方法的可行性,集成学习算法同直接聚类和遗传算法的模块划分结果对比,表明所提方法各模块组件更接近DSM的对角线。 展开更多
关键词 模块划分 可持续设计 集成学习算法 信息回路
在线阅读 下载PDF
基于人工神经网络的驾驶行为动态集成学习算法 被引量:5
5
作者 梁军 沙志强 陈龙 《交通运输系统工程与信息》 EI CSCD 北大核心 2012年第2期34-40,共7页
针对传统驾驶决策模型难以体现驾驶员驾驶过程中对交通环境的感知、判断、决策、动作等环节存在不确定性和不一致性,提出了一种基于神经网络的驾驶行为动态集成学习算法——DNNIA.首先训练多个个体网络模拟驾驶行为,然后动态选择泛化误... 针对传统驾驶决策模型难以体现驾驶员驾驶过程中对交通环境的感知、判断、决策、动作等环节存在不确定性和不一致性,提出了一种基于神经网络的驾驶行为动态集成学习算法——DNNIA.首先训练多个个体网络模拟驾驶行为,然后动态选择泛化误差E最小的个体网络进行集成,采用拉格朗日函数法求解最优集成权系数ωi,并引入agent联盟的思想,把联盟中的个体网络对应的神经元输出做加权平均后,取最大值作为输出.在标准数据集上验证了该算法的有效性,仿真实验中得到的驾驶员踩踏踏板的习惯行为仿真结果与实际采集的样本数据总体趋势基本吻合. 展开更多
关键词 综合交通运输 动态集成学习算法 人工神经网络 驾驶行为仿真
在线阅读 下载PDF
个人信用评估应用方法分析——基于集成学习算法视角 被引量:1
6
作者 唐小果 李毓 《经济问题》 CSSCI 北大核心 2011年第12期66-68,共3页
集成学习算法是一种基于统计理论以计算机实现的非参数识别技术。阐述了集成学习算法的基本思想,建立了基于Bagging集成学习算法的个人信用评估模型。通过确定相应的评估指标体系,使用一个小样本数据对所建模型的有效性进行了研究,结果... 集成学习算法是一种基于统计理论以计算机实现的非参数识别技术。阐述了集成学习算法的基本思想,建立了基于Bagging集成学习算法的个人信用评估模型。通过确定相应的评估指标体系,使用一个小样本数据对所建模型的有效性进行了研究,结果表明,集成学习算法可以显著提高分类树的预测精度,且在个人信用评估的实践中具有较强的优势。 展开更多
关键词 个人信用评估 BAGGING 分类树 集成学习算法
在线阅读 下载PDF
基于集成学习算法的黄河中游采砂信息提取 被引量:2
7
作者 王守志 奚歌 +4 位作者 张福坤 刘金玉 耿振云 詹昊 张云姣 《水利水电技术》 北大核心 2020年第12期161-168,共8页
针对大范围快速监管黄河中游采砂情况以维护其生命健康的问题,提出了一种加权平均集成UNet算法和PSPNet算法,改进损失函数,并结合遥感影像特点合理设定参数的集成学习算法。通过利用算法训练得到的采砂信息提取模型对实地调查的5个采砂... 针对大范围快速监管黄河中游采砂情况以维护其生命健康的问题,提出了一种加权平均集成UNet算法和PSPNet算法,改进损失函数,并结合遥感影像特点合理设定参数的集成学习算法。通过利用算法训练得到的采砂信息提取模型对实地调查的5个采砂点进行了信息提取,结果显示:UNet算法提取的找全率(Recall)为79.87%,准确率(Precision)为15.80%,交并比(IoU)为16.75%;PSPNet算法提取的找全率(Recall)为57.57%,准确率(Precision)为27.79%,交并比(IoU)为31.17%;集成学习算法提取的找全率(Recall)为89.57%,准确率(Precision)为55.72%,交并比(IoU)为60.28%。因此,本文算法可以在一定程度上应用于河湖两侧采砂信息的提取,更好地辅助水利行业强监管的执行。 展开更多
关键词 UNet算法 PSPNet算法 改进损失函数 集成学习算法 采砂
在线阅读 下载PDF
融合时间序列集成学习和解释性分析的岩性—流体识别方法
8
作者 任权 胡光辉 +3 位作者 唐金良 张岳 薛启航 张宏兵 《石油地球物理勘探》 北大核心 2025年第5期1279-1289,共11页
岩性—流体识别是储层预测和地质建模的一个重要环节,对指导油气勘探与开发具有重要意义。尽管机器学习模型在该领域已取得显著成果,但其决策过程缺乏可解释性,同时面临着分类结果的非唯一性及不确定性评估的挑战。为此,提出一种高精度... 岩性—流体识别是储层预测和地质建模的一个重要环节,对指导油气勘探与开发具有重要意义。尽管机器学习模型在该领域已取得显著成果,但其决策过程缺乏可解释性,同时面临着分类结果的非唯一性及不确定性评估的挑战。为此,提出一种高精度且具可解释性的岩性—流体识别方法,即将异构时间序列集成学习算法HIVE-COTE 2.0(HC2)与SHAP解释性分析相结合。HC2通过整合多种基分类器,并采用交叉验证精度加权的概率集成策略,可提升预测准确性与泛化能力,同时生成的概率值可量化预测结果的不确定性,为决策提供风险评估支持。SHAP可进一步分析输入参数的重要性,优化特征组合,从而提升分类性能。实验结果表明,该方法在准确性、泛化能力及可解释性方面均优于传统机器学习与深度学习模型,可为油气储层的精准预测与高效开发提供新思路。 展开更多
关键词 岩性—流体识别 时间序列集成学习算法 可解释性 不确定性评估 储层预测
在线阅读 下载PDF
基于集成学习和信息融合的段塞流分相流量测量 被引量:2
9
作者 温佳祺 杨叙宁 +2 位作者 李金硕 丁振君 董芳 《河北大学学报(自然科学版)》 CAS 北大核心 2024年第5期541-550,共10页
段塞流是气液两相流中典型流型,准确测量其分相流量有利于实时监控生产过程,优化工艺控制,确保系统在安全、经济的工况下运行.本文在改进长喉文丘里管的基础上,设计了一种集近红外(NIR)、声发射(AE)技术于一体的水平气液流量智能多传感... 段塞流是气液两相流中典型流型,准确测量其分相流量有利于实时监控生产过程,优化工艺控制,确保系统在安全、经济的工况下运行.本文在改进长喉文丘里管的基础上,设计了一种集近红外(NIR)、声发射(AE)技术于一体的水平气液流量智能多传感系统.利用AE传感器和NIR传感器检测气液两相的流动噪声信息和截面信息,采用经验模态分解法(EMD)提取气体体积分数的特征变量.通过集成学习算法进行特征级融合,融合后的段塞流体积含气率预测模型平均绝对百分比误差(MAPE)为4.11%,92.45%的预测结果偏差在±10%以内.在Collins模型的基础上,提出了基于梯度提升决策树(GBDT)的段塞流质量流量预测模型,其MAPE值为0.96%,全部预测结果的偏差在±20%以内.本研究为气液两相流段塞流参数混合不分离测量提供了一种新方法,为气液两相流动机理研究奠定了基础. 展开更多
关键词 气液两相流 数据融合 段塞流 多传感器 集成学习算法
在线阅读 下载PDF
基于集成学习模型的非平稳月径流预报 被引量:10
10
作者 康艳 程潇 +3 位作者 陈沛如 向悦 张芳琴 宋松柏 《水资源保护》 EI CAS CSCD 北大核心 2023年第2期125-135,179,共12页
针对变化环境下月径流序列的非平稳性日益加剧,传统径流预报模型采用普通学习算法的局限性,基于Bagging和Boosting集成学习算法,构建了随机森林(RF)、梯度提升决策树(GBDT)和轻梯度提升机(LightGBM)3种集成学习模型,融合弹性网(EN)和变... 针对变化环境下月径流序列的非平稳性日益加剧,传统径流预报模型采用普通学习算法的局限性,基于Bagging和Boosting集成学习算法,构建了随机森林(RF)、梯度提升决策树(GBDT)和轻梯度提升机(LightGBM)3种集成学习模型,融合弹性网(EN)和变分模态分解(VMD),建立VMD-EN-RF、VMD-EN-GBDT和VMD-EN-LightGBM非平稳月径流组合预报模型,并以黄河流域实测月径流为研究对象,评估预报结果的不确定性。结果表明:单一集成学习模型能够提供可靠的预报结果,适用于非平稳月径流预报;融合VMD和EN的集成学习模型预报性能较单一集成学习模型有了显著提高,纳什效率系数提升了15%~20%,均方根误差降低了30%~40%;基于Boosting集成方法构建的集成学习模型优于Bagging集成方法,其中VMD-EN-LightGBM预见期3月内的预报效果优于VMD-EN-RF和VMD-EN-GBDT,在90%置信度的区间预报覆盖率高于90%,表现出良好的性能。 展开更多
关键词 月径流预报 集成学习算法 弹性网 变分模态分解 黄河流域
在线阅读 下载PDF
P-AnDT:平均n依赖决策树的正例未标注学习算法 被引量:2
11
作者 张金蕾 李梅 +2 位作者 张阳 梁春泉 王勇 《计算机应用研究》 CSCD 北大核心 2016年第7期1941-1944,1951,共5页
为了在仅有正例和未标注样本的训练数据集下进行机器学习(positive unlabeled learning,PU学习),提出一种可用于PU学习的平均n依赖决策树(P-AnDT)分类算法。在构造决策树时,选取样本的n个属性作为依赖属性,在每个分裂属性上计算依赖属... 为了在仅有正例和未标注样本的训练数据集下进行机器学习(positive unlabeled learning,PU学习),提出一种可用于PU学习的平均n依赖决策树(P-AnDT)分类算法。在构造决策树时,选取样本的n个属性作为依赖属性,在每个分裂属性上计算依赖属性和类别属性的共同影响;然后分别选用不同的输入属性作为依赖属性建立多个有差异的分类器并对结果求平均值,构造集成分类算法。最终通过估计正例在数据集中的比例参数p,使该算法能够在PU学习场景下进行分类。在多组UCI数据集上的实验结果表明,与基于贝叶斯假设的PU学习算法(PNB、PTAN等算法)相比,P-AnDT算法有更好更稳定的分类准确率。 展开更多
关键词 决策树 集成学习算法 PU学习理论 贝叶斯假设
在线阅读 下载PDF
基于异构集成学习的棉纱纱疵定量分析方法 被引量:2
12
作者 杨芸 孙通 +2 位作者 梁振宇 彭广 鲍劲松 《纺织学报》 EI CAS CSCD 北大核心 2023年第5期93-101,共9页
为解决当前棉纱纱疵定量分析方法精度低、可靠性差的问题,提出一种基于异构集成学习的纱疵定量分析方法。首先,建立基于电容传感器的纱疵检测二维动态仿真模型,分析纱疵尺寸对纱疵信号的影响规律。其次,针对非平稳、非线性的纱疵信号难... 为解决当前棉纱纱疵定量分析方法精度低、可靠性差的问题,提出一种基于异构集成学习的纱疵定量分析方法。首先,建立基于电容传感器的纱疵检测二维动态仿真模型,分析纱疵尺寸对纱疵信号的影响规律。其次,针对非平稳、非线性的纱疵信号难处理以及纱疵量化特征不明显的问题,采用时域分析方法,提取纱疵信号的时域参数作为纱疵定量分析特征,针对传统阈值和数值分析方法对纱疵定量精度低的问题,以支持向量机回归算法和径向基神经网络算法组成初级学习器,集成梯度提升决策树为元学习器,建立用于纱疵定量分析的异构集成学习算法模型。实验结果表明,本文方法比其它单模型回归拟合方法的检测准确率提升约10%,验证了本文方法对纱疵定量分析结果的可靠性。 展开更多
关键词 棉纱 纱疵 纱疵定量分析 纱疵信号 纱线质量 异构集成学习算法
在线阅读 下载PDF
非平衡集成迁移学习模型及其在桥梁结构健康监测中的应用 被引量:4
13
作者 于重重 吴子珺 +2 位作者 谭励 涂序彦 田蕊 《智能系统学报》 CSCD 北大核心 2013年第1期46-51,共6页
在桥梁结构健康监测与状态评估过程中所获得的桥梁结构数据库常存在间断性异常或缺损,且不同样本分类数据不均匀,难以在信息缺失、数据分布失衡的情况下完成对桥梁结构健康的监测与状态评估.针对这一问题,在改进相似性度量函数的SOM聚... 在桥梁结构健康监测与状态评估过程中所获得的桥梁结构数据库常存在间断性异常或缺损,且不同样本分类数据不均匀,难以在信息缺失、数据分布失衡的情况下完成对桥梁结构健康的监测与状态评估.针对这一问题,在改进相似性度量函数的SOM聚类算法和非平衡集成迁移学习算法的基础上,提出了一种改进的迁移学习模型.通过对实际监测数据的分析,该迁移学习模型的分类精度随着目标数据集所占比例的不断增加而提高,验证了该模型的有效性和科学性. 展开更多
关键词 非平衡集成迁移学习算法 SOM算法 迁移学习模型 桥梁结构健康监测
在线阅读 下载PDF
基于优化VMD和BiLSTM的短期负荷预测 被引量:3
14
作者 谢国民 陆子俊 《电力系统及其自动化学报》 北大核心 2025年第4期30-39,共10页
针对电力负荷数据周期性强、波动性高,预测效果不佳的问题,建立一种基于优化变分模态分解、改进沙猫群优化(improved sand cat swarm optimization,ISCSO)算法和双向长短时记忆(bidirectional long short-term memory,BiLSTM)网络的集... 针对电力负荷数据周期性强、波动性高,预测效果不佳的问题,建立一种基于优化变分模态分解、改进沙猫群优化(improved sand cat swarm optimization,ISCSO)算法和双向长短时记忆(bidirectional long short-term memory,BiLSTM)网络的集成预测模型。首先,对原始电力负荷数据进行变分模态分解,降低数据复杂度,在变分模态分解中,引入白鲸算法对分解层数和惩罚因子寻优,优化分解效果。其次,采用Logistic混沌映射、螺旋搜索和麻雀思想引入的多策略改进方法,增加原始沙猫群优化算法的种群多样性,提升收敛精度和全局搜索能力,并用改进后的算法对BiLSTM中的超参数进行优化。然后,结合AdaBoost集成学习算法构建ISCSO-Bi LSTM-AdaBoost预测模型,将分解后的各分量输入模型预测。最后将各预测值叠加,得到最终预测结果。实验结果表明,本文建立的组合模型预测精度高,稳定性强。 展开更多
关键词 电力负荷预测 变分模态分解 双向长短期记忆网络 改进沙猫群优化算法 集成学习算法
在线阅读 下载PDF
一种面向多类不平衡协议流量的改进AdaBoost.M2算法 被引量:4
15
作者 张仁斌 张杰 吴佩 《计算机应用研究》 CSCD 北大核心 2019年第6期1863-1867,共5页
针对AdaBoost.M2算法在解决多类不平衡协议流量的分类问题时存在不足,提出一种适用于因特网协议流量多类不平衡分类的集成学习算法RBWS-ADAM2,本算法在AdaBoost.M2每次迭代过程中设计了基于权重的随机平衡重采样策略对训练数据进行预处... 针对AdaBoost.M2算法在解决多类不平衡协议流量的分类问题时存在不足,提出一种适用于因特网协议流量多类不平衡分类的集成学习算法RBWS-ADAM2,本算法在AdaBoost.M2每次迭代过程中设计了基于权重的随机平衡重采样策略对训练数据进行预处理,该策略利用随机设置采样平衡点的重采样方式来更改多数类和少数类的样本数目占比,以构建多个具有差异性的训练集,并将样本权重作为样本筛选的依据,尽可能保留高权重样本,以加强对此类样本的学习。在国际公开的协议流量数据集上将RBWS-ADAM2算法与其他类似算法进行实验比较表明,相比于其他算法,该算法不仅对部分少数类的F-measure有较大提升,更有效提高了集成分类器的总体G-mean和总体平均F-measure,明显增强了集成分类器的整体性能。 展开更多
关键词 流量分类 集成学习算法 多类不平衡 泛化性能
在线阅读 下载PDF
基于改进AdaBoost的油井动液面自适应集成建模 被引量:10
16
作者 王通 段泽文 李琨 《电子测量与仪器学报》 CSCD 北大核心 2017年第8期1342-1348,共7页
针对单一模型软测量算法在动液面预测应用过程中存在泛化能力弱、自适应性差等问题,提出利用Ada Boost集成学习的思想,突出预测误差在建模样本权重及弱学习机权重中的作用,使之更加适合回归模型预测。针对油井工况动态多变导致软测量模... 针对单一模型软测量算法在动液面预测应用过程中存在泛化能力弱、自适应性差等问题,提出利用Ada Boost集成学习的思想,突出预测误差在建模样本权重及弱学习机权重中的作用,使之更加适合回归模型预测。针对油井工况动态多变导致软测量模型随生产进行逐渐失效的问题,提出利用油田生产过程中定期巡检的少量动液面数据评估原有集成模型,利用相似度原理在保留原有模型信息的基础上增加新信息,并在此基础上根据新样本权重更新弱学习机模型,集成为强学习机模型以动态适应新的油田生产工况。通过对油田生产现场实际数据验证结果表明,该方法对油田生产波动的自适应能力强,能够提高动液面软测量模型的泛化能力及预测精度。 展开更多
关键词 集成学习算法 自适应建模 误差率 动液面 泛化能力
在线阅读 下载PDF
基于Adaboost算法与规则匹配的垃圾评论识别 被引量:2
17
作者 昝红英 毕银龙 石金铭 《郑州大学学报(理学版)》 CAS 北大核心 2017年第1期24-28,共5页
从评论的文本特征及元数据特征两个角度提取特征,避免特征向量过于稀疏.提出了基于随机森林的Adaboost算法,以减弱商品评论数据集不平衡性的影响.部分垃圾评论特征比较显著,采用规则匹配进一步提高垃圾评论识别的召回率.通过在COAE2015... 从评论的文本特征及元数据特征两个角度提取特征,避免特征向量过于稀疏.提出了基于随机森林的Adaboost算法,以减弱商品评论数据集不平衡性的影响.部分垃圾评论特征比较显著,采用规则匹配进一步提高垃圾评论识别的召回率.通过在COAE2015任务4提供的数据集上进行实验,取得较好的识别效果,验证了所提方法的有效性. 展开更多
关键词 垃圾评论识别 随机森林 ADABOOST 集成学习算法
在线阅读 下载PDF
基于RF-EL融合算法的施工升降机可靠性模型研究 被引量:3
18
作者 王莉静 赵海盟 +1 位作者 戴远东 乐亮 《中国工程机械学报》 北大核心 2022年第4期371-376,共6页
针对施工升降机运行可靠性受人、机、管理等多种因素制约的问题,提出了一种基于随机森林和集成学习算法(EL)融合的可靠性分析模型。首先,根据施工升降机的运行工况和管理规范,选取影响施工升降机可靠性的相关因素,并基于随机森林算法(RF... 针对施工升降机运行可靠性受人、机、管理等多种因素制约的问题,提出了一种基于随机森林和集成学习算法(EL)融合的可靠性分析模型。首先,根据施工升降机的运行工况和管理规范,选取影响施工升降机可靠性的相关因素,并基于随机森林算法(RF)计算各相关因素的重要度值,约减不相关因素,构建可靠性分析指标体系;其次,以改进BP神经网络、优化支持向量机和贝叶斯算法构建基学习器,利用施工升降机运行的历史数据进行模型训练;最后,选择优化的集成学习策略,构建可靠性分析的EL模型,并进行训练和检测。通过对提出的施工升降机可靠性分析模型进行实例验证,训练集准确率为99.2%,测试集准确率为97.5%。结果表明:该集成融合模型具有较高的准确度,适用于施工升降机的实时可靠性分析。 展开更多
关键词 施工升降机 可靠性 随机森林 集成学习算法
在线阅读 下载PDF
基于ER Rule的多分类器汽车评论情感分类研究 被引量:1
19
作者 周谧 周雅婧 +1 位作者 贺洋 方必和 《运筹与管理》 CSSCI CSCD 北大核心 2024年第5期161-168,共8页
该文针对汽车评论语料的情感二分类问题,提出一种基于证据推理规则的多分类器融合的情感分类方法。在情感特征构建方面,通过实验对比不同特征模型对分类结果的影响,并改进传统的TFIDF权重计算方法。同时,在此基础上使用ER Rule融合不同... 该文针对汽车评论语料的情感二分类问题,提出一种基于证据推理规则的多分类器融合的情感分类方法。在情感特征构建方面,通过实验对比不同特征模型对分类结果的影响,并改进传统的TFIDF权重计算方法。同时,在此基础上使用ER Rule融合不同分类器进行文本情感极性分析,并考虑各分类器的权重和可靠度。最后,爬取汽车网站上的评论数据对上述方法进行测试,并用公开的中文酒店评论语料数据进行了验证,结果表明该方法能够有效集成不同分类器的优点,与传统机器学习分类算法相比,其结果在Recall,F1值和Accuracy三个指标上得到了提高,与目前流行的深度学习算法和集成学习算法相比,其结果总体占优。 展开更多
关键词 证据推理规则 多分类器融合 TFIDF权重 深度学习算法 集成学习算法
在线阅读 下载PDF
水工结构变形预测模型构建与解释 被引量:3
20
作者 胡江 苏荟 《水利水运工程学报》 CSCD 北大核心 2024年第2期125-134,共10页
现有基于机器学习算法的水工结构安全监控模型结果的可解释性较差。为提高安全监控模型的可解释性,发展一种基于集成学习算法的水工结构变形预测模型构建与解释方法。简述改进统计模型及随机森林(RF)、极端梯度提升树(XGBoost)两种常用... 现有基于机器学习算法的水工结构安全监控模型结果的可解释性较差。为提高安全监控模型的可解释性,发展一种基于集成学习算法的水工结构变形预测模型构建与解释方法。简述改进统计模型及随机森林(RF)、极端梯度提升树(XGBoost)两种常用的集成学习算法,引入沙普利值可加性解释(SHAP)方法实现集成学习算法模型结果的可解释性,阐述SHAP方法的原理和推导过程。以某运行初期特高拱坝变形数据为例验证方法的有效性和实用性。结果表明,XGBoost模型具有较高的预测精度,预测集决定系数大于0.982,改进统计模型精度次之,RF模型精度相对较低;SHAP方法可以分离不同自变量对效应量的影响大小,并能给出全局和局部的影响机制,实现模型拟合和预测结果的可解释性。提出的方法综合了“机理驱动”和“数据驱动”模型的优势,可为水工结构运行管理提供决策参考。 展开更多
关键词 水工结构 变形 安全监控 机器学习 集成学习算法 可解释性
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部