期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于RFECV特征选择和随机森林预测模型的应用与优化
1
作者 孙晶 《数字通信世界》 2024年第9期114-116,共3页
该文基于随机森林预测模型,提出RFECV特征选择方法:首先对特征变量进行独热编码,再利用RFECV内置的交叉验证评估各特征子集性能,以确定最佳特征数量,并递归消除低重要性特征。实验表明,该方法在随机森林上训练与预测更快,均方误差更低,... 该文基于随机森林预测模型,提出RFECV特征选择方法:首先对特征变量进行独热编码,再利用RFECV内置的交叉验证评估各特征子集性能,以确定最佳特征数量,并递归消除低重要性特征。实验表明,该方法在随机森林上训练与预测更快,均方误差更低,特征提取准确率高。 展开更多
关键词 随机森林预测模型 独热编码 归特征消除 交叉验证
在线阅读 下载PDF
基于改进型随机森林算法的页岩岩性识别——以准噶尔盆地芦草沟组为例
2
作者 秦志军 操应长 冯程 《新疆石油地质》 CAS CSCD 北大核心 2024年第5期595-603,共9页
在储集层岩性识别的应用中,特别是对页岩等非均质性较强的非常规储集层的岩性识别,机器学习算法的高效性、准确性和有效信息整合能力已经得到了充分验证。考虑到岩性识别的特征参数优选问题,优选自然伽马、T2几何平均值、结构指数、骨... 在储集层岩性识别的应用中,特别是对页岩等非均质性较强的非常规储集层的岩性识别,机器学习算法的高效性、准确性和有效信息整合能力已经得到了充分验证。考虑到岩性识别的特征参数优选问题,优选自然伽马、T2几何平均值、结构指数、骨架密度指数、密度和深侧向电阻率,采用结合递归特征消除的随机森林算法,对准噶尔盆地中二叠统芦草沟组页岩储集层的主要岩性进行识别;利用传统的随机森林算法和支持向量机法,对同一套资料进行岩性预测,并与岩石薄片鉴定结果对比。结合递归特征消除的随机森林算法只需选择一半的测井参数,便能够达到更好的效果,而且通过优选特征参数,缩短了算法的运行时间。因此,结合递归特征消除的随机森林算法能够实现测井特征参数的优选,提高页岩岩性识别的准确率,缩短运行时间,为复杂岩性识别和多参数选择提供了新的思路。 展开更多
关键词 随机森林算法 归特征消除 特征选择 中二叠统 芦草沟组 页岩储集层 岩性识别
在线阅读 下载PDF
结合遥感林龄因子的亚热带森林蓄积量估算方法 被引量:6
3
作者 周小成 黄婷婷 +4 位作者 李媛 肖祥希 朱洪如 陈芸芝 冯芝淸 《林业科学》 EI CAS CSCD 北大核心 2023年第4期88-99,共12页
【目的】应用XGBoost算法建立包含林龄的遥感因子-蓄积量模型,评价遥感估算的林龄因子与遥感因子相结合提高森林蓄积量估算精度的有效性,为实现高效、快速、精准的大范围森林蓄积量估算提供一种新的思路和方法。【方法】以福建省将乐县... 【目的】应用XGBoost算法建立包含林龄的遥感因子-蓄积量模型,评价遥感估算的林龄因子与遥感因子相结合提高森林蓄积量估算精度的有效性,为实现高效、快速、精准的大范围森林蓄积量估算提供一种新的思路和方法。【方法】以福建省将乐县为研究示范区,首先,基于1987—2016年时序Landsat影像,采用LandTrendr森林干扰与恢复监测算法监测年度林分更替干扰并估算干扰区林龄;然后,基于GF-1号影像光谱、纹理、地形等特征,采用递归特征消除的随机森林算法(RFE-RF)估算非干扰区林龄;在此基础上,结合GF-1影像光谱、纹理因子和森林资源二类调查小班实测蓄积量数据,采用极端梯度提升算法估算研究区森林蓄积量。对比有无林龄因子的森林蓄积量估算精度,进一步验证遥感林龄因子对提高森林蓄积量估算精度的重要性。【结果】采用LandTrendr森林干扰与恢复监测算法获得的干扰区林分林龄误差仅1~2年,林龄估算精度明显优于传统利用遥感因子估算的林龄精度(误差4~12年)。仅采用常规遥感因子估算森林蓄积量时,XGBoost模型决定系数(R^(2))为0.59,平均均方根误差(RMSE)为30.72 m^(3)·hm^(-2),相对均方根误差(rRMSE)为16.46%;加入林龄因子后,模型R^(2)提高至0.73,平均RMSE减少至23.73 m^(3)·hm^(-2),rRMSE为13.26%,森林蓄积量估算平均总体精度约提高10.4%,达84.4%。【结论】相比仅采用常规遥感因子估算森林蓄积量,应用XGBoost算法建立包含林龄的遥感因子-蓄积量模型,其估算精度接近森林资源调查相关规定要求,可为大范围亚热带森林资源快速调查评估提供重要技术支持。 展开更多
关键词 森林蓄积量 林龄 时序遥感 递归特征消除的随机森林 极端梯度提升算法
在线阅读 下载PDF
基于特征选择的方言辨别模型
4
作者 艾虎 李菲 《信息技术》 2024年第10期102-110,119,共10页
为了从语音样本中选择数量最少的相关特征变量,并让基于随机森林(RF)的贵州汉语方言辨别模型达到所需的精度。该研究采用基于随机森林的差异排序向后消除法(SDBE),利用Python 3.6,对贵州3个市县群的汉语方言语音样本进行特征选择,并与... 为了从语音样本中选择数量最少的相关特征变量,并让基于随机森林(RF)的贵州汉语方言辨别模型达到所需的精度。该研究采用基于随机森林的差异排序向后消除法(SDBE),利用Python 3.6,对贵州3个市县群的汉语方言语音样本进行特征选择,并与其他先进的特征选择方法进行比较,最后对随机森林分类模型进行改进。结果显示,该方法从39个特征变量中选取了8个最相关的梅尔频率倒谱系数(MFCC),显著优于与之比较的特征选择方法。经过改进的随机森林模型分类精确度为96.64%。该研究采用的特征选择算法和改进的随机森林模型,让方言辨别模型的性能得到显著提升。 展开更多
关键词 汉语方言辨识 梅尔频率倒谱系数 特征选择 随机森林 向后消除
在线阅读 下载PDF
基于Sentinel数据的临海市森林地上生物量估测
5
作者 曹依林 吴达胜 方陆明 《浙江林业科技》 2022年第5期40-49,共10页
为探究多源数据融合以及机器学习方法在森林地上生物量(Above-ground Biomass,AGB)的估测潜力,分析影响不同林分AGB的主要因素,以浙江省台州市临海市为研究区,提取Sentinel-2光学遥感影像的光谱信息、植被指数、纹理特征因子和Sentinel-... 为探究多源数据融合以及机器学习方法在森林地上生物量(Above-ground Biomass,AGB)的估测潜力,分析影响不同林分AGB的主要因素,以浙江省台州市临海市为研究区,提取Sentinel-2光学遥感影像的光谱信息、植被指数、纹理特征因子和Sentinel-1 SAR的后向散射系数,融合森林资源二类调查数据和数字高程模型数据,基于递归特征消除的特征选择方法筛选主要特征,基于随机森林(Random Forest,RF)、自适应提升(AdaBoost)法和类别提升(CatBoost)法三种方法建立不同林分AGB估测模型,以决定系数(R-squared,R^(2))、均方根误差(Root Mean Square Error,RMSE)来评估模型性能。结果表明,从特征组合来看,集成光学遥感、雷达遥感、地形因子及二类调查数据能够更全面地利用多源数据的信息,有效提高森林AGB的估测精度;递归特征消除法降低了模型的复杂度,消除了自变量之间的共线性,能在保持甚至提高模型估测精度的前提下,加快模型训练速度;从6种林分的AGB的估测结果来看,6种林分的AGB的主要影响因素与个数不尽相同,这也缘于不同树种有不同生物学和生态学特点,当然有3个因子是共同的,即年龄、郁闭度和海拔;3种算法中,CatBoost优于RF,RF优于AdaBoost,CatBoost方法的性能指标为:阔叶混交林R^(2)=0.78,RMSE=7.26 t·hm^(-2);针阔混交林R^(2)=0.72,RMSE=11.94 t·hm^(-2);针叶混交林R^(2)=0.60,RMSE=12.65 t·hm^(-2);其他硬阔林R^(2)=0.82,RMSE=9.22 t·hm^(-2);马尾松林R^(2)=0.74,RMSE=10.12 t·hm^(-2);杉木林R^(2)=0.75,RMSE=8.93 t·hm^(-2);基于RFE的CatBoost的方法模型总体平均估测精度(P)超过80%。以上结果表明,Sentinel光学影像与SAR融合可以为森林AGB估测提供更多有效的特征因子;递归特征消除法结合CatBoost方法用于区域尺度上森林AGB的估测,精度更高,且能有效降低模型复杂度,加快训练速度;不同林分的AGB的主要影响因素与个数不尽相同,但年龄、郁闭度、海拔3个因素是它们的共同影响因素。 展开更多
关键词 森林地上生物量 Sentinel-1 Sentinel-2 随机森林 自适应提升法 类别提升法 归特征消除
在线阅读 下载PDF
基于RF-RFE算法的地铁车站洪涝灾害预测研究 被引量:3
6
作者 白莲 刘平 《铁道标准设计》 北大核心 2024年第3期192-197,207,共7页
地铁车站形式以地下段为主,进入雨期时受到洪涝灾害的威胁,易发生雨水倒灌现象,严重影响居民出行和地铁安全运营。为进一步提高地铁车站洪涝灾害预测的效果,提出基于RF-RFE和DNN神经网络的地铁车站洪涝灾害预测方法。首先,通过收集并分... 地铁车站形式以地下段为主,进入雨期时受到洪涝灾害的威胁,易发生雨水倒灌现象,严重影响居民出行和地铁安全运营。为进一步提高地铁车站洪涝灾害预测的效果,提出基于RF-RFE和DNN神经网络的地铁车站洪涝灾害预测方法。首先,通过收集并分析已发生地铁车站洪涝灾害的案例,采用文献综述结合专家访谈的方法,构建地铁车站洪涝灾害初始变量集;然后,利用随机森林—递归特征消除(RF-RFE)算法,计算初始变量重要性并完成变量分类正确率排序,从初始变量集中筛选出重要变量;最后,建立DNN神经网络预测模型,并以筛选出的重要变量作为输入样本,训练DNN神经网络,完成对地铁车站洪涝灾害的预测。研究结果表明:(1)变量选择可提高预测模型精度,与初始变量集的DNN神经网络预测模型相比,数据筛选后的DNN神经网络预测模型准确率提高了4.36%;(2)RF-RFE和DNN神经网络算法结合具有良好的效果,预测模型准确率为88.1%,F1分数为0.9。 展开更多
关键词 地铁车站 随机森林(RF)算法 归特征消除(RFE) 洪涝灾害 神经网络
在线阅读 下载PDF
基于改进的LightGBM算法的心脏病预测方法
7
作者 崔春燕 李宏滨 《信息技术与信息化》 2024年第9期39-42,共4页
为了优化心脏病预测模型,选取比较流行的UCI心脏病数据集为研究对象,提出基于随机森林-递归特征消除法(RF-RFE)和LightGBM的混合算法——RF-RFE-LightGBM作为心脏病预测方法。其中,利用RF-RFE算法提取较重要的特征,去除对预测结果影响... 为了优化心脏病预测模型,选取比较流行的UCI心脏病数据集为研究对象,提出基于随机森林-递归特征消除法(RF-RFE)和LightGBM的混合算法——RF-RFE-LightGBM作为心脏病预测方法。其中,利用RF-RFE算法提取较重要的特征,去除对预测结果影响较小的特征,针对优化后的特征建立LightGBM模型进行预测,采用主流的模型评价指标进行评估。实验结果表明,RF-RFE-LightGBM算法的准确率、精度、召回率、F1值、AUC值分别为0.917 1、0.905 6、0.932 0、0.918 6和0.920 3,相比于其他算法建立的模型综合性能更优,具有一定的优势。 展开更多
关键词 随机森林 归特征消除 UCI数据集 LightGBM 心脏病预测
在线阅读 下载PDF
基于流量异常分析多维优化的入侵检测方法 被引量:16
8
作者 刘新倩 单纯 +2 位作者 任家东 王倩 郭嘉伟 《信息安全学报》 CSCD 2019年第1期14-26,共13页
入侵检测系统在检测和预防各种网络异常行为的过程中,海量和高维的流量数据使其面临着低准确率和高误报率的问题。本文提出一种基于流量异常分析多维优化的入侵检测方法,该方法在入侵检测数据的横向维度和纵向维度两个维度进行优化。在... 入侵检测系统在检测和预防各种网络异常行为的过程中,海量和高维的流量数据使其面临着低准确率和高误报率的问题。本文提出一种基于流量异常分析多维优化的入侵检测方法,该方法在入侵检测数据的横向维度和纵向维度两个维度进行优化。在横向维度优化中,对数量较多的类别进行数据抽样,并采用遗传算法得到每个类别的最佳抽样比例参数,完成数据的均衡化。在纵向维度优化中,结合特征与类别的相关分析,采用递归特征添加算法选择特征,并提出平均召回率指标评估特征选择效果,实现训练集的低维高效性。基于优化的入侵检测数据,进一步通过训练数据集得到随机森林分类器,在真实数据集UNSW_NB15评估和验证本文提出的算法。与其他算法相比,本文算法具有高准确率和低误报率,并在攻击类型上取得了有效的召回率。 展开更多
关键词 入侵检测框架 多维优化 数据抽样 归特征添加算法 遗传算法参数优化 随机森林
在线阅读 下载PDF
基于RF-RFECV和PSO-SVM的化工过程故障诊断方法 被引量:3
9
作者 张伟 王连彪 张广帅 《青岛科技大学学报(自然科学版)》 CAS 2022年第5期101-108,共8页
针对复杂化工生产过程数据多样性、高维性以及耦合性的特点,提出一种基于交叉验证递归特征消除算法(RFECV)、粒子群优化算法(PSO),并结合随机森林(RF)和支持向量机(SVM)的故障诊断方法。首先利用RF-RFECV方法对混合运行数据进行K折交叉... 针对复杂化工生产过程数据多样性、高维性以及耦合性的特点,提出一种基于交叉验证递归特征消除算法(RFECV)、粒子群优化算法(PSO),并结合随机森林(RF)和支持向量机(SVM)的故障诊断方法。首先利用RF-RFECV方法对混合运行数据进行K折交叉验证学习与重要性排序,抽取并重构故障特征信息;将预处理后的数据作为输入样本,利用PSO与序列最小优化算法(SMO)搜索超参数得到最佳SVM分类器,实现故障诊断。应用于田纳西-伊斯曼(Tennessee Eastman, TE)过程的仿真实验结果表明:RF-RFECV与PSO-SVM融合故障诊断方法泛化能力强、诊断准确率高,识别准确率可达到99.5%以上。 展开更多
关键词 粒子群优化算法 交叉验证归特征消除算法 随机森林 支持向量机 田纳西-伊斯曼过程
在线阅读 下载PDF
减压馏分黏度指数的近红外预测研究 被引量:3
10
作者 任小甜 褚小立 +1 位作者 田松柏 朱新宇 《石油炼制与化工》 CAS CSCD 北大核心 2019年第1期81-84,共4页
为了实现减压馏分油(VGO)黏度指数的快速预测,以70个VGO样品的近红外光谱及黏度指数数据为基础,利用随机森林回归算法建立了黏度指数的近红外预测模型。以随机森林算法中对各特征的重要性度量为依据,通过递归特征消除法对近红外光谱进... 为了实现减压馏分油(VGO)黏度指数的快速预测,以70个VGO样品的近红外光谱及黏度指数数据为基础,利用随机森林回归算法建立了黏度指数的近红外预测模型。以随机森林算法中对各特征的重要性度量为依据,通过递归特征消除法对近红外光谱进行波长变量选择。优选出10个波长变量作为模型的输入特征,利用10折交叉验证法确定模型的超参数(回归树数量n_t为150和节点分裂的特征数n_v为5),构建一个更加稳健的随机森林预测模型。对于7个预测集的样本,其黏度指数的预测标准偏差RMSEP为2.28,决定系数R^2为0.98,表明模型具有较高的准确度和泛化能力。 展开更多
关键词 减压馏分 黏度指数 预测 近红外光谱 归特征消除 随机森林算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部