期刊文献+
共找到135篇文章
< 1 2 7 >
每页显示 20 50 100
基于粒子群优化后随机森林模型的管道内腐蚀风险预测 被引量:2
1
作者 肖雯雯 葛鹏莉 +6 位作者 胡广强 吕瑶 龙武 刘青山 郜双武 曲志豪 张雷 《腐蚀与防护》 北大核心 2025年第2期59-65,共7页
基于塔河油田历史失效数据,使用Pearson相关性分析和灰色关联度分析确定管道内腐蚀主控因素,并将其作为模型输入变量,腐蚀速率作为输出变量,建立随机森林(RF)腐蚀预测模型。为提高预测精度,使用粒子群优化(PSO)算法对RF模型的超参数进... 基于塔河油田历史失效数据,使用Pearson相关性分析和灰色关联度分析确定管道内腐蚀主控因素,并将其作为模型输入变量,腐蚀速率作为输出变量,建立随机森林(RF)腐蚀预测模型。为提高预测精度,使用粒子群优化(PSO)算法对RF模型的超参数进行优化。结果表明:塔河油田输油管道内腐蚀主控因素为CO_(2)分压、温度、Cl^(-)含量和H_(2)S分压;经PSO优化后RF模型的决定系数R~2为0.97,均方根误差为0.161,平均绝对误差为0.027,均优于其他3种模型。因此,PSO优化后RF模型能够准确预测管道的腐蚀速率,为油气田管道的腐蚀预警和防护提供依据和支持。 展开更多
关键词 CO_(2)-H_(2)S腐蚀 机器学习 随机森林(rf) 粒子群优化(PSO) 腐蚀速率
在线阅读 下载PDF
支持在线学习的增量式极端随机森林分类器 被引量:58
2
作者 王爱平 万国伟 +1 位作者 程志全 李思昆 《软件学报》 EI CSCD 北大核心 2011年第9期2059-2074,共16页
提出了一种增量式极端随机森林分类器(incremental extremely random forest,简称IERF),用于处理数据流,特别是小样本数据流的在线学习问题.IERF算法中新到达的样本将被存储到相应的叶节点,并通过Gini系数来确定是否对当前叶节点进行分... 提出了一种增量式极端随机森林分类器(incremental extremely random forest,简称IERF),用于处理数据流,特别是小样本数据流的在线学习问题.IERF算法中新到达的样本将被存储到相应的叶节点,并通过Gini系数来确定是否对当前叶节点进行分裂扩展,在给定有限数量,甚至是少量样本的情况下,IERF算法能够快速高效地完成分类器的增量构造.UCI数据集的实验证明,提出的IERF算法具有与离线批量学习的极端随机森林(extremely random forest,简称ERF)算法相当甚至更优的性能,在适度规模的样本集上,性能优于贪婪决策树重构算法和其他几种主要的增量学习算法.最后,提出的IERF算法被应用于解决视频在线跟踪(包含多目标跟踪)问题,基于多个真实视频数据的实验充分验证了算法的有效性和稳定性. 展开更多
关键词 在线学习 增量学习 极端随机森林分类器
在线阅读 下载PDF
基于随机森林的分类器在犯罪预测中的应用研究 被引量:29
3
作者 孙菲菲 曹卓 肖晓雷 《情报杂志》 CSSCI 北大核心 2014年第10期148-152,共5页
犯罪预测一直是公安部门亟待解决的突出问题。基于随机森林这种模型组合分类器,结合机器学习技术在犯罪预测中的应用现状,提出了一种用于预测犯罪的新的分类方法,并通过模拟实验来展示这种分类方法比一般的随机森林分类会有更高的可信... 犯罪预测一直是公安部门亟待解决的突出问题。基于随机森林这种模型组合分类器,结合机器学习技术在犯罪预测中的应用现状,提出了一种用于预测犯罪的新的分类方法,并通过模拟实验来展示这种分类方法比一般的随机森林分类会有更高的可信度。创新之处在于提出的这种随机森林分类器的每一棵树都是退化的决策树,并且根据在线学习的结果在下一轮的分类中选择区分度更高的决策树。最终给出一个应用于犯罪预测的较为成功的分类器的思路和模式,得出准确有效的预测结论。 展开更多
关键词 随机森林 机器学习 分类器 犯罪预测 决策树 数据挖掘
在线阅读 下载PDF
结合时-频纹理特征的随机森林分类器应用于鸟声识别 被引量:14
4
作者 陈莎莎 李应 《计算机应用与软件》 CSCD 北大核心 2014年第1期154-157,161,共5页
研究一个基于时频纹理特征和随机森林分类器的抗噪鸟声识别系统。首先,针对实际环境中,各种不可预料的噪音会使得系统识别性能严重下降的问题,使用一种基于噪声估计的音频增强算法对带噪鸟声信号进行前端处理。然后将增强后的信号功率... 研究一个基于时频纹理特征和随机森林分类器的抗噪鸟声识别系统。首先,针对实际环境中,各种不可预料的噪音会使得系统识别性能严重下降的问题,使用一种基于噪声估计的音频增强算法对带噪鸟声信号进行前端处理。然后将增强后的信号功率谱以时频图形式输出,并根据时频图中所包含的纹理信息,利用基于灰度共生矩阵的纹理分析法进行纹理特征提取。最后使用基于决策树的组合分类器—随机森林进行分类和识别。实验结果表明,该方法不仅能对鸟类声音进行快速准确地识别而且具有良好的抗噪性。 展开更多
关键词 生态声音 音频增强 时频纹理 灰度共生矩阵 随机森林分类器
在线阅读 下载PDF
改进的随机森林分类器网络入侵检测方法 被引量:44
5
作者 夏景明 李冲 +1 位作者 谈玲 周刚 《计算机工程与设计》 北大核心 2019年第8期2146-2150,共5页
目前网络入侵检测方法大多基于改进的机器学习算法,但是机器学习算法会出现过拟合情况,导致入侵检测准确率降低。为解决该问题,提出一种改进的随机森林分类器网络入侵检测方法,通过高斯混合模型聚类算法将数据分成不同的簇,为每一个簇... 目前网络入侵检测方法大多基于改进的机器学习算法,但是机器学习算法会出现过拟合情况,导致入侵检测准确率降低。为解决该问题,提出一种改进的随机森林分类器网络入侵检测方法,通过高斯混合模型聚类算法将数据分成不同的簇,为每一个簇训练不同的随机森林分类器,通过这些训练好的随机森林分类器进行网络入侵检测。训练和实验数据采用NSL-KDD网络入侵数据集,实施中首先根据属性比率数据特征提取方法进行数据处理,然后进行高斯混合聚类,最后使用随机森林分类器对聚类结果进行训练。实验结果表明,该方法相比其它机器学习算法具有更高的入侵检测准确率。 展开更多
关键词 网络安全入侵检测 机器学习 随机森林分类器 高斯混合聚类 属性比特征提取 网络入侵检测数据集
在线阅读 下载PDF
基于深度优先随机森林分类器的目标检测 被引量:9
6
作者 马娟娟 潘泉 +3 位作者 梁彦 胡劲文 赵春晖 王华夏 《中国惯性技术学报》 EI CSCD 北大核心 2018年第4期518-523,共6页
从机载视觉传感器获取的图像中检测近距离目标,对小型无人机飞行安全非常重要,需要大量样本训练分类器以提高目标检测的准确性。然而,如果训练样本太大,随着树的层数增加,广度优先方法训练随机森林分类器会导致欠拟合问题。针对这个问题... 从机载视觉传感器获取的图像中检测近距离目标,对小型无人机飞行安全非常重要,需要大量样本训练分类器以提高目标检测的准确性。然而,如果训练样本太大,随着树的层数增加,广度优先方法训练随机森林分类器会导致欠拟合问题。针对这个问题,提出了深度优先方法递归训练随机森林分类器,每次递归过程只分裂一个节点。实验表明,在SenseAndAvoid数据集目标检测的平均准确率是69.3%,比广度优先方法训练的随机森林分类器高7.6%。深度优先方法递归训练随机森林分类器,能有效抑制广度优先方法训练时的欠拟合问题,提高了随机森林分类器的泛化能力和目标检测的准确性。 展开更多
关键词 无人机 目标检测 深度优先 随机森林分类器
在线阅读 下载PDF
植物抗性基因识别中的随机森林分类方法 被引量:15
7
作者 郭颖婕 刘晓燕 +1 位作者 郭茂祖 邹权 《计算机科学与探索》 CSCD 2012年第1期67-77,共11页
为了解决传统基于同源序列比对的抗性基因识别方法中假阳性高、无法发现新的抗性基因的问题,提出了一种利用随机森林分类器和K-Means聚类降采样方法的抗性基因识别算法。针对目前研究工作中挖掘盲目性大的问题,进行两点改进:引入了随机... 为了解决传统基于同源序列比对的抗性基因识别方法中假阳性高、无法发现新的抗性基因的问题,提出了一种利用随机森林分类器和K-Means聚类降采样方法的抗性基因识别算法。针对目前研究工作中挖掘盲目性大的问题,进行两点改进:引入了随机森林分类器和188维组合特征来进行抗性基因识别,这种基于样本统计学习的方法能够有效地捕捉抗性基因内在特性;对于训练过程中存在的严重类别不平衡现象,使用基于聚类的降采样方法得到了更具代表性的训练集,进一步降低了识别误差。实验结果表明,该算法可以有效地进行抗性基因的识别工作,能够对现有实验验证数据进行准确的分类,并在反例集上也获得了较高的精度。 展开更多
关键词 随机森林 分类器 抗性基因 聚类 降采样
在线阅读 下载PDF
物候特征辅助下的随机森林宏观尺度土地覆盖分类方法研究 被引量:16
8
作者 李治 杨晓梅 +1 位作者 孟樊 范文义 《遥感信息》 CSCD 2013年第6期48-55,共8页
通过遥感技术获取大范围土地覆盖信息对于监测、理解和预测自然资源具有重要的科学意义。MODIS数据是当今宏观尺度土地覆盖研究的主要数据源。本文以河北省为研究区,应用MOD13Q1数据产品,构建MODIS NDVI时间序列,从中反演物候特征作为... 通过遥感技术获取大范围土地覆盖信息对于监测、理解和预测自然资源具有重要的科学意义。MODIS数据是当今宏观尺度土地覆盖研究的主要数据源。本文以河北省为研究区,应用MOD13Q1数据产品,构建MODIS NDVI时间序列,从中反演物候特征作为参与分类的主要辅助信息,并采用随机森林分类方法进行宏观尺度土地覆被分类实验,并与单决策树(CART)进行对比分析。实验结果表明,物候特征辅助下的随机森林宏观尺度土地覆被分类方法的总体精度为87.2%,Kappa系数为0.83,比CART单一决策树精度提高了17.9%;应用物候特征参与分类,使得总体精度提高2.6%;其中,旱地和建筑用地精度分别提高了6.7%和11.9%。 展开更多
关键词 随机森林 组合分类器 NDVI时间序列 物候学 土地覆盖 MODIS
在线阅读 下载PDF
基于RBF-RF级联分类器电子鼻对中药的快速鉴别 被引量:3
9
作者 邹慧琴 李硕 +5 位作者 闫永红 刘勇 赵婷 韩玉 苏玉贞 彭莲 《世界科学技术-中医药现代化》 北大核心 2013年第9期1876-1881,共6页
目的:将电子鼻引入中药研究领域,探讨其在实际应用中的难点并提出解决方案,建立优化判别模型,为中药鉴别提供一种简便、快速、有效的分析方法,同时为气敏传感器的研发及应用提供新思路。方法:采用电子鼻提取中药气味特征,基于MOS传感器... 目的:将电子鼻引入中药研究领域,探讨其在实际应用中的难点并提出解决方案,建立优化判别模型,为中药鉴别提供一种简便、快速、有效的分析方法,同时为气敏传感器的研发及应用提供新思路。方法:采用电子鼻提取中药气味特征,基于MOS传感器的离子迁移谱,建立中药气味指纹图谱。以传感器最大响应值为分析指标,针对鉴别难点,提出两种解决方案:尝试不同检测器,即扩充传感器数量,尽量缩小"嗅觉盲区";采用"级联分类器"构建法,即采用径向基函数(RBF)与随机森林(RF)二级级联分类器构建判别模型。通过十折交叉验证和外部测试集验证对所建模型进行系统性能的评估。结果:两种方案准确、可行,具有较高的正判率和较好的泛化能力(所得最高正判率分别为95%和100%、96%和80%)。结论:本研究首次采用"级联分类器"模式构建中药电子鼻鉴别的判别模型,在传感器数量有限的情况下,从所得数据中挖掘最大信息量;以"拆分任务、剥离难点、由易到难、分级递进"为原则,实现电子鼻对中药的快速、准确鉴别。所建模式识别法在可操作性、鉴别准确率和稳定性上均优于传统嗅觉识别法,为中药鉴别提供一种简便、快速的分析方法。 展开更多
关键词 电子鼻级联分类器 中药鉴别 径向基函数 随机森林
在线阅读 下载PDF
基于随机森林和最近邻插值法的交通流量数据修复方法
10
作者 汤伟 漆苏应 +1 位作者 杨晓东 李国强 《科学技术与工程》 北大核心 2024年第32期14056-14065,共10页
针对目前传感器在采集数据过程中由于受到天气或者自身设备故障等原因,造成数据缺失或者数据异常,导致不能从采集的数据中获得准确的交通变化规律等问题,分别提出基于改进最近邻插值算法和基于随机森林插补的交通流量数据缺失修复模型... 针对目前传感器在采集数据过程中由于受到天气或者自身设备故障等原因,造成数据缺失或者数据异常,导致不能从采集的数据中获得准确的交通变化规律等问题,分别提出基于改进最近邻插值算法和基于随机森林插补的交通流量数据缺失修复模型。由于交通数据缺失场景和缺失类型以及时空关联的差异性,将数据缺失类型划分为简单随机缺失和复杂连续缺失两种;利用改进的最近邻插值算法建立模型处理简单随机缺失,建立随机森林模型进行迭代插补处理复杂连续缺失;面对两种不同的数据缺失类型,利用期望最大化算法、深度信念网络、季节性差分自回归滑动平均模型分别搭建模型对比交叉验证改进的最近邻插值算法和随机森林插补方法。数据来源于美国加利福尼亚州PeMS(performance measurement system)实时采集的2022年6月1日—2022年7月31日以5 min为采样时间间隔的交通流量数据,为了模拟数据的缺失状况,将完整数据按照一定比例进行缺失,来模拟数据缺数的情况,得到简单随机缺失和复杂连续缺失分布的交通流量缺失数据集。结果表明:本实验在不同的缺失比例下均有良好的表现,通过设计不同的缺失比例和类型,各项评估指标均有明显优势,验证了两种数据缺失填充模型的有效性。 展开更多
关键词 智能交通 缺失数据修复 随机森林(rf) 最近邻插值算法 交通运营管理
在线阅读 下载PDF
基于DBSCAN-RF洪水分类的洪水预报应用研究 被引量:4
11
作者 甘甜 郑英 +3 位作者 蒋云钟 赵红莉 贺君彦 段浩 《水利水电技术(中英文)》 北大核心 2024年第3期77-89,共13页
【目的】洪水分类预报能有效提高洪水预报准确性,为防灾减灾工作提供科学依据。【方法】针对分类因子和分类算法优选问题,以海河流域徒骇河宫家闸上游为例进行研究,(1)充分考虑产汇流影响因素与洪水特征,选取洪峰流量、洪水总量、时段... 【目的】洪水分类预报能有效提高洪水预报准确性,为防灾减灾工作提供科学依据。【方法】针对分类因子和分类算法优选问题,以海河流域徒骇河宫家闸上游为例进行研究,(1)充分考虑产汇流影响因素与洪水特征,选取洪峰流量、洪水总量、时段洪量、洪水历时、起历时、落历时、峰度、偏度、涨水仰角、落水仰角、C_(s)、C_(v)、前3 d面雨量、前10 d面雨量、累计面雨量及最大面雨量等16维分类因子,使用主成分投影法(Principal Component Analysis,PCA)对分类因子降维提高计算效率;(2)基于密度聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)-随机森林(Random Forest,RF)算法进行洪水分类,减少对分类先验知识的依赖,提高了分类精度;(3)在徒骇河流域进行了方法应用,选择适用于半干旱半湿润地区的超渗-蓄满同时作用的产流模型及单位线汇流模型进行洪水分类预报研究,分别针对各类洪水进行模型率定。【结果】结果表明:轮廓系数为0.7015,表明DBSCAN算法聚类效果理想,基于RF算法的洪水分类准确率为91.67%,分类效果理想;经洪水分类预报,NSE系数均高于0.8,分类预报结果优于直接预报。【结论】结果说明:基于DBSCAN-RF洪水分类的洪水预报能较好地反映研究区域洪水演进过程,为研究区域洪水预报及防灾减灾工作提供依据。 展开更多
关键词 历史洪水 洪水分类 洪水预报 密度聚类(DBSCAN) 随机森林(rf)
在线阅读 下载PDF
基于改进特征筛选的随机森林算法对锂渣混凝土强度的预测研究 被引量:2
12
作者 魏令港 黄靓 曾令宏 《材料导报》 EI CAS CSCD 北大核心 2024年第9期156-161,共6页
本工作提出了特征变量筛选结合特征变量相关性的方法,对构建的锂渣混凝土28 d抗压强度数据库进行优化,分别建立了随机森林模型和深度神经网络模型用于测试数据库,并以相关系数(R)、均方根误差(RMSE)和平均相对误差(MAE)三个指标对模型... 本工作提出了特征变量筛选结合特征变量相关性的方法,对构建的锂渣混凝土28 d抗压强度数据库进行优化,分别建立了随机森林模型和深度神经网络模型用于测试数据库,并以相关系数(R)、均方根误差(RMSE)和平均相对误差(MAE)三个指标对模型的预测结果进行对比分析。结果表明,预测锂渣混凝土的28 d抗压强度时,采取改进的特征变量筛选方法能够有效提高模型的预测效果,此外,特征变量筛选的前后随机森林(RF)模型的预测效果明显优于深度神经网络(DNN)模型。 展开更多
关键词 随机森林(rf) 深度神经网络(DNN) 特征变量筛选 锂渣混凝土 抗压强度
在线阅读 下载PDF
基于随机森林的高速公路变路径偷逃费行为识别 被引量:1
13
作者 邹杰 曹宏禄 +2 位作者 李平安 黄诗音 赵建东 《科学技术与工程》 北大核心 2024年第36期15694-15700,共7页
为提高高速公路变路径偷逃费行为识别效率,针对改变路径偷逃费行为进行研究,建立一种基于随机森林的高速公路变路径偷逃费行为识别模型,能够有效识别该类偷逃费行为,协助高速公路相关管理部门追缴偷逃费用。首先,分析原始收费数据,筛选... 为提高高速公路变路径偷逃费行为识别效率,针对改变路径偷逃费行为进行研究,建立一种基于随机森林的高速公路变路径偷逃费行为识别模型,能够有效识别该类偷逃费行为,协助高速公路相关管理部门追缴偷逃费用。首先,分析原始收费数据,筛选出与本次研究相关的字段,经过运算得到12个模型可输入的初始特征;然后,通过计算各个特征的方差膨胀因子(variance inflation factor,VIF)和容忍度(tolerance,TOL)值来剔除存在共线性的特征,并利用Boruta算法筛选高重要性特征(“行驶方向是否一致”“入出站是否一致”“通行时间”和“最小费额里程”);其次,使用SMOTETomek综合采样技术来平衡数据集;再其次,利用网格搜索法对随机森林进行超参数调优;最后,利用所建立模型进行训练和识别,并与基准模型的识别效果进行对比。结果表明:所建立模型能够更好地对高速公路变路径偷逃费行为进行识别,Macro-F1分数达到了0.966,优于极限梯度提升(extreme gradient boost,XGBoost)(0.9431)、决策树(decision tree,DT)(0.9563)和梯度提升决策树(gradient boosting decision trees,GBDT)(0.9382),能够为运营管理部门稽查该类偷逃费车辆提供参考。 展开更多
关键词 随机森林(rf) 改变路径偷逃费 Boruta算法 数据不平衡处理
在线阅读 下载PDF
基于随机森林算法的Android恶意行为识别与分类方法 被引量:13
14
作者 柯懂湘 潘丽敏 +1 位作者 罗森林 张寒青 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第10期2013-2023,共11页
针对当前Android恶意软件检测方法对检测出的恶意行为无法进行识别和分类的问题,提出基于随机森林(RF)算法的Android恶意行为的识别与分类方法.该方法在对Android恶意软件的类型进行定义的基础上,利用融合多种触发机制的Android恶意行... 针对当前Android恶意软件检测方法对检测出的恶意行为无法进行识别和分类的问题,提出基于随机森林(RF)算法的Android恶意行为的识别与分类方法.该方法在对Android恶意软件的类型进行定义的基础上,利用融合多种触发机制的Android恶意行为诱导方法触发软件的潜在恶意行为;通过Hook关键系统函数对Android软件行为进行采集并生成行为日志,基于行为日志提取软件行为特征集;使用随机森林算法,对行为日志中的恶意行为进行识别与分类.实验结果表明,该方法对Android恶意软件识别的准确率达到91.6%,对恶意行为分类的平均准确率达到96.8%. 展开更多
关键词 Android安全 机器学习 随机森林(rf) 恶意软件检测 恶意行为分类
在线阅读 下载PDF
基于随机森林的航天器电信号多分类识别方法 被引量:7
15
作者 兰巍 贾素玲 +1 位作者 宋世民 李可 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2017年第9期1773-1778,共6页
针对航天器电特性信号数据存在数据量大、特征维数高、计算复杂度大和识别率低等问题,提出基于主成分分析(PCA)的特征提取方法和随机森林(RF)算法,对原始数据进行降维,提高计算效率和识别率,实现对航天器电信号数据的快速、准确识别分... 针对航天器电特性信号数据存在数据量大、特征维数高、计算复杂度大和识别率低等问题,提出基于主成分分析(PCA)的特征提取方法和随机森林(RF)算法,对原始数据进行降维,提高计算效率和识别率,实现对航天器电信号数据的快速、准确识别分类。随机森林算法在处理高维数据上具有优越的性能,但是考虑到时间复杂度问题,利用主成分分析方法对数据进行压缩和降维,在保证准确率的同时提高了计算效率。实验结果表明:与其他算法相比,针对航天器电特性信号数据,本文方法在准确率、计算效率和稳定性等方面均显示出优异的性能。 展开更多
关键词 航天器 电信号识别 主成分分析(PCA) 分类 随机森林(rf)
在线阅读 下载PDF
基于随机森林算法的高维模糊分类研究 被引量:7
16
作者 张修远 刘修国 《国土资源遥感》 CSCD 北大核心 2014年第2期87-92,共6页
高光谱数据的空间分辨率普遍偏低,混合像元分布广泛,故模糊分类方法常用于此类型数据的信息提取。针对模糊分类的精度常受限于特征维数和模糊样本选取等问题,提出了基于随机森林(random forest,RF)算法的高维模糊分类方法。首先将RF算... 高光谱数据的空间分辨率普遍偏低,混合像元分布广泛,故模糊分类方法常用于此类型数据的信息提取。针对模糊分类的精度常受限于特征维数和模糊样本选取等问题,提出了基于随机森林(random forest,RF)算法的高维模糊分类方法。首先将RF算法用于特征选择和模糊样本获取,然后在低维特征空间中利用模糊样本进行模糊分类,通过2步分类、遵循假设前提一致原则,实现RF和模糊分类2种分类器的融合;并通过不同样本、不同实验区和分区优化前后的3个实验(包括20余次对比实验、60多次子实验),验证了该方法不仅提高了模糊分类的精度,具有分类的有效性和可推广性,而且具有可优化性和对原始样本质量的鲁棒性。 展开更多
关键词 随机森林( rf) 模糊分类 高维特征
在线阅读 下载PDF
基于优化负样本采样策略的梯度提升决策树与随机森林的汶川同震滑坡易发性评价 被引量:28
17
作者 郭衍昊 窦杰 +3 位作者 向子林 马豪 董傲男 罗万祺 《地质科技通报》 CAS CSCD 北大核心 2024年第3期251-265,共15页
强震诱发的滑坡具有数量多、分布广、规模大等特点,严重威胁人民生命财产安全。滑坡易发性评价能够快速预测灾害空间分布,对于减轻震后灾害的危险性具有重要意义。在同震滑坡易发性评价研究中,如何选取滑坡负样本并通过耦合机器学习模... 强震诱发的滑坡具有数量多、分布广、规模大等特点,严重威胁人民生命财产安全。滑坡易发性评价能够快速预测灾害空间分布,对于减轻震后灾害的危险性具有重要意义。在同震滑坡易发性评价研究中,如何选取滑坡负样本并通过耦合机器学习模型提高评价精度的对比研究仍需进一步研究。以山区汶川地震诱发的滑坡为研究区,首先选取地形地貌、地质环境、地震参数等10个滑坡评价因子,分析滑坡空间分布规律;其次因子共线性分析检验数据冗余,接下来采用频率比法(FR)选取极低、低易发区滑坡负样本点的采样策略;最后采用基于决策树演化改进的梯度提升决策树(GBDT)、随机森林(RF)和耦合模型(FR-GBD与FR-RF),开展了基于机器学习的同震滑坡易发性区划并进行精度评价。研究结果表明:①滑坡空间分布受到多层级因子控制;②模型预测精度为:FR-RF(AUC=0.943)>FR-GBDT(AUC=0.926)>RF(AUC=0.901)>GBDT(AUC=0.856);③在低易发区选择滑坡负样本可以明显提高易发性精度。研究成果可为滑坡易发性中负样本的选择和评价模型构建提供参考同时也为震后滑坡的防灾减灾提供理论支持。 展开更多
关键词 随机森林(rf) 梯度提升决策树(GBDT) 机器学习 频率比法(FR) 采样策略 同震滑坡 滑坡易发性区划
在线阅读 下载PDF
基于RF和EBKRP算法的新安江流域有效土壤厚度反演 被引量:1
18
作者 王尚晓 张晓东 +6 位作者 张明 牛晓楠 周墨 唐志敏 张洁 宗乐丽 徐帅 《水土保持通报》 北大核心 2025年第1期168-177,共10页
[目的]快速、准确地获取区域有效土壤厚度,分析其空间分布特征和影响因素,为植被生长、土壤保持和粮食安全工作提供理论指导。[方法]以新安江流域为研究区,将野外调查数据、地形、岩性和气候等成土因素结合起来,采用经验贝叶斯克里金回... [目的]快速、准确地获取区域有效土壤厚度,分析其空间分布特征和影响因素,为植被生长、土壤保持和粮食安全工作提供理论指导。[方法]以新安江流域为研究区,将野外调查数据、地形、岩性和气候等成土因素结合起来,采用经验贝叶斯克里金回归预测(EBKRP)和随机森林(RF)算法,得到有效土壤厚度反演结果,并分析其与环境变量之间的关系。[结果](1)区域平均有效土壤厚度为0.2~0.3 m,城镇建设集中和人类活动密集的盆地和平原区土壤厚度较高,丘陵山地区则较低。(2)从MAE(平均绝对误差)、R^(2)(判定系数)和RMSE(均方根误差)3项精度评价指标来看,RF算法的预测结果明显优于EBKRP算法,而且更能显示出土壤厚度空间异质性分布特征,在一定程度上提高了土壤厚度数字制图的效果。(3)有效土壤厚度的估算受地形和气候变量的影响较大,它们分别占变量重要性的46.77%和18.78%。[结论] RF算法能够有效实现对区域有效土壤厚度的反演,克服了土壤厚度空间异质性的特点,相较于有限采样的模型更精确,分辨率也更高。 展开更多
关键词 有效土壤厚度 随机森林(rf) 土壤数字制图 经验贝叶斯克里金回归预测(EBKRP) 新安江流域
在线阅读 下载PDF
基于鲸群优化随机森林算法的非平衡数据分类 被引量:16
19
作者 叶丽珠 郑冬花 +1 位作者 刘月红 牛少华 《南京邮电大学学报(自然科学版)》 北大核心 2022年第6期99-105,共7页
为了提高非平衡数据分类的准确性,采用随机森林算法用于数据分类,并结合鲸鱼优化算法对随机森林弱分类器权重进行优化求解,以增强随机森林算法对非平衡数据分类的适应性。首先,建立基于随机森林的非平衡数据分类模型。通过随机森林的多... 为了提高非平衡数据分类的准确性,采用随机森林算法用于数据分类,并结合鲸鱼优化算法对随机森林弱分类器权重进行优化求解,以增强随机森林算法对非平衡数据分类的适应性。首先,建立基于随机森林的非平衡数据分类模型。通过随机森林的多个决策树弱分类器进行分类,有效解决样本不均衡导致的分类困难问题。接着,采用鲸群优化算法对弱分类器权重进行优化求解,将分类准确率均值作为鲸群优化适应度函数,以提高弱分类器权重投票对最终分类结果的精度。最后,采用经过鲸群优化得到的随机森林模型进行非平衡数据分类。实验证明,通过合理设置鲸群优化算法参数,可以获得分类准确度更高的随机森林弱分类器权重,相较于常用非平衡数据分类算法,文中算法能够获得更优的分类性能。 展开更多
关键词 非平衡数据分类 随机森林 鲸群优化算法 分类器 决策树
在线阅读 下载PDF
基于自适应随机森林的数据流分类算法 被引量:9
20
作者 张馨予 安建成 曹锐 《计算机工程与科学》 CSCD 北大核心 2020年第3期543-549,共7页
自适应随机森林分类器在每个基础分类器上分别设置了警告探测器和漂移探测器,实例训练时常常会同时触发多个警告探测器,引起多棵背景树同步训练,使得运行所需的内存大、时间长。针对此问题,提出了一种改进的自适应随机森林集成分类算法... 自适应随机森林分类器在每个基础分类器上分别设置了警告探测器和漂移探测器,实例训练时常常会同时触发多个警告探测器,引起多棵背景树同步训练,使得运行所需的内存大、时间长。针对此问题,提出了一种改进的自适应随机森林集成分类算法,将概念漂移探测器设置在集成学习器端,移除各基础树端的漂移探测器,并根据集成器预测准确率确定需要训练的背景树的数量。用改进后的算法对较平衡的数据流进行分类,在保证分类性能的前提下,与改进前的算法相比,运行时间有所降低,消耗内存有所减少,能更快适应数据流中出现的概念漂移。 展开更多
关键词 数据流 概念漂移 随机森林 漂移探测器 集成分类器
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部