期刊文献+
共找到154篇文章
< 1 2 8 >
每页显示 20 50 100
基于随机森林和长短期记忆网络模型的高压气井环空带压预测方法 被引量:5
1
作者 张智 王翔辉 +1 位作者 黄媚 冯少波 《天然气工业》 EI CAS CSCD 北大核心 2024年第9期167-178,共12页
高压气井在生产过程中持续的环空带压容易引起套管柱变形或挤毁,是高压气井完整性失效的主要原因之一。为解决传统方法环空带压预测精度不高的问题,以鄂尔多斯盆地苏里格气田某高压气井为例,首先利用主成分分析法和相关系数法找到影响... 高压气井在生产过程中持续的环空带压容易引起套管柱变形或挤毁,是高压气井完整性失效的主要原因之一。为解决传统方法环空带压预测精度不高的问题,以鄂尔多斯盆地苏里格气田某高压气井为例,首先利用主成分分析法和相关系数法找到影响环空带压的主要因素,然后使用高压气井井筒温压场理论值和孤立森林模型对主成分进行物理解释和数据清洗,再对清洗后的数据使用随机森林(RF)和长短期记忆网络(LSTM)模型建立了环空带压定量预测模型,并对两类模型进行权重组合,最终建立了精确度高于任意单一模型的RF—LSTM组合环空带压预测新模型。研究结果表明:(1)环空带压的主要影响因子有温度分量、压力分量、产量分量、腐蚀程度、生产状态,而温度分量与环空带压间存在最高关联性;(2)通过错误格式、离群点及基于井筒温压场的数据清洗,可以得到数据清洗后的环空带压影响因素训练集;(3)通过平均绝对误差法(MAE)能够建立误差分数小于任意单一模型,而拟合优度介于两者之间的组合模型,因此可以将具有高拟合优度和低误差分数的两类模型结合,从而组合出同时满足两种分数的组合模型。结论认为:(1)运用大数据挖掘技术及算法进行环空带压定量预测,方法新颖,预测精度高,结果可行;(2)该方法为现场环空带压预测和风险管控提供了决策工具参考,为实现环空带压风险实时预测、预警和管控提供了理论支撑。 展开更多
关键词 环空带压 数据挖掘 随机森林 主成分分析 LSTM 大数据 预测方法
在线阅读 下载PDF
基于粒子群优化后随机森林模型的管道内腐蚀风险预测
2
作者 肖雯雯 葛鹏莉 +6 位作者 胡广强 吕瑶 龙武 刘青山 郜双武 曲志豪 张雷 《腐蚀与防护》 北大核心 2025年第2期59-65,共7页
基于塔河油田历史失效数据,使用Pearson相关性分析和灰色关联度分析确定管道内腐蚀主控因素,并将其作为模型输入变量,腐蚀速率作为输出变量,建立随机森林(RF)腐蚀预测模型。为提高预测精度,使用粒子群优化(PSO)算法对RF模型的超参数进... 基于塔河油田历史失效数据,使用Pearson相关性分析和灰色关联度分析确定管道内腐蚀主控因素,并将其作为模型输入变量,腐蚀速率作为输出变量,建立随机森林(RF)腐蚀预测模型。为提高预测精度,使用粒子群优化(PSO)算法对RF模型的超参数进行优化。结果表明:塔河油田输油管道内腐蚀主控因素为CO_(2)分压、温度、Cl^(-)含量和H_(2)S分压;经PSO优化后RF模型的决定系数R~2为0.97,均方根误差为0.161,平均绝对误差为0.027,均优于其他3种模型。因此,PSO优化后RF模型能够准确预测管道的腐蚀速率,为油气田管道的腐蚀预警和防护提供依据和支持。 展开更多
关键词 CO_(2)-H_(2)S腐蚀 机器学习 随机森林(rf) 粒子群优化(PSO) 腐蚀速率
在线阅读 下载PDF
基于混合遗传蚁群优化随机森林算法的激光熔覆Ni60裂纹预测与工艺参数优化
3
作者 李涛 邓林辉 +2 位作者 莫彬 石非凡 刘伟嵬 《中国机械工程》 北大核心 2025年第6期1322-1328,1337,共8页
为了探究激光熔覆Ni60过程中熔覆层裂纹与加工工艺参数之间的复杂非线性映射关系,采用熵值法结合TOPSIS综合评价法对熔覆层裂纹进行综合表征评价,并使用混合遗传蚁群算法(HGA-ACO)优化随机森林算法(RFA)超参数,搭建工艺参数与裂纹评价... 为了探究激光熔覆Ni60过程中熔覆层裂纹与加工工艺参数之间的复杂非线性映射关系,采用熵值法结合TOPSIS综合评价法对熔覆层裂纹进行综合表征评价,并使用混合遗传蚁群算法(HGA-ACO)优化随机森林算法(RFA)超参数,搭建工艺参数与裂纹评价指标间预测模型,最后使用遗传算法进行工艺参数反向寻优。研究结果表明:与ACO-RFA模型相比,HGA-ACO-RFA在预测精度与评价指标方面有显著改善,反向寻优获得的最优工艺参数可制备出几乎无裂纹的熔覆层。 展开更多
关键词 激光熔覆 裂纹 评价方法 混合遗传蚁群算法 随机森林算法
在线阅读 下载PDF
基于随机森林和最近邻插值法的交通流量数据修复方法
4
作者 汤伟 漆苏应 +1 位作者 杨晓东 李国强 《科学技术与工程》 北大核心 2024年第32期14056-14065,共10页
针对目前传感器在采集数据过程中由于受到天气或者自身设备故障等原因,造成数据缺失或者数据异常,导致不能从采集的数据中获得准确的交通变化规律等问题,分别提出基于改进最近邻插值算法和基于随机森林插补的交通流量数据缺失修复模型... 针对目前传感器在采集数据过程中由于受到天气或者自身设备故障等原因,造成数据缺失或者数据异常,导致不能从采集的数据中获得准确的交通变化规律等问题,分别提出基于改进最近邻插值算法和基于随机森林插补的交通流量数据缺失修复模型。由于交通数据缺失场景和缺失类型以及时空关联的差异性,将数据缺失类型划分为简单随机缺失和复杂连续缺失两种;利用改进的最近邻插值算法建立模型处理简单随机缺失,建立随机森林模型进行迭代插补处理复杂连续缺失;面对两种不同的数据缺失类型,利用期望最大化算法、深度信念网络、季节性差分自回归滑动平均模型分别搭建模型对比交叉验证改进的最近邻插值算法和随机森林插补方法。数据来源于美国加利福尼亚州PeMS(performance measurement system)实时采集的2022年6月1日—2022年7月31日以5 min为采样时间间隔的交通流量数据,为了模拟数据的缺失状况,将完整数据按照一定比例进行缺失,来模拟数据缺数的情况,得到简单随机缺失和复杂连续缺失分布的交通流量缺失数据集。结果表明:本实验在不同的缺失比例下均有良好的表现,通过设计不同的缺失比例和类型,各项评估指标均有明显优势,验证了两种数据缺失填充模型的有效性。 展开更多
关键词 智能交通 缺失数据修复 随机森林(rf) 最近邻插值算法 交通运营管理
在线阅读 下载PDF
基于机器学习方法改进IVM-RF耦合模型的崩滑灾害危险性评价:以延安市志丹县为例 被引量:1
5
作者 屈鹏鑫 谢婉丽 +1 位作者 刘琦琦 王昱琛 《地质科技通报》 北大核心 2025年第3期280-295,共16页
为了给延安市志丹县防灾减灾和风险管控提供数据支持,给相似地区危险性评价提供参考依据,补充在崩塌和滑坡灾害危险性评价中未考虑累积降雨方面的影响,在10,20,50和100 a一遇4种不同降雨工况下对研究区进行了危险性评价。以栅格单元作... 为了给延安市志丹县防灾减灾和风险管控提供数据支持,给相似地区危险性评价提供参考依据,补充在崩塌和滑坡灾害危险性评价中未考虑累积降雨方面的影响,在10,20,50和100 a一遇4种不同降雨工况下对研究区进行了危险性评价。以栅格单元作为评价单元,结合灾害特征及区域孕灾背景,通过皮尔逊相关系数法,选取高程、坡度、坡向、曲率、岩土体类型、距河流距离、距道路距离、归一化植被指数8个评价因子,采用信息量模型进行了易发性评价并分析了致灾因子与灾害分布关联性。利用计算机语言,自动处理前期因子数据的分析、转化、管理和出图等流程,改进了信息量(IVM)-随机森林(RF)耦合模型,实现了模型的自动循环迭代对比选择,通过ROC(受试者工作特征曲线,receiver operating characteristic curve)曲线对比了2种易发性模型精度。在耦合模型评价结果的基础上进行危险性评价,用皮尔逊Ⅲ型曲线估算研究区10,20,50和100 a一遇4种不同工况下降雨量,并进行危险性分区。对于易发性分区结果,信息量-随机森林耦合模型评价结果的AUC值(ROC曲线下面积)为0.87,优于IVM模型的评价结果;对于危险性分区结果,从10 a一遇到100 a一遇降雨工况的高和极高危险区面积都逐级增加。研究表明,改进的耦合模型评价方法不仅简化了操作还提高了精度,耦合模型确实拥有更好的评价精度和预测能力。 展开更多
关键词 崩塌 滑坡 信息量(IVM)模型 随机森林(rf)模型 危险性评价 机器学习 延安市志丹县
在线阅读 下载PDF
基于随机森林模型的长江流域分区多源融合降水模拟方法研究 被引量:4
6
作者 宋蕾玥 张珂 +3 位作者 晁丽君 李曦 牛杰帆 黄轶铭 《水资源保护》 EI CAS CSCD 北大核心 2024年第3期125-132,共8页
基于3种卫星降水产品,提出了一种基于随机森林模型的长江流域分区多源融合降水模拟算法(FCM-RF算法)。采用模糊C均值算法,结合地面观测站点资料对长江流域进行降水区域划分,引入降水比降刻画降水空间性,进一步通过普通克里金插值法优化... 基于3种卫星降水产品,提出了一种基于随机森林模型的长江流域分区多源融合降水模拟算法(FCM-RF算法)。采用模糊C均值算法,结合地面观测站点资料对长江流域进行降水区域划分,引入降水比降刻画降水空间性,进一步通过普通克里金插值法优化融合结果,得到一套长江流域空间分辨率为0.25°×0.25°的多源融合降水产品,并对其进行了评估。结果表明:FCM-RF算法在长江流域具有良好的表现,可以有效提高原始卫星降水产品对于降水事件的捕捉能力,在验证站点模拟降水量与实测降水量的相关系数可达到0.76;FCM-RF算法在年际上具有相似变化特征,对于春秋季降水的敏感性较高,在夏季由于强降水影响表现欠佳,冬季由于雨量稀少、存在固态降水,呈现出误差小、相关系数较低的特点;FCM-RF算法在东南地区具有较强的降水捕捉能力,在青藏高原地区的准确性较低。 展开更多
关键词 降水模拟 模糊C均值算法 随机森林模型 分区多源融合方法 FCM-rf算法 长江流域
在线阅读 下载PDF
基于随机森林的作物模型光温产量潜力模拟优化方法
7
作者 徐浩 宋华鲁 +2 位作者 张海波 张小虎 王帅 《湖北农业科学》 2024年第8期132-139,共8页
为有效降低作物模拟所需数据量,提高计算效率,基于机器学习建立冬小麦光温产量潜力估算模型。以中国冬麦区129个农业气象站点1980—2009年光温产量潜力为研究对象,选择影响光温产量潜力模拟较大的温度、日照时数、经纬度等构建特征变量... 为有效降低作物模拟所需数据量,提高计算效率,基于机器学习建立冬小麦光温产量潜力估算模型。以中国冬麦区129个农业气象站点1980—2009年光温产量潜力为研究对象,选择影响光温产量潜力模拟较大的温度、日照时数、经纬度等构建特征变量。选择生长季与月份2个时间范围,基于WheatGrow模型输入输出数据建立生长季变量的随机森林模型(RF_GS)与月份变量的随机森林模型(RF_Mon),最后利用均方根误差(RMSE)评价随机森林模型的性能。结果表明,随机森林模型可在保证模拟精度的前提下降低数据需求量,且RF_GS精度优于RF_Mon;变量重要性检验与部分依赖图分析结果表明,纬度、生长季日照时数、5月日照时数、3月最低温度对光温产量潜力模拟影响较大;若模型验证数据的范围超出训练数据的范围,利用随机森林模型无法保证建模精度。 展开更多
关键词 作物模型 WheatGrow模型 随机森林 光温产量潜力 模拟优化方法
在线阅读 下载PDF
结合多重假设检验的随机森林长期降水预测方法及应用
8
作者 李梦杰 刘琨 +4 位作者 牟海磊 殷兆凯 刘志武 吴迪 梁犁丽 《南水北调与水利科技(中英文)》 CAS CSCD 北大核心 2024年第5期920-926,共7页
为解决随机森林方法经验性选取预测因子时存在的错误发现率问题,引入多重假设检验领域控制错误发现率的方法对预测因子的筛选进行质量控制,将因子筛选由经验依赖转化为数据依赖,从而提出一种基于多重假设检验的随机森林方法长期降水预... 为解决随机森林方法经验性选取预测因子时存在的错误发现率问题,引入多重假设检验领域控制错误发现率的方法对预测因子的筛选进行质量控制,将因子筛选由经验依赖转化为数据依赖,从而提出一种基于多重假设检验的随机森林方法长期降水预测方法。以巴西巴拉那河上游流域为研究区,利用逐月气候系统指数,应用提出的方法对研究区2018-2020年54个雨量站点的逐月降水量进行模拟预测、检验和交叉验证。结果表明:与传统的随机森林方法相比,该方法预报精度更高,对不同站点1-12月的预测平均合格率达到64%,其中6月预测合格率达到84%,表明该方法可以作为流域长期降水预测的有效工具之一。 展开更多
关键词 随机森林方法 长期降水预测 预测因子筛选 质量控制 多重假设检验
在线阅读 下载PDF
基于随机森林方法的滑坡灾害危险性区划 被引量:46
9
作者 李亭 田原 +1 位作者 邬伦 刘亮 《地理与地理信息科学》 CSCD 北大核心 2014年第6期25-30,F0002,共7页
滑坡灾害危险性区划在滑坡灾害管理工作中具有重要意义。该文以深圳市为研究区,将随机森林方法应用于滑坡灾害危险性区划和因子评价工作。研究中采用随机森林方法进行建模,结合ROC曲线和AUC值对模型性能进行评价;通过预报效率曲线对全... 滑坡灾害危险性区划在滑坡灾害管理工作中具有重要意义。该文以深圳市为研究区,将随机森林方法应用于滑坡灾害危险性区划和因子评价工作。研究中采用随机森林方法进行建模,结合ROC曲线和AUC值对模型性能进行评价;通过预报效率曲线对全区的滑坡危险性区划总体效果进行评价;根据错误率变化和节点不纯度变化,对不同因子的重要性进行分析,结合作用曲线,探讨不同因子对滑坡的影响规律。实例研究说明随机森林方法适用于滑坡危险性区划工作,具有良好的建模效果。 展开更多
关键词 随机森林方法 滑坡灾害危险性区划 集成学习方法 模型评价 因子评价
在线阅读 下载PDF
天然裂缝发育特征及智能化识别方法——以四川盆地川西坳陷上三叠统须家河组为例 被引量:1
10
作者 李伟 王民 +6 位作者 肖佃师 金惠 邵好明 崔俊峰 贾益东 张泽元 李明 《油气藏评价与开发》 北大核心 2025年第3期443-454,共12页
四川盆地川西坳陷上三叠统须家河组是四川盆地致密砂岩气(以下简称致密气)增储上产的重要领域。在实际生产中,高产稳产井与裂缝密集发育高度相关,裂缝为气体的运移和保存提供了路径和场所,裂缝发育与否成为制约优质储层形成的关键因素... 四川盆地川西坳陷上三叠统须家河组是四川盆地致密砂岩气(以下简称致密气)增储上产的重要领域。在实际生产中,高产稳产井与裂缝密集发育高度相关,裂缝为气体的运移和保存提供了路径和场所,裂缝发育与否成为制约优质储层形成的关键因素。为了评价须家河组气藏富集“甜点”区,依据岩心观察、测井资料及智能化算法,明确裂缝发育特征并建立有效的裂缝识别方法。研究认为:研究区的构造裂缝、成岩裂缝与异常高压裂缝均有发育。其中,构造裂缝主要分为3期,第1期NW—SE(北西—南东)向主要发育低角度裂缝,偶尔可见高角度裂缝;第2期NNE—SSW(北北东—南南西)向主要发育高角度裂缝;第3期E—W(东—西)向主要发育高角度裂缝。致密气储层裂缝层段具有低密度、高补偿中子、高声波时差、冲洗带电阻率和地层电阻率呈现正幅度差。对带有裂缝和非裂缝标签的常规测井数据进行归一化处理,应用机器学习算法进行裂缝智能化预测,K近邻算法、支持向量机、极端梯度提升树算法和随机森林算法的F_(1)分数分别为0.65、0.83、0.88、0.91,发现随机森林算法具有较强的鲁棒性和抗干扰能力,预测精确度和效率均高于其他3种算法。同时,为了兼顾运算效率与准确性,选择基因遗传算法作为优化算法进行超参数调优,优于网格搜索、贝叶斯优化及粒子群优化算法。使用沙普利可加性特征解释方法(SHapley Additive Explanations,简称SHAP)计算不同影响因素对预测的贡献值,发现声波时差、补偿中子和补偿密度为主要影响预测效果的测井曲线。裂缝密度呈现出明显的空间分布规律,即从四川盆地西南部至四川盆地西北部,裂缝密度依次降低。研究结果可为四川盆地西部地区致密气储层裂缝“甜点”区预测提供一套切实可行的智能化预测模型,为致密气增储上产奠定基础。 展开更多
关键词 川西坳陷 须家河组 裂缝发育特征 智能化预测方法 随机森林
在线阅读 下载PDF
基于随机森林的飞机长着陆预警方法 被引量:10
11
作者 孙瑞山 李重锋 《中国安全生产科学技术》 CAS CSCD 北大核心 2021年第5期182-186,共5页
为降低飞机冲出跑道事故造成的人员伤亡和财产损失,以长着陆事件为研究对象,探讨1种有效的长着陆事件预警方法。提出应用随机森林模型对长着陆事件进行预警,给出模型的特征筛选、构建及评价方法,并使用实际飞行数据验证模型有效性。结... 为降低飞机冲出跑道事故造成的人员伤亡和财产损失,以长着陆事件为研究对象,探讨1种有效的长着陆事件预警方法。提出应用随机森林模型对长着陆事件进行预警,给出模型的特征筛选、构建及评价方法,并使用实际飞行数据验证模型有效性。结果表明:基于随机森林的飞机长着陆预警模型精确率为88.41%,召回率为87.14%,模型可以有效对长着陆事件进行预警。 展开更多
关键词 飞行安全 飞行数据 长着陆 随机森林 预警方法
在线阅读 下载PDF
流式大数据下随机森林方法及应用 被引量:5
12
作者 刘迎春 陈梅玲 《西北工业大学学报》 EI CAS CSCD 北大核心 2015年第6期1055-1061,共7页
流式计算形态下的大数据分析一直是当前需要解决的问题,而且研究成果和实践经验较少。随机森林方法是目前应用较多的分类算法,但在流式计算应用场景中,数据所呈现出来的实时性、易失性、无序性等特征会使得算法准确度逐渐降低。针对这... 流式计算形态下的大数据分析一直是当前需要解决的问题,而且研究成果和实践经验较少。随机森林方法是目前应用较多的分类算法,但在流式计算应用场景中,数据所呈现出来的实时性、易失性、无序性等特征会使得算法准确度逐渐降低。针对这个问题,分析了随机森林的算法特点,提出了根据决策树的准确度进行随机森林剪枝的思路。同时为了适应数据的变化,结合准确度间隔的概念提出生成、验证并补充新决策树的方法,最终形成可以不断随数据更新的随机森林,满足流式大数据环境对算法的要求。使用实际数据对改进后方法的可行性进行了验证,证明新方法在真实流式大数据场景中有着更高的分类准确度,最后分析讨论了随机森林方法如何进一步研究改进的主题。 展开更多
关键词 决策树 随机森林方法 大数据 流式计算 社交网站 搜索引擎 分类器 剪枝 客户评分 分布式系统
在线阅读 下载PDF
基于改进特征筛选的随机森林算法对锂渣混凝土强度的预测研究 被引量:1
13
作者 魏令港 黄靓 曾令宏 《材料导报》 EI CAS CSCD 北大核心 2024年第9期156-161,共6页
本工作提出了特征变量筛选结合特征变量相关性的方法,对构建的锂渣混凝土28 d抗压强度数据库进行优化,分别建立了随机森林模型和深度神经网络模型用于测试数据库,并以相关系数(R)、均方根误差(RMSE)和平均相对误差(MAE)三个指标对模型... 本工作提出了特征变量筛选结合特征变量相关性的方法,对构建的锂渣混凝土28 d抗压强度数据库进行优化,分别建立了随机森林模型和深度神经网络模型用于测试数据库,并以相关系数(R)、均方根误差(RMSE)和平均相对误差(MAE)三个指标对模型的预测结果进行对比分析。结果表明,预测锂渣混凝土的28 d抗压强度时,采取改进的特征变量筛选方法能够有效提高模型的预测效果,此外,特征变量筛选的前后随机森林(RF)模型的预测效果明显优于深度神经网络(DNN)模型。 展开更多
关键词 随机森林(rf) 深度神经网络(DNN) 特征变量筛选 锂渣混凝土 抗压强度
在线阅读 下载PDF
基于随机森林的高速公路变路径偷逃费行为识别 被引量:1
14
作者 邹杰 曹宏禄 +2 位作者 李平安 黄诗音 赵建东 《科学技术与工程》 北大核心 2024年第36期15694-15700,共7页
为提高高速公路变路径偷逃费行为识别效率,针对改变路径偷逃费行为进行研究,建立一种基于随机森林的高速公路变路径偷逃费行为识别模型,能够有效识别该类偷逃费行为,协助高速公路相关管理部门追缴偷逃费用。首先,分析原始收费数据,筛选... 为提高高速公路变路径偷逃费行为识别效率,针对改变路径偷逃费行为进行研究,建立一种基于随机森林的高速公路变路径偷逃费行为识别模型,能够有效识别该类偷逃费行为,协助高速公路相关管理部门追缴偷逃费用。首先,分析原始收费数据,筛选出与本次研究相关的字段,经过运算得到12个模型可输入的初始特征;然后,通过计算各个特征的方差膨胀因子(variance inflation factor,VIF)和容忍度(tolerance,TOL)值来剔除存在共线性的特征,并利用Boruta算法筛选高重要性特征(“行驶方向是否一致”“入出站是否一致”“通行时间”和“最小费额里程”);其次,使用SMOTETomek综合采样技术来平衡数据集;再其次,利用网格搜索法对随机森林进行超参数调优;最后,利用所建立模型进行训练和识别,并与基准模型的识别效果进行对比。结果表明:所建立模型能够更好地对高速公路变路径偷逃费行为进行识别,Macro-F1分数达到了0.966,优于极限梯度提升(extreme gradient boost,XGBoost)(0.9431)、决策树(decision tree,DT)(0.9563)和梯度提升决策树(gradient boosting decision trees,GBDT)(0.9382),能够为运营管理部门稽查该类偷逃费车辆提供参考。 展开更多
关键词 随机森林(rf) 改变路径偷逃费 Boruta算法 数据不平衡处理
在线阅读 下载PDF
基于随机森林算法的Android恶意行为识别与分类方法 被引量:12
15
作者 柯懂湘 潘丽敏 +1 位作者 罗森林 张寒青 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第10期2013-2023,共11页
针对当前Android恶意软件检测方法对检测出的恶意行为无法进行识别和分类的问题,提出基于随机森林(RF)算法的Android恶意行为的识别与分类方法.该方法在对Android恶意软件的类型进行定义的基础上,利用融合多种触发机制的Android恶意行... 针对当前Android恶意软件检测方法对检测出的恶意行为无法进行识别和分类的问题,提出基于随机森林(RF)算法的Android恶意行为的识别与分类方法.该方法在对Android恶意软件的类型进行定义的基础上,利用融合多种触发机制的Android恶意行为诱导方法触发软件的潜在恶意行为;通过Hook关键系统函数对Android软件行为进行采集并生成行为日志,基于行为日志提取软件行为特征集;使用随机森林算法,对行为日志中的恶意行为进行识别与分类.实验结果表明,该方法对Android恶意软件识别的准确率达到91.6%,对恶意行为分类的平均准确率达到96.8%. 展开更多
关键词 Android安全 机器学习 随机森林(rf) 恶意软件检测 恶意行为分类
在线阅读 下载PDF
基于随机森林的航天器电信号多分类识别方法 被引量:7
16
作者 兰巍 贾素玲 +1 位作者 宋世民 李可 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2017年第9期1773-1778,共6页
针对航天器电特性信号数据存在数据量大、特征维数高、计算复杂度大和识别率低等问题,提出基于主成分分析(PCA)的特征提取方法和随机森林(RF)算法,对原始数据进行降维,提高计算效率和识别率,实现对航天器电信号数据的快速、准确识别分... 针对航天器电特性信号数据存在数据量大、特征维数高、计算复杂度大和识别率低等问题,提出基于主成分分析(PCA)的特征提取方法和随机森林(RF)算法,对原始数据进行降维,提高计算效率和识别率,实现对航天器电信号数据的快速、准确识别分类。随机森林算法在处理高维数据上具有优越的性能,但是考虑到时间复杂度问题,利用主成分分析方法对数据进行压缩和降维,在保证准确率的同时提高了计算效率。实验结果表明:与其他算法相比,针对航天器电特性信号数据,本文方法在准确率、计算效率和稳定性等方面均显示出优异的性能。 展开更多
关键词 航天器 电信号识别 主成分分析(PCA) 多分类 随机森林(rf)
在线阅读 下载PDF
基于优化负样本采样策略的梯度提升决策树与随机森林的汶川同震滑坡易发性评价 被引量:26
17
作者 郭衍昊 窦杰 +3 位作者 向子林 马豪 董傲男 罗万祺 《地质科技通报》 CAS CSCD 北大核心 2024年第3期251-265,共15页
强震诱发的滑坡具有数量多、分布广、规模大等特点,严重威胁人民生命财产安全。滑坡易发性评价能够快速预测灾害空间分布,对于减轻震后灾害的危险性具有重要意义。在同震滑坡易发性评价研究中,如何选取滑坡负样本并通过耦合机器学习模... 强震诱发的滑坡具有数量多、分布广、规模大等特点,严重威胁人民生命财产安全。滑坡易发性评价能够快速预测灾害空间分布,对于减轻震后灾害的危险性具有重要意义。在同震滑坡易发性评价研究中,如何选取滑坡负样本并通过耦合机器学习模型提高评价精度的对比研究仍需进一步研究。以山区汶川地震诱发的滑坡为研究区,首先选取地形地貌、地质环境、地震参数等10个滑坡评价因子,分析滑坡空间分布规律;其次因子共线性分析检验数据冗余,接下来采用频率比法(FR)选取极低、低易发区滑坡负样本点的采样策略;最后采用基于决策树演化改进的梯度提升决策树(GBDT)、随机森林(RF)和耦合模型(FR-GBD与FR-RF),开展了基于机器学习的同震滑坡易发性区划并进行精度评价。研究结果表明:①滑坡空间分布受到多层级因子控制;②模型预测精度为:FR-RF(AUC=0.943)>FR-GBDT(AUC=0.926)>RF(AUC=0.901)>GBDT(AUC=0.856);③在低易发区选择滑坡负样本可以明显提高易发性精度。研究成果可为滑坡易发性中负样本的选择和评价模型构建提供参考同时也为震后滑坡的防灾减灾提供理论支持。 展开更多
关键词 随机森林(rf) 梯度提升决策树(GBDT) 机器学习 频率比法(FR) 采样策略 同震滑坡 滑坡易发性区划
在线阅读 下载PDF
模型集群分析-随机森林方法在烟叶分类中的应用 被引量:6
18
作者 谭观萍 宾俊 +4 位作者 范伟 张发明 李海平 王承伟 周冀衡 《江西农业学报》 CAS 2017年第1期69-74,共6页
为了解决烟叶外观质量检验和烟叶品质等级评估中主观因素影响过大的问题,首次采用模型集群分析-随机森林方法(MPA-RF)结合近红外光谱建立的烟叶采收成熟度和烤后烟叶等级划分判别模型对烟叶进行了品质分类。结果表明:MPA-RF模型对采收... 为了解决烟叶外观质量检验和烟叶品质等级评估中主观因素影响过大的问题,首次采用模型集群分析-随机森林方法(MPA-RF)结合近红外光谱建立的烟叶采收成熟度和烤后烟叶等级划分判别模型对烟叶进行了品质分类。结果表明:MPA-RF模型对采收成熟度烟叶样本(数据集A)和不同等级烟叶样本(数据集B)的训练集分类精度分别为96.67%、99.02%,预测模型分类精度分别为100%、96.15%;MPA-RF模型对烟叶的分类准确率明显高于常用的PCA、SVM和RF分类方法。 展开更多
关键词 近红外光谱 烟叶分类 模型集群分析-随机森林方法
在线阅读 下载PDF
基于数字钻进参数的岩石强度确定方法 被引量:2
19
作者 贾朝军 陈范雷 +3 位作者 雷明锋 黄娟 施成华 刘帝 《西南交通大学学报》 北大核心 2025年第3期589-598,共10页
岩石强度是衡量岩石稳定性和安全性的关键参数,而高效准确地预测岩石强度可以有效指导隧道的开挖和支护工作.本文收集分析源于不同设备的数字钻进参数和岩石力学性质相关数据,基于钻进过程中的能量传递分析建立数字钻进参数与单轴抗压... 岩石强度是衡量岩石稳定性和安全性的关键参数,而高效准确地预测岩石强度可以有效指导隧道的开挖和支护工作.本文收集分析源于不同设备的数字钻进参数和岩石力学性质相关数据,基于钻进过程中的能量传递分析建立数字钻进参数与单轴抗压强度的定量关系;采用机器学习方法建立基于钻进参数的岩石强度预测模型,选择BP(back-propagation)神经网络、随机森林、卷积神经网络和长短期记忆网络4种算法比较不同算法的预测效果,最终确定最优模型.结果显示:相对于理论公式和其他3种机器学习算法,BP神经网络算法在岩石强度预测中表现优秀,其预测结果的均方根误差为5.794,平均绝对误差为4.129,相关系数为0.9749. 展开更多
关键词 数字钻进参数 能量方法 抗压强度 神经网络 随机森林
在线阅读 下载PDF
基于随机森林的网络入侵检测方法 被引量:26
20
作者 芶继军 李均华 +2 位作者 陈晨 陈一鸣 吕奕达 《计算机工程与应用》 CSCD 北大核心 2020年第2期82-88,共7页
为了提高网络安全水平,及时对网络攻击进行主动检测,提出了一种基于随机森林的网络入侵检测模型。该模型能够对大流量攻击进行分布式检测,且检测算法在引入了两个随机性后,即可降低网络流量内不同属性特征字段的噪声,并消除关联性,以便... 为了提高网络安全水平,及时对网络攻击进行主动检测,提出了一种基于随机森林的网络入侵检测模型。该模型能够对大流量攻击进行分布式检测,且检测算法在引入了两个随机性后,即可降低网络流量内不同属性特征字段的噪声,并消除关联性,以便更为便捷、迅速地对攻击进行主动检测。将经典的Adaboost组合多分类器方法与提出的算法在检测率、正确率、精确率三个方面进行对比,体现了该算法的优越性,为大数据时代下网络安全提供了更好的保护。 展开更多
关键词 网络安全 机器学习 随机森林方法 攻击检测
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部