期刊文献+
共找到128篇文章
< 1 2 7 >
每页显示 20 50 100
基于改进孤立森林的大规模网络入侵攻击检测研究
1
作者 徐伟 冷静 《现代电子技术》 北大核心 2025年第15期98-102,共5页
针对网络规模较大导致的检测过程性能波动大、潜在攻击行为识别精度较差等问题,文中提出基于改进孤立森林的大规模网络入侵攻击检测方法。构建大规模网络入侵攻击检测框架,采集并预处理大规模网络数据,基于关联的特征选择方法提取大规... 针对网络规模较大导致的检测过程性能波动大、潜在攻击行为识别精度较差等问题,文中提出基于改进孤立森林的大规模网络入侵攻击检测方法。构建大规模网络入侵攻击检测框架,采集并预处理大规模网络数据,基于关联的特征选择方法提取大规模网络流量特征,输送至入侵攻击检测模块。入侵攻击检测模块采用改进孤立森林算法,通过隔离树遍历网络流量特征数据计算特征数据异常得分,准确隔离异常数据点,实现攻击检测。一旦检测出异常点,日志告警模块发送警报,并在规则库中记录相应的规则。实验结果证明,该方法的异常分值计算结果均在0.79~0.99,能够准确识别入侵攻击流量,并且检测准确率均超过99%。 展开更多
关键词 改进孤立森林 大规模网络 入侵攻击 分割点 流量特征 异常得分 特征选择
在线阅读 下载PDF
基于Sentence-BERT与孤立森林算法的专利新颖性评估
2
作者 邓娜 王雨佳 +1 位作者 杨洋 陈旭 《情报杂志》 北大核心 2025年第2期174-182,共9页
[研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提... [研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提出一种基于Sentence-BERT与孤立森林算法的专利新颖性评估方法。首先,使用专利标题与IPC分类号分别作为专利的应用方向与功能分类特征,再通过BiLSTM-CRF模型对专利摘要进行关键技术抽取作为实施方法特征;其次,采用Sentence-BERT对上述特征进行文本向量化表示后组合输入至孤立森林算法获得离群专利集;最后,通过技术量权值过滤法提高专利新颖性评估的精度。[研究结果/结论]以金融科技领域专利进行实证研究,结果表明,该评估方法准确率相较专业专利分析平台方法提升了9%~11%。证明了该方法在专利新颖性评估中的有效性,能为后续专利审核工作和高价值专利分析提供参考。 展开更多
关键词 专利评估 专利新颖性 BiLSTM-CRF Sentence-BERT 孤立森林算法 机器学习
在线阅读 下载PDF
基于孤立森林的水电机组异常噪声分析方法
3
作者 莫凡 何葵东 +3 位作者 赵训新 王思嘉 徐雄 温和 《中国测试》 北大核心 2025年第2期162-168,共7页
传统振动诊断技术在水轮机故障检测上具有速度慢、测频范围低等弊端。事实上,水轮发电机组运行产生振动信号时,也会激发噪声信号。当系统故障时,噪声信号的特性也会发生变化,由此可以推导机组的运行状态信息发生相应变化。通过对水电站... 传统振动诊断技术在水轮机故障检测上具有速度慢、测频范围低等弊端。事实上,水轮发电机组运行产生振动信号时,也会激发噪声信号。当系统故障时,噪声信号的特性也会发生变化,由此可以推导机组的运行状态信息发生相应变化。通过对水电站异常噪声信号特征分析,提出一种基于孤立森林的水电机组金属扫膛异常噪声检测方法。该方法提取水电机组噪声信号的高维时频特征后,结合机组状态分析,确定算法最小路径,最后构建孤立森林(iForest)分类模型对机组噪声信号进行检测。通过对湖南某水电站灯泡贯流式机组检测实验表明,采用该方法的金属扫膛异常噪声检测准确率为97.45%。整体性能优于基于天牛须算法的支持向量机模型(BAS-SVM)与同类型的异常检测算法(KNN、ABOD和OC-SVM)模型,表明该方法的有效性。 展开更多
关键词 水电机组 异常检测 噪声测量 孤立森林
在线阅读 下载PDF
基于孤立森林的传感器网络非线性异常数据点检测方法
4
作者 韦霞 熊志文 傅彦铭 《传感技术学报》 北大核心 2025年第8期1499-1504,共6页
检测传感器网络中的非线性异常数据点对于保证数据质量、提高数据安全性具有重要作用。为此,提出基于孤立森林的传感器网络非线性异常数据点检测方法。首先,联合小波变换、傅里叶变换和奇异谱分析法,分离出传感器网络非线性数据中的趋势... 检测传感器网络中的非线性异常数据点对于保证数据质量、提高数据安全性具有重要作用。为此,提出基于孤立森林的传感器网络非线性异常数据点检测方法。首先,联合小波变换、傅里叶变换和奇异谱分析法,分离出传感器网络非线性数据中的趋势项,更好地聚焦于局部数据点检测;然后,通过自动编码器重构的方式,突出数据的本质特征;最后,引入分裂准则和相对质量的概念优化孤立森林算法,根据孤立树节点的分值分析对应数据点存在异常的可能性,从而检测出非线性数据中的异常点。仿真结果表明,所提方法的AUC值始终保持在0.945以上,均方根误差低于0.073,虽然内存占用率存在微小波动,但在数值上始终处于0.25以下。 展开更多
关键词 信息与通信工程 异常数据点检测 孤立森林 传感器网络 小波变换 自动编码器
在线阅读 下载PDF
基于孤立森林算法的锂电池内部故障分析策略
5
作者 程静飞 《储能科学与技术》 北大核心 2025年第7期2878-2880,共3页
锂电池内部故障诊断这一关键问题,一直是锂电池设计研究的重点,传统故障检测方法在实时性、精度及适应性方面均略有不足,本研究以锂电池内部故障问题作为切入方向,对基于孤立森林算法的锂电池内部故障分析策略展开研究综述,重点说明了... 锂电池内部故障诊断这一关键问题,一直是锂电池设计研究的重点,传统故障检测方法在实时性、精度及适应性方面均略有不足,本研究以锂电池内部故障问题作为切入方向,对基于孤立森林算法的锂电池内部故障分析策略展开研究综述,重点说明了锂电池故障对其运行安全性的影响,也就孤立森林算法的应用可行性进行探究。文章首先分析了故障数据采集与预处理的必要性,并在此基础上综述了孤立森林算法的模型结构,再从异常分数计算、故障判定、故障诊断三方面,阐述孤立森林算法下锂电池内部故障分析策略的有效性。 展开更多
关键词 孤立森林 锂电池 内部故障
在线阅读 下载PDF
融合多粒度代码特征和孤立森林算法的配置类型识别
6
作者 刘源 刘大伟 +1 位作者 张玉秀 吴明磊 《计算机工程与应用》 北大核心 2025年第13期185-199,共15页
“高内聚、低耦合”设计原则的普及应用,使得代码中通常存在着专门管理配置选项或配置方法的特殊类型,称为配置类型。配置类型有助于研究人员从属性角度和行为角度增进对配置机制的理解,并为配置错误处理技术提供必要的选项集合以及选... “高内聚、低耦合”设计原则的普及应用,使得代码中通常存在着专门管理配置选项或配置方法的特殊类型,称为配置类型。配置类型有助于研究人员从属性角度和行为角度增进对配置机制的理解,并为配置错误处理技术提供必要的选项集合以及选项数据流信息。然而,配置类型研究尚不充分,其识别仍依赖于人工检索。提出一种融合多粒度代码特征和孤立森林算法的配置类型识别方法。基于10个具有代表性的开源软件,手动构建配置类型数据集,通过实证调研配置类型的分布、分类和识别影响因素,总结得到9个调研结果,用于指导配置类型识别。基于调研结果,选取覆盖代码词汇、结构、语义和语法信息的4个类型级粗粒度特征和3个方法级细粒度特征,并为每个特征设计量化算法。考虑到配置类型存在样本类别分布不平衡问题,将识别问题转化为异常检测问题,利用孤立森林算法推荐配置类型,同时设计启发规则减少误报数量。在5个评估软件上的实验结果表明,该方法能识别出每个软件的配置类型,平均精度均值为0.86,平均时间开销为21min,已初步具备代替人工识别的能力。 展开更多
关键词 软件配置 配置类型识别 实证调研 多粒度代码特征 孤立森林 配置方法
在线阅读 下载PDF
基于平滑阈值与孤立森林的大坝监测数据异常检测
7
作者 张瑜 秦学 彭浩 《人民黄河》 北大核心 2025年第3期141-145,共5页
为解决孤立森林算法检测大坝异常数据时因不能识别数据间趋势性和相关性而造成数据误判的问题,提出基于平滑阈值与孤立森林的大坝监测数据异常检测算法。首先利用小波变换提取时序数据的趋势项,然后使用ARMA模型对提取的趋势项数据确定... 为解决孤立森林算法检测大坝异常数据时因不能识别数据间趋势性和相关性而造成数据误判的问题,提出基于平滑阈值与孤立森林的大坝监测数据异常检测算法。首先利用小波变换提取时序数据的趋势项,然后使用ARMA模型对提取的趋势项数据确定动态阈值区间,最后利用孤立森林算法检测出散落在阈值区间外的异常值。以贵州省毕节市夹岩水利枢纽工程混凝土面板堆石坝为例,分别对大坝坝基、坝体、周边缝及面板4个部位监测数据进行检测,验证算法效果。结果表明:与传统孤立森林算法相比,基于平滑阈值与孤立森林的算法对压力、观测房沉降量、开合度、应力的误判率分别降低了12.2、13.4、7.1、8.0个百分点。 展开更多
关键词 小波变换 ARMA模型 孤立森林 异常检测 大坝 毕节市夹岩水利枢纽工程
在线阅读 下载PDF
考虑载客状态的改进孤立森林浮动车异常数据检测算法 被引量:5
8
作者 任其亮 徐韬 +1 位作者 刘媛 程龙春 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第1期124-131,共8页
为提高浮动车数据中异常数据检测能力及不同载客状态下的模型检测分析能力,提出基于S-DTA-IIForest(Summation&Difference Third Order Average&Improvement-Isolation Forest)的浮动车数据异常检测算法。构建由相邻两项求和(S... 为提高浮动车数据中异常数据检测能力及不同载客状态下的模型检测分析能力,提出基于S-DTA-IIForest(Summation&Difference Third Order Average&Improvement-Isolation Forest)的浮动车数据异常检测算法。构建由相邻两项求和(S)、三阶求和平均差分(DTA)的二维度空间SDTA特征向量;提出差额累计更新和动态区分辨识的改进孤立森林IIForest算法,通过设置停止阈值参数,避免当出现新样本异常值分数大于停止阈值时,仅更新样本不更新孤立森林模型的问题,设计每个二叉树区分辨识度参数,区分辨识度位于停止区间时停止二叉树生长,提高算法收敛性能,以ROC(Receiver Operating Characteristic)曲线下面积AUC(Area Under ROC Cure)、F1-score为指标对模型精度进行对比分析,并以重庆市中心城区学府大道开展实例验证。结果表明:本文S-DTA-IIForest组合算法AUC、F1-score分别为86.63%、0.89,AUC较传统孤立森林IForest(Isolation Forest)提高32.4%,运行效率提高1.29%,具有收敛速度更快、精度更高的优势,载客条件下模型AUC、F1-score较未载客分别提高7.7%、10.8%,组合算法对载客数据有更高的检测精度,且未载客状态数据异常率较载客状态增加71.4%,未载客数据异常率更高。 展开更多
关键词 智能交通 异常数据检测 改进孤立森林 浮动车数据 S-DTA算法
在线阅读 下载PDF
基于孤立森林算法的弹性光网络异常流量自动识别方法 被引量:6
9
作者 李橙 何孙秦 +1 位作者 卫星 张国华 《激光杂志》 CAS 北大核心 2024年第1期179-183,共5页
弹性光网络流量传输受到时间波动导致异常,为了提高网络传输稳定性,提出基于孤立森林算法的弹性光网络异常流量自动识别算法。根据流量的异常分布特征和正常数据的差异性进行波谱密度检测,构建弹性光网络流量的谱特征提取模型,通过低通... 弹性光网络流量传输受到时间波动导致异常,为了提高网络传输稳定性,提出基于孤立森林算法的弹性光网络异常流量自动识别算法。根据流量的异常分布特征和正常数据的差异性进行波谱密度检测,构建弹性光网络流量的谱特征提取模型,通过低通滤波器卷积向量重组,实现对异常流量的谱特征筛选,采用孤立森林算法实现对网络流量异常检测的自适应寻优控制,结合多维空间结构重组方法实现对弹性光网络异常流量检测和识别。结果表明,漏检率及误检率较低,分别为3.16%,1.03%。检测用时较少,仅用16秒。在进行检测时,外部入侵率未超过1%,抗扰性较强。 展开更多
关键词 孤立森林算法 弹性光网络 异常流量 谱特征提取
在线阅读 下载PDF
基于分割点改进孤立森林的网络入侵检测方法 被引量:3
10
作者 余长宏 许孔豪 +1 位作者 张泽 高明 《计算机工程》 CAS CSCD 北大核心 2024年第6期148-156,共9页
随着网络攻击的不断增多和日益复杂化,传统基于监督的网络入侵检测算法不能准确识别没有类别标记或特征不明显的网络访问链接,而对于无监督的网络入侵检测算法,也存在检测效率和准确率低等问题。针对如何进一步提升网络入侵检测性能,提... 随着网络攻击的不断增多和日益复杂化,传统基于监督的网络入侵检测算法不能准确识别没有类别标记或特征不明显的网络访问链接,而对于无监督的网络入侵检测算法,也存在检测效率和准确率低等问题。针对如何进一步提升网络入侵检测性能,提出使用自编码器(AE)与分割点改进孤立森林模型对网络入侵进行检测。首先,对无监督自编码器进行L1正则化,以增强自编码器的稀疏性,通过学习数据内在结构,自适应地提取具有判别性的特征,完成入侵攻击的特征提取;然后,使用改进的孤立森林分离异常点,即使用最大化均值与标准差之商来确定分割点划分最佳超平面来构建隔离树,使隔离树在相关子空间中具有更强隔离异常值的能力,并通过遍历所有隔离树中数据点的平均路径长度得到异常得分来判定异常流量。在KDDCUP99和UNSW-NB15数据集上的实验结果表明,与6种传统无监督方法相比,该方法较传统孤立森林准确率和召回率均提升约20%,F1值和曲线下面积(AUC)值均提升约10%,较其他无监督方法相比大幅降低了误码率。 展开更多
关键词 网络入侵检测 稀疏自编码器 孤立森林 无监督学习 隔离树
在线阅读 下载PDF
基于节点评估与最大类间方差的孤立森林异常值检测 被引量:1
11
作者 严爱军 和世潇 汤健 《北京工业大学学报》 CAS CSCD 北大核心 2024年第10期1188-1197,共10页
针对孤立森林(isolation forest, iForest)无法有效检测局部异常值且异常值分数阈值难以精确设定的问题,提出一种基于节点评估(node evaluation, NE)与最大类间方差(Otsu)的iForest异常值检测方法。首先,在样本评估过程中将节点深度与... 针对孤立森林(isolation forest, iForest)无法有效检测局部异常值且异常值分数阈值难以精确设定的问题,提出一种基于节点评估(node evaluation, NE)与最大类间方差(Otsu)的iForest异常值检测方法。首先,在样本评估过程中将节点深度与相对质量同时引入评分机制,使算法对全局和局部异常值敏感;然后,为了准确设定分数阈值,采用Otsu自适应设定异常值分数阈值;最后,在不同数据集上验证所提方法的有效性。实验结果表明,该方法可以有效兼顾全局和局部异常值的检测,提高iForest检测异常值的准确性。 展开更多
关键词 孤立森林(isolation forest iForest) 异常值检测 最大类间方差(Otsu) 节点评估(node evaluation NE) 分数阈值 节点深度
在线阅读 下载PDF
基于孤立森林算法的锂离子电池微内短路故障诊断方法 被引量:2
12
作者 郭煜 王亦伟 +3 位作者 彭鹏 王银飞 丘意书 蒋方明 《储能科学与技术》 CAS CSCD 北大核心 2024年第11期4102-4112,共11页
电池系统的内短路故障是造成电池热失控和火灾事故的主要原因之一,因此有必要对电池内短路故障进行诊断对事故做出早期预警。孤立森林算法是一种无监督的异常检测算法,被广泛应用于异常数据识别领域。根据串联电池组中内短路电池的电压... 电池系统的内短路故障是造成电池热失控和火灾事故的主要原因之一,因此有必要对电池内短路故障进行诊断对事故做出早期预警。孤立森林算法是一种无监督的异常检测算法,被广泛应用于异常数据识别领域。根据串联电池组中内短路电池的电压会与正常电池发生偏离的特点,本文提出了基于孤立森林算法的锂离子电池微内短路故障诊断方法。为了对方法进行验证,本文构建了串联电池组进行了不同短路电阻和充放电工况的短路实验,并在实际运行工况下对一个锂离子电池储能系统进行了电池短路实验,然后利用孤立森林算法对实验数据进行分析诊断。结果表明,对于循环充放电工况,孤立森林算法对短路电阻为1000Ω的短路故障诊断精准率超过了74%,召回率超过了76%,准确率超过了91%;在模拟电动汽车实际驾驶的动态工况中,算法对300Ω的短路故障诊断精准率和召回率超过了86%,准确率超过了95%;算法对电池储能系统在实际运行工况下25Ω的内短路故障检测召回率大于98%。实验结果表明,孤立森林算法可以在多种工况下对锂离子电池微内短路故障进行有效检测,被检测出的锂离子电池内短路电阻达到了千欧姆数量级。 展开更多
关键词 锂离子电池 孤立森林算法 微内短路故障 电池储能系统
在线阅读 下载PDF
基于专家反馈的广义孤立森林异常检测算法 被引量:6
13
作者 祝诚勇 黄鹏翔 李理敏 《计算机应用研究》 CSCD 北大核心 2024年第1期88-93,共6页
针对孤立森林算法无法检测与轴平行的局部异常点以及树结构无法动态更新等问题,提出了一种基于专家反馈的广义孤立森林异常检测算法。首先,将数据映射在单位特征向量上,从映射区域内选择分割点划分数据空间,重复此操作构造出一棵广义孤... 针对孤立森林算法无法检测与轴平行的局部异常点以及树结构无法动态更新等问题,提出了一种基于专家反馈的广义孤立森林异常检测算法。首先,将数据映射在单位特征向量上,从映射区域内选择分割点划分数据空间,重复此操作构造出一棵广义孤立树;然后,给广义孤立森林中每棵树的叶节点引入权重,综合考虑子空间划分次数和子空间内样本数量对数据异常分数的影响;最后,计算每个数据的加权异常分数,并选择异常分数较大的数据交由专家进行批量标注,算法根据标注结果更新叶节点权重,从而实现树结构的动态调整。实验结果表明,该算法在7个数据集中专家标注真实异常的数量优于其他同类树结构算法,并在12个数据集中平均准确率比孤立森林、扩展孤立森林和广义孤立森林分别提升了38.952%、49.144%和49.144%。 展开更多
关键词 异常检测 孤立森林 动态更新 专家反馈
在线阅读 下载PDF
基于孤立森林的取水数据异常值检测 被引量:1
14
作者 徐浩 刘怀利 瞿暄 《水电能源科学》 北大核心 2024年第9期29-32,59,共5页
为快速准确地检测出供水企业取水量数据的异常值,提出了基于孤立森林的无监督学习算法,以安徽省水资源取水监测平台提供的A~D四个供水企业取水量数据为例,并通过试验将其与传统箱线图法和有监督学习的k近邻算法进行比较。结果表明,基于... 为快速准确地检测出供水企业取水量数据的异常值,提出了基于孤立森林的无监督学习算法,以安徽省水资源取水监测平台提供的A~D四个供水企业取水量数据为例,并通过试验将其与传统箱线图法和有监督学习的k近邻算法进行比较。结果表明,基于孤立森林的无监督学习算法因其独特的树状结构,使其在进行点异常值检测时平均F1、AAUC值分别达到0.9630、0.9980,较k近邻算法分别高约56.40%、22.47%,较箱线图法分别高约18.92%、9.70%。虽然模拟区间异常取水行为时,基于孤立森林的无监督学习算法性能有所下降,但稳定性仍优于k近邻算法和箱线图法,这表明在异常数据类型检测方面基于孤立森林的无监督学习算法具有一定优越性。 展开更多
关键词 异常值检测 取水量 孤立森林 K近邻 箱线图
在线阅读 下载PDF
基于密度子空间孤立森林的异常用电检测 被引量:3
15
作者 李沛智 刘立群 薄轶帅 《科学技术与工程》 北大核心 2024年第10期4115-4123,共9页
针对传统异常用电检测在面临高维数据中的维数诅咒,以及不相关特征对异常检测的影响,造成检测精度低等问题,提出了一种基于无监督密度子空间选择的孤立森林检测算法。首先,提出了一种有效的基于密度的紧凑数据表示方法,提高了子空间选... 针对传统异常用电检测在面临高维数据中的维数诅咒,以及不相关特征对异常检测的影响,造成检测精度低等问题,提出了一种基于无监督密度子空间选择的孤立森林检测算法。首先,提出了一种有效的基于密度的紧凑数据表示方法,提高了子空间选择策略的效率。然后,应用最小冗余-最大相关-密度准则(min-redundancy-maximum-relevance-to-density,mRMRD),用于选择基于互信息的相关子空间。最后,在相关子空间中构建隔离树并集成孤立森林,实现对异常用电数据的检测。通过实验分析,与传统检测算法相比,所提方法在准确率、ROC曲线下面积(area under curve,AUC)、F 1指标上均有提升,提高了异常用电检测的效果。同时,灵敏性分析也验证了无监督密度子空间孤立森林检测算法的有效性。 展开更多
关键词 异常用电检测 互信息 最小冗余-最大相关-密度 子空间 孤立森林
在线阅读 下载PDF
雾环境中基于深自编码器和扩展孤立森林的入侵检测方法 被引量:2
16
作者 蔡黎亚 田英杰 《计算机应用与软件》 北大核心 2024年第2期305-310,共6页
针对物联网中多变性的入侵行为,在雾计算模式下提出一种基于深自编码器和扩展孤立森林相混合的入侵检测方法。使用一维卷积神经网络(1D-CNN)实现的自编码器对雾节点采集的网络流量数据进行入侵检测,并将攻击和正常流量数据分为两组;采... 针对物联网中多变性的入侵行为,在雾计算模式下提出一种基于深自编码器和扩展孤立森林相混合的入侵检测方法。使用一维卷积神经网络(1D-CNN)实现的自编码器对雾节点采集的网络流量数据进行入侵检测,并将攻击和正常流量数据分为两组;采用扩展孤立森林算法分别对深自编码器区分的攻击流量和正常流量进行异常检测,尝试识别攻击组和正常组中不匹配的数据点,从而提高所提方法的整体检测准确度和降低误报率。与其他入侵检测方法相比,所提方法在多个指标中取得最佳的结果,能够有效识别快速演化的网络攻击。 展开更多
关键词 雾计算 深自编码器 扩展孤立森林 入侵检测方法
在线阅读 下载PDF
基于改进孤立森林算法的风电机组异常数据清洗 被引量:7
17
作者 魏泰 贺少雄 +1 位作者 胡子武 曹立新 《科学技术与工程》 北大核心 2024年第9期3691-3699,共9页
风电机组的风速、功率数据是衡量风电机组正常运行的关键参数,然而其中包含大量的异常数据,需要进行清洗。提出了一种改进的孤立森林算法,先使用四分位法确定孤立森林正常数据评分与异常数据评分的分界线,再划分风速区间改变边缘数据的... 风电机组的风速、功率数据是衡量风电机组正常运行的关键参数,然而其中包含大量的异常数据,需要进行清洗。提出了一种改进的孤立森林算法,先使用四分位法确定孤立森林正常数据评分与异常数据评分的分界线,再划分风速区间改变边缘数据的异常性,最后使用最小二乘法曲线拟合去误差去除小概率离散型和小概率堆积型异常数据的改进方法来对风速、功率的异常数据进行清洗。结果表明:与传统的孤立森林算法相比,改进的孤立森林算法能够正确界定正常数据评分与异常数据评分的分界线,可以去除堆积型异常数据,且对于数据主带边缘的离散型异常数据具有更好的清洗效果。 展开更多
关键词 风电机组 孤立森林 异常数据 四分位法
在线阅读 下载PDF
融合孤立森林和深度学习的GNSS-IR土壤湿度反演
18
作者 杨晓峰 魏浩翰 +1 位作者 张强 向云飞 《测绘通报》 CSCD 北大核心 2024年第7期88-94,共7页
针对GNSS反射信号遥感中单一特征参数数据质量参差不齐、可靠性差,模型反演结果不稳定的问题,本文提出了一种融合孤立森林和深度学习的GNSS-IR土壤湿度反演方法。试验结果表明,GNSS SNR的频率特征参数不适合土壤湿度的反演,而其振幅、... 针对GNSS反射信号遥感中单一特征参数数据质量参差不齐、可靠性差,模型反演结果不稳定的问题,本文提出了一种融合孤立森林和深度学习的GNSS-IR土壤湿度反演方法。试验结果表明,GNSS SNR的频率特征参数不适合土壤湿度的反演,而其振幅、相位特征参数与土壤湿度的相关性较高,可用于土壤湿度的反演;CNN、DBN和GRU 3种深度学习模型融合振幅和相位特征参数的反演结果与实测土壤湿度吻合度都较高;相比于仅利用振幅或相位的单一特征参数反演方法,本文方法反演精度提高了21.4%~55.8%,相关系数提高了4%~9.1%。 展开更多
关键词 土壤湿度 GNSS-IR 深度学习 孤立森林
在线阅读 下载PDF
基于孤立森林的多离群点数据检测算法设计 被引量:3
19
作者 李加军 《现代电子技术》 北大核心 2024年第5期139-142,共4页
精准找出异常离群数据有利于确保大规模数据在应用中的精确度,为此,设计了基于孤立森林的多离群点数据检测算法。首先,采用近似符号聚合算法处理大规模数据的多条件时间序列,再通过计算欧氏距离分析多条件时间序列的相似度,而后采用加... 精准找出异常离群数据有利于确保大规模数据在应用中的精确度,为此,设计了基于孤立森林的多离群点数据检测算法。首先,采用近似符号聚合算法处理大规模数据的多条件时间序列,再通过计算欧氏距离分析多条件时间序列的相似度,而后采用加权调整法调整相似曲线,剔除其中的异常数据,完成对大规模数据的清洗;利用清洗后的数据构建孤立树形成孤立森林,将待检测数据作为孤立森林的输入量,通过计算数据样本点到每棵树根节点的距离,实现对离群点数据的检测。实验结果表明:该算法能够有效地检测出离群点数据,在针对大规模数据离群点的检测时,检测结果精确度较高。 展开更多
关键词 孤立 孤立森林 离群点 大规模数据 异常检测 相似度测量 数据清洗 时间序列
在线阅读 下载PDF
基于改进孤立森林算法的交通流异常数据检测模型 被引量:4
20
作者 宫晓婞 董培信 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期61-69,90,共10页
针对交通流异常数据实时检测问题,提出一种基于改进孤立森林算法与K-Means++算法相结合的交通流异常数据检测模型。首先,使用交通流量和交通流速度数据构建交通流序列;然后,利用改进孤立森林算法,构建交通流数据的异常评分模型,并通过K-... 针对交通流异常数据实时检测问题,提出一种基于改进孤立森林算法与K-Means++算法相结合的交通流异常数据检测模型。首先,使用交通流量和交通流速度数据构建交通流序列;然后,利用改进孤立森林算法,构建交通流数据的异常评分模型,并通过K-Means++算法构建滑动窗口计算出异常评分的阈值,以此来实现对交通流数据异常值的实时检测;最后,通过实例分析验证模型的合理性和可行性。研究结果表明:改进孤立森林算法与K-Means++结合的方法可以准确地确定异常评分的阈值进而检测出异常数据;该模型与仅考虑交通流流量的模型、传统孤立森林模型相比,AUC分别高出29.7%和5.3%,与其他常用的LOF、ABOD、OCSVM方法相比,AUC均有所提高。该模型准确率明显提升,在交通流异常数据检测中具有更好的适用性,能够为交通管理部门提供交通状况检测支持,提高交通管理效率。 展开更多
关键词 交通工程 异常检测模型 改进孤立森林算法 交通流数据 K-Means++算法
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部