期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于改进LOF的高维数据异常检测方法 被引量:3
1
作者 王锐 《电信工程技术与标准化》 2023年第3期41-45,62,共6页
作为数据挖掘的核心问题之一,检测离群点或异常值是及时发现故障和隐患问题的重要判断依据。随着物联网设备量的持续增长,传统的单维异常检测算法已经难以满足日益复杂的大数据应用场景。对多维、庞大的数据流进行异常检测时,容易发生... 作为数据挖掘的核心问题之一,检测离群点或异常值是及时发现故障和隐患问题的重要判断依据。随着物联网设备量的持续增长,传统的单维异常检测算法已经难以满足日益复杂的大数据应用场景。对多维、庞大的数据流进行异常检测时,容易发生检测速度慢和研判准确度下降的问题。本文提出了一个基于高维数据的改进LOF异常检测算法,以提高检测速度和检测精度。同时构建了一个面向海量监控指标数据的流式处理框架,保障异常检测的正常运行。实验结果表明,改进后的算法在准确率和计算效率上有明显提升。 展开更多
关键词 大数据 高维数据 异常检测 lof算法
在线阅读 下载PDF
幅度与频率联合测量的LOFAR浮标定位算法
2
作者 陶林伟 王英民 苟艳妮 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2014年第1期74-80,共7页
在LOFAR浮标应用中,为了在目标经过CPA点之前完成其运动参数的估计,提出了一种基于目标辐射噪声幅度和频率联合测量来计算单目标运动参数的无误差理论算法。使用3次等间隔的目标幅度及频率测量值,推导出无误差的目标特征频率、绝对速度... 在LOFAR浮标应用中,为了在目标经过CPA点之前完成其运动参数的估计,提出了一种基于目标辐射噪声幅度和频率联合测量来计算单目标运动参数的无误差理论算法。使用3次等间隔的目标幅度及频率测量值,推导出无误差的目标特征频率、绝对速度、最接近点距离、辐射噪声幅度的理论公式。针对LOFAR实际使用特点,利用最小二乘估计理论提高了目标参数估计精度。计算机仿真表明,该算法在理论上是一个无误差的计算方法,空气模拟实验证明了该算法在工程实际使用中的可行性及有效性。 展开更多
关键词 lofAR浮标 定位算法 参数估计 最接近点距离 多普勒频移 幅度测量 频率测量
在线阅读 下载PDF
基于AP-LOF离群组检测的配电网连接验证 被引量:6
3
作者 司方远 韩英华 +1 位作者 赵强 汪晋宽 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第8期1070-1074,共5页
现有配电网连接验证工作将可疑异常值视为具有二元属性的独立个体,因此难以有效识别和验证具有高度内在相关性的局部离群组.针对这一问题,提出了基于AP-LOF离群组检测的配电网连接验证方法.通过引入近邻传播(affinity propagation,AP)... 现有配电网连接验证工作将可疑异常值视为具有二元属性的独立个体,因此难以有效识别和验证具有高度内在相关性的局部离群组.针对这一问题,提出了基于AP-LOF离群组检测的配电网连接验证方法.通过引入近邻传播(affinity propagation,AP)聚类方法,将待校验台区用户聚类为多簇,并基于局部离群因子(local outlier factor,LOF)算法对所有簇心进行离群点检测,从而准确识别出台区内的离群组用户.以某电力公司实际用户电压数据进行算例分析,结果证明了AP-LOF算法在配电网连接验证中的适用性和有效性. 展开更多
关键词 电压数据分析 配电网连接验证 局部离群组检测 近邻传播聚类 lof算法
在线阅读 下载PDF
基于LOF算法的多维混合型数据控制图设计 被引量:1
4
作者 张乔微 李艳婷 《工业工程》 北大核心 2020年第3期145-153,共9页
为了解决含顺序型和名义型变量混合型数据的监测问题,提出了一种基于LOF算法的多维混合型数据控制图(mixed-type data local outlier factor control chart,MLOF)。在监测过程变量变化的过程中,该控制图充分考虑了顺序型变量的等级特性... 为了解决含顺序型和名义型变量混合型数据的监测问题,提出了一种基于LOF算法的多维混合型数据控制图(mixed-type data local outlier factor control chart,MLOF)。在监测过程变量变化的过程中,该控制图充分考虑了顺序型变量的等级特性和名义型变量的信息熵,基于数据的密度来衡量观测点的异常程度。分别使用基于信用卡申请数据集的仿真案例和基于德国信用卡数据集的实例,对比MLOF控制图和现有混合型数据控制图在异常点检测上的表现。仿真案例共模拟了30种监测场景。结果表明,在57%的场景中,MLOF控制图的综合表现都是最好的。而实例也验证了MLOF控制图更适用于数据量大、聚类情况复杂的混合型数据监测过程中。 展开更多
关键词 多维混合型数据 信息熵 距离量度 lof算法 Mlof控制图
在线阅读 下载PDF
基于时间序列压缩分割的监测数据异常识别算法研究 被引量:3
5
作者 蒲黔辉 张子怡 +2 位作者 肖图刚 洪彧 文旭光 《桥梁建设》 EI CSCD 北大核心 2024年第3期15-23,共9页
为有效识别桥梁健康监测数据的异常,减少误预警、漏预警现象,保障桥梁监测数据的质量和有效性,针对大跨度斜拉桥长期监测数据的缺失、离群和漂移3类异常数据,提出基于时间序列压缩分割的监测数据异常识别算法。该算法将原始监测数据时... 为有效识别桥梁健康监测数据的异常,减少误预警、漏预警现象,保障桥梁监测数据的质量和有效性,针对大跨度斜拉桥长期监测数据的缺失、离群和漂移3类异常数据,提出基于时间序列压缩分割的监测数据异常识别算法。该算法将原始监测数据时间序列通过基于序列重要点(Series Importance Point, SIP)的时间序列线性分段(Piecewise Linear Represent, PLR)算法(PLR_SIP)得到数条时间子序列;然后采用欧氏距离进行时间子序列的相似性分析,并基于改进的局部离群因子(Local Outlier Factor, LOF)算法计算每条时间子序列的局部离群因子;最后将其与设定的阈值相比较,从而识别出监测数据的异常。为验证该算法的准确性与工程实用性,对某公路大跨度斜拉桥健康监测数据进行异常识别。结果表明:采用PLR_SIP算法对原始时间序列压缩分割得到的时间子序列能够准确地反映原序列的变化趋势和范围;改进的LOF算法突破了传统LOF算法仅能识别离群值这类无持续时间异常的局限性,能够排除噪声的干扰,实现对离群、缺失和漂移3种异常的识别。该算法无需定义训练集,直接以原始监测数据作为算法的输入,同时能够自适应调整阈值参数,具有良好的可扩展性、实时性、准确性和高效性,适用于处理实时、大量的桥梁健康监测数据。 展开更多
关键词 斜拉桥 健康监测数据 异常识别 PLR_SIP算法 lof算法 时间序列 欧氏距离 局部离群因子
在线阅读 下载PDF
基于相似测点对比的大坝变形监测数据粗差识别方法
6
作者 陈立秋 顾冲时 +2 位作者 邵晨飞 顾昊 高睿颖 《水利水电科技进展》 CSCD 北大核心 2024年第4期72-77,共6页
针对混凝土坝变形监测数据粗差检测方法难以区分粗差和环境突变引起的数据跳跃问题,提出了一种基于K-means++距离聚类算法分区,采用OPTICS密度聚类算法结合局部异常因子(LOF)算法识别监测数据中粗差的大坝变形监测数据粗差识别方法。该... 针对混凝土坝变形监测数据粗差检测方法难以区分粗差和环境突变引起的数据跳跃问题,提出了一种基于K-means++距离聚类算法分区,采用OPTICS密度聚类算法结合局部异常因子(LOF)算法识别监测数据中粗差的大坝变形监测数据粗差识别方法。该方法通过K-means++算法实现测点区域划分,联合使用OPTICS算法和LOF算法进行粗差确定,通过对比属于同一分区不同测点的粗差出现时间来判定真实粗差。算例分析结果表明,该方法能有效鉴别变形监测数据中由环境突变引起的数据跳跃,显著提高粗差识别的准确性,降低粗差误判率。 展开更多
关键词 大坝变形监测数据 粗差 环境变化 K-means++算法 OPTICS算法 lof算法
在线阅读 下载PDF
结合MapReduce框架的离群因子检测算法
7
作者 徐树奎 张煜 +2 位作者 李海霞 常海艳 张和伟 《火力与指挥控制》 CSCD 北大核心 2024年第11期128-132,共5页
离群因子检测目的是检测与大部分其他对象显著不同的数据对象。近年来,在某些分组计算应用场景下,数据量十分巨大,现有算法采用的欧氏距离计算开销不断增大,存在两个较有挑战性问题:1)组间数据对象数量十分巨大,计算耗时较长,开销较大;2... 离群因子检测目的是检测与大部分其他对象显著不同的数据对象。近年来,在某些分组计算应用场景下,数据量十分巨大,现有算法采用的欧氏距离计算开销不断增大,存在两个较有挑战性问题:1)组间数据对象数量十分巨大,计算耗时较长,开销较大;2)数据对象维度逐渐增多,算法时间开销大。将MapReduce计算框架与LOF算法相结合,解决上述问题。实验证明,引入了MapReduce分布式计算框架的改进算法可以有效提升大量数据中检测离群点的效率。 展开更多
关键词 离群因子检测 lof算法 MAPREDUCE框架 分布式计算
在线阅读 下载PDF
一种新的基于密度的聚类与孤立点检测算法 被引量:4
8
作者 刘大任 孙焕良 +1 位作者 牛志成 朱叶丽 《沈阳建筑大学学报(自然科学版)》 CAS 2006年第1期149-153,共5页
目的提出一种聚类分析的新算法,解决聚类和同时检测孤立点的问题.方法结合SNN算法和LOF算法给出新算法-SNN LOF算法原理:(1)建立相似度矩阵;(2)去除噪声;(3)密度;(4)标记核心点;(5)计算每个数据点的lrd值;(6)由核心对象出发来形成一个聚... 目的提出一种聚类分析的新算法,解决聚类和同时检测孤立点的问题.方法结合SNN算法和LOF算法给出新算法-SNN LOF算法原理:(1)建立相似度矩阵;(2)去除噪声;(3)密度;(4)标记核心点;(5)计算每个数据点的lrd值;(6)由核心对象出发来形成一个聚;(7)取出被作为噪声的数据点;(8)计算被定义为噪声数据的LOF值,输出被视为孤立点的数据点.编制算法程序实现聚类和孤立点检测.结果用CURE数据集,DBSCAN聚类算法和SNN聚类算法结果相同,时间消耗是很接近的.但当数据上升到10 000以上时,SNN LOF算法聚类的效率明显要高于DB-SCAN算法,同时也检测到了孤立点.结论SNN LOF算法可以在聚类的同时发现孤立点.在大数据量时,SNN LOF算法的聚类时间效率明显要高于DBSCAN算法. 展开更多
关键词 聚类 孤立点 SNN算法 lof检测算法
在线阅读 下载PDF
基于Hadoop的分布式财务异常数据分析系统设计 被引量:7
9
作者 王金元 王宇 +4 位作者 张亚松 林昊 龚致富 李盼 安新艳 《信息技术》 2022年第1期21-25,31,共6页
传统的异常数据监测算法依靠单台计算机对异常数据进行识别,识别速度慢,且无法满足对数据处理的精确性要求。针对上述问题,文中构建了Hadoop分布式财务异常数据分析模型。该模型采用Hadoop中的MapReduce框架作为并行计算框架,同时在数... 传统的异常数据监测算法依靠单台计算机对异常数据进行识别,识别速度慢,且无法满足对数据处理的精确性要求。针对上述问题,文中构建了Hadoop分布式财务异常数据分析模型。该模型采用Hadoop中的MapReduce框架作为并行计算框架,同时在数据异常检测算法方面引入了邻域关系的LOF算法,有效避免了数据集元素边缘可能会出现误判的情况。数值实验结果表明,文中所提算法的准确率相比其他3种同类算法提升了5%以上,且算法的总运行时间也明显缩短。由此可见,文中所提模型可快速、准确地检测出财务异常数据,保障医疗系统的平稳运行。 展开更多
关键词 HADOOP集群 并行算法 lof算法 异常数据检测 MAPREDUCE框架
在线阅读 下载PDF
一种动车组转向架装配线电机传动系统健康状态评估优化方法研究 被引量:1
10
作者 张宁 刘锐 《铁道学报》 EI CAS CSCD 北大核心 2020年第5期66-71,共6页
对于动车组转向架装配线,电机传动系统是其关键部分,由于其运行状态的实时监测数据具有无标签性,采用K-Means聚类等无监督式学习算法是解决这类系统健康状态评估的常用方法。针对传统K-Means算法受噪声及孤立点影响较大的缺陷,提出基于... 对于动车组转向架装配线,电机传动系统是其关键部分,由于其运行状态的实时监测数据具有无标签性,采用K-Means聚类等无监督式学习算法是解决这类系统健康状态评估的常用方法。针对传统K-Means算法受噪声及孤立点影响较大的缺陷,提出基于局部异常因子算法的优化方法,有效地去除数据噪声点的影响;针对中心点选取过于随机性的缺陷,提出一种基于样本密度的初始中心点选取方法,并且中心点更新是选取距簇中其他样本点方差最小的点,从而改善了聚类效果;利用实际电机传动系统的运行数据对优化的K-Means算法进行验证。实验结果表明:优化后的算法有效提高了聚类质量,很好解决了实际应用环境下的电机传动系统健康状态评估问题。 展开更多
关键词 电机传动系统 健康状态评估 K-MEANS算法 lof算法
在线阅读 下载PDF
基于改进的局部异常因子检测的优化聚类算法 被引量:13
11
作者 张丹丹 游子毅 +1 位作者 郑建 陈世国 《微电子学与计算机》 北大核心 2019年第11期43-48,共6页
聚类分析在无监督学习领域中一直备受国内外学者关注.针对K-means聚类算法对初始聚类中心点敏感、簇内数据相关性差以及收敛到局部最优的缺点,提出了一种基于离群因子的优化聚类算法.该算法采用信息熵加权欧式距离作为相似性度量依据,... 聚类分析在无监督学习领域中一直备受国内外学者关注.针对K-means聚类算法对初始聚类中心点敏感、簇内数据相关性差以及收敛到局部最优的缺点,提出了一种基于离群因子的优化聚类算法.该算法采用信息熵加权欧式距离作为相似性度量依据,以更明显地区分数据对象间的差异,然后利用k距离参数自调整的局部异常因子检测算法计算出各数据点的离群因子并筛选出初始聚类中心的候选集,最后根据其离群因子加权距离法优化聚类中心.通过在UCI数据集上的实验测试结果表明,优化算法的准确率比K-means++算法、OFMMK-means算法、FCM算法更高,运行速度比FCM算法更快.该算法能够更好地应用于入侵行为检测、信用风险评估以及多故障诊断等领域. 展开更多
关键词 聚类 Kmeans 加权欧式距离 lof算法 优化
在线阅读 下载PDF
基于不平衡数据样本的工控网络态势要素提取
12
作者 王昕 孙磊 《长春工业大学学报》 CAS 2021年第1期40-45,共6页
针对海量工控网络数据样本分布不平衡导致态势要素提取精度低的问题,提出一种基于LOF-SMOTE平衡数据样本的方法。该方法首先用LOF算法在少数类样本点中筛选出分布较分散的样本点,再将筛选样本点通过SMOTE算法生成新的样本点,使各类别样... 针对海量工控网络数据样本分布不平衡导致态势要素提取精度低的问题,提出一种基于LOF-SMOTE平衡数据样本的方法。该方法首先用LOF算法在少数类样本点中筛选出分布较分散的样本点,再将筛选样本点通过SMOTE算法生成新的样本点,使各类别样本数据达到平衡。通过受限玻尔兹曼机(RBM)算法对工控数据的特征进行降维,应用随机森林算法实现工控网络态势要素的提取。通过控制单一变量的方法研究不同参数对最终结果的影响,并在NL_KDD数据集上进行了对比实验。 展开更多
关键词 网络态势要素 lof-SMOTE算法 受限玻尔兹曼机 随机森林
在线阅读 下载PDF
一种动态加权模糊聚类算法的研究 被引量:3
13
作者 刘锐 张宁 《铁路计算机应用》 2018年第5期5-8,17,共5页
针对模糊C均值聚类(FCM)算法选取初始中心具有随机性这一缺陷,利用遗传算法优化FCM算法,根据适应度函数动态确定交叉、变异算子,从而选取最优初始中心,避免FCM算法陷入局部极小;针对FCM受噪声点、孤立点影响较大的缺陷,利用LOF加权降低... 针对模糊C均值聚类(FCM)算法选取初始中心具有随机性这一缺陷,利用遗传算法优化FCM算法,根据适应度函数动态确定交叉、变异算子,从而选取最优初始中心,避免FCM算法陷入局部极小;针对FCM受噪声点、孤立点影响较大的缺陷,利用LOF加权降低数据噪声点对聚类的影响,并将FCM聚类、遗传算法、加权策略相结合,提出一种新的动态加权模糊聚类算法。经UCI通用数据集验证,优化后的聚类算法可以有效提高聚类质量和准确度。 展开更多
关键词 FCM算法 遗传算法 lof算法 权重
在线阅读 下载PDF
基于数据分析方法的动力电池系统滥用故障诊断 被引量:6
14
作者 柏云耀 邹时波 李顶根 《新能源进展》 2020年第1期1-5,共5页
为了提高对于电池滥用故障的检测能力和诊断效率,针对电动汽车动力电池系统以电压、电流和电功率作为主要控制参数的特点,提出了一种基于数据分析方法的动力电池系统滥用故障检测方法。该方法采用局部异常因子(LOF)算法和感知器网络,研... 为了提高对于电池滥用故障的检测能力和诊断效率,针对电动汽车动力电池系统以电压、电流和电功率作为主要控制参数的特点,提出了一种基于数据分析方法的动力电池系统滥用故障检测方法。该方法采用局部异常因子(LOF)算法和感知器网络,研究由于电池滥用对电压、电流等数据的一致性和离散分布的影响。结果表明,由于故障造成的异常数据点,其LOF值远大于正常数据,在感知器分类结果中通常输出为"0"。利用LOF算法可以有效找出数据集中的异常数据点,利用LOF算法处理后的数据对感知器进行训练,可以对数据集进行快速分类,进而判断电池是否发生了滥用故障。该方法可为动力电池系统故障检测提供参考。 展开更多
关键词 电动汽车 动力电池 滥用故障 局部异常因子(lof)算法 感知器网络
在线阅读 下载PDF
航迹点特征的时间窗分割算法的航迹聚类 被引量:4
15
作者 王莉莉 彭勃 《空军工程大学学报(自然科学版)》 CSCD 北大核心 2018年第3期19-23,共5页
现有航迹聚类算法未考虑到航空器航向变化和高度下降等因素对聚类结果的影响,同时聚类过程中缺乏时间信息,另外实测二次雷达数据中存在离群点异常数据,离群点的存在会影响最终的聚类效果,使得聚类结果不准确。提出基于航迹点特征的时间... 现有航迹聚类算法未考虑到航空器航向变化和高度下降等因素对聚类结果的影响,同时聚类过程中缺乏时间信息,另外实测二次雷达数据中存在离群点异常数据,离群点的存在会影响最终的聚类效果,使得聚类结果不准确。提出基于航迹点特征的时间窗分割算法,将航空器进场的航向变化值以及高度下降值作为确定聚类簇大小的影响因素,对进场航空器航迹点数量进行时间窗分割。对真实的进场二次雷达数据仿真分析,从仿真结果中可以看出当影响因子a为0.4时,航迹的曲率最小,聚类效果最好,进而采用层次聚类算法对不同LOF值所对应的航迹点进行聚类,得到最后的聚类结果可以为管制员现场指挥提供技术指导。 展开更多
关键词 航迹聚类 时间窗分割算法 离群点 lof
在线阅读 下载PDF
基于网络性能评价的多元时序相似度算法
16
作者 张亦弛 朱晓强 《电子设计工程》 2023年第11期163-166,172,共5页
针对传统的网络性能相似性评价方法从数据整体进行分析,存在无法描述局部特征且忽略了各个变量间影响与联系等问题,文中提出一种基于网络性能评价的多元时序相似度算法。通过异常检测和聚类的方法提取时序的关键信息,在此基础上,采用MDT... 针对传统的网络性能相似性评价方法从数据整体进行分析,存在无法描述局部特征且忽略了各个变量间影响与联系等问题,文中提出一种基于网络性能评价的多元时序相似度算法。通过异常检测和聚类的方法提取时序的关键信息,在此基础上,采用MDTW算法对模式表示后的多元时序进行相似性度量,结合被动测量的方式采集相关数据进行实验分析。实验结果表明,基于网络性能评价的多元时序相似度算法相较于传统DTW算法,准确率提高约14%,且平均耗时缩短至3 s,有效提高了相似性度量的准确度和效率。 展开更多
关键词 多元时间序列 局部离群因子算法 异常检测 相似度
在线阅读 下载PDF
一种基于目标函数的局部离群点检测方法 被引量:11
17
作者 周玉 朱文豪 孙红玉 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第10期1405-1412,共8页
针对传统的基于密度的局部离群点检测算法对原始数据集没有进行预处理导致该算法在面对未知数据集时检测效果不理想,又由于其需要计算每一个数据点的离群因子,在数据量过多时,计算量大大增加的问题,通过对局部离群点检测算法的分析,提... 针对传统的基于密度的局部离群点检测算法对原始数据集没有进行预处理导致该算法在面对未知数据集时检测效果不理想,又由于其需要计算每一个数据点的离群因子,在数据量过多时,计算量大大增加的问题,通过对局部离群点检测算法的分析,提出了一种基于目标函数的局部离群点检测方法FOLOF(FCM objective function-based LOF).首先,使用肘部法则确定数据集的最佳聚类个数;然后,通过FCM的目标函数对数据集进行剪枝,得到离群点候选集;最后,利用加权局部离群因子检测算法计算候选集中每个点的离群程度.利用该方法在人工数据集和UCI数据集上进行了相关实验,并与其他相关方法进行了对比,结果显示,该算法能够提高离群点检测精度,减少计算量,有效提高离群点检测性能. 展开更多
关键词 离群点检测 模糊C均值算法 目标函数 局部离群因子 剪枝
在线阅读 下载PDF
基于电力数据挖掘的涉污企业用电量预测方法研究 被引量:3
18
作者 成贵学 乔臻 +1 位作者 滕予非 唐伟 《现代电子技术》 2022年第15期151-156,共6页
为对工业涉污企业进行准确管控,提出一种基于用电特性聚类与ConvLSTM神经网络算法结合的涉污企业用电量预测方法。对于企业用电数据中的数据异常与缺失的问题,采用局部离群因子算法(LOF)筛选异常值后输入至灰色模型中进行校正;通过K⁃me... 为对工业涉污企业进行准确管控,提出一种基于用电特性聚类与ConvLSTM神经网络算法结合的涉污企业用电量预测方法。对于企业用电数据中的数据异常与缺失的问题,采用局部离群因子算法(LOF)筛选异常值后输入至灰色模型中进行校正;通过K⁃means算法对修正后的企业历史用电数据进行特征提取并分析其用电特征,考虑影响用电量的因素不仅包括日期特性、节日特性,还提取了重污染天气下政府对涉污企业的管控特性;构建ConvLSTM模型,充分挖掘企业数据时序性特征,有效提高涉污企业短期用电量预测精度。选择四川省成都市涉污企业的用电数据验证模型算法的有效性。验证结果表明,所提方法对于不同企业、不同类型日期均更有效,能更精确地预测企业未来用电的趋势。 展开更多
关键词 企业用电量预测 ConvLSTM lof 灰色模型 K⁃means聚类算法 时序性特征 用电特性聚类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部