期刊文献+
共找到253篇文章
< 1 2 13 >
每页显示 20 50 100
基于离群点检测的业务流程不频繁行为挖掘方法
1
作者 田银花 武于皓 +2 位作者 张如月 韩咚 李昕燃 《山东科技大学学报(自然科学版)》 北大核心 2025年第2期95-103,共9页
随着信息技术的快速发展和数字化转型的不断深入,企业积累了海量的业务数据,其中包含了丰富的业务流程信息。然而,现有过程挖掘方法侧重于频繁行为建模,忽略了事件日志中虽不频繁但具有重要价值的行为。针对上述问题,提出一种基于离群... 随着信息技术的快速发展和数字化转型的不断深入,企业积累了海量的业务数据,其中包含了丰富的业务流程信息。然而,现有过程挖掘方法侧重于频繁行为建模,忽略了事件日志中虽不频繁但具有重要价值的行为。针对上述问题,提出一种基于离群点检测的不频繁行为挖掘方法。从事件日志中提取事件轨迹、频率和标签等信息,借鉴机器翻译领域的以召回率为导向的摘要评价指标(ROUGE)度量轨迹之间的相似度,通过改进的局部离群因子(LOF)算法挖掘不频繁行为。综合考量局部密度、频率和轨迹相似度等信息,使用真实事件日志进行评估,并与现有算法进行对比。实验结果表明,该方法能够有效批量处理事件日志,准确识别其中的不频繁行为,从而提供可靠的挖掘结果。 展开更多
关键词 离群检测 轨迹相似度 不频繁行为挖掘 业务流程 事件日志
在线阅读 下载PDF
基于期望核密度离群因子的离群点检测算法 被引量:3
2
作者 张忠平 孙光旭 +2 位作者 姚春辰 刘硕 齐文旭 《高技术通讯》 CAS 北大核心 2024年第2期187-198,共12页
针对基于密度的离群点检测方法在不同分布的数据集上检测精度低的问题,提出了一种基于期望核密度离群因子的离群点检测算法。首先,引入k近邻和反向k近邻扩展邻域空间(ENS)代替传统的k邻域范围,更加全面地考虑数据对象的邻域信息;其次,... 针对基于密度的离群点检测方法在不同分布的数据集上检测精度低的问题,提出了一种基于期望核密度离群因子的离群点检测算法。首先,引入k近邻和反向k近邻扩展邻域空间(ENS)代替传统的k邻域范围,更加全面地考虑数据对象的邻域信息;其次,在传统核密度估计(KDE)方法的基础上引入多元高斯函数,在扩展邻域空间内估计数据对象的密度,同时借鉴自适应核带宽的思想,更好地适应不同数据集的数据分布;然后,给出期望距离的概念,进一步区分局部离群点和位于低密度区域的正常点;最后,定义了期望核密度离群因子刻画数据对象离群程度。在人工数据集和真实数据集上对所提算法进行实验验证,并与部分传统算法进行对比,验证了所提算法的有效性。 展开更多
关键词 数据挖掘 离群 密度估计(KDE) 期望距离 期望核密度离群因子
在线阅读 下载PDF
基于自适应图自编码器的离群点检测方法
3
作者 谭淇尹 于炯 陈子歆 《计算机科学》 北大核心 2025年第6期129-138,共10页
离群点检测(Outlier Detection)是通过识别数据集中不同于大多数样本的少量个体来获取数据的整体健康状态与异常信息。目前,在处理欧氏结构数据集时,大部分检测算法侧重于将数据视为独立的个体,却忽视了数据实例之间的相关性。这种信息... 离群点检测(Outlier Detection)是通过识别数据集中不同于大多数样本的少量个体来获取数据的整体健康状态与异常信息。目前,在处理欧氏结构数据集时,大部分检测算法侧重于将数据视为独立的个体,却忽视了数据实例之间的相关性。这种信息偏向性导致了一些可能位于正常数据区域内的潜在的离群值难以被有效检测出来。针对上述问题,提出了一种基于自适应邻居的图自动编码器的深度联合表示学习算法ANGAE(Adaptive Neighbor Graph Autoencoder)。该算法从图生成的角度构建图来捕捉数据点之间的关系,并利用结构和属性自动编码器学习数据的潜在表示。ANGAE引入了自适应邻居构图机制,以动态更新图结构,确保在模型训练过程中对不准确的图结构进行调整和改进。通过融合结构嵌入和属性嵌入,ANGAE实现了网络结构和节点属性之间的有效交互。实验结果表明,所提出的方法在11个数据集上表现优异,在保持高精度的同时展现了很好的鲁棒性,其有效性得到了充分证明。 展开更多
关键词 离群检测 深度学习 图卷积网络 图表示学习 属性网络
在线阅读 下载PDF
基于局部相对密度的离群点检测算法
4
作者 何旭 邓安生 葛小龙 《计算机应用与软件》 北大核心 2024年第12期296-302,共7页
数据集中离群点占比很小,但大多现有的方法在检测期间需要对所有数据都进行离群度计算。针对此问题提出一种基于互近邻聚类的正常数据去除算法(EMNC),通过数据预处理最大程度消除正常点。只考虑k最近邻不适用分布异常的离群点,充分利用... 数据集中离群点占比很小,但大多现有的方法在检测期间需要对所有数据都进行离群度计算。针对此问题提出一种基于互近邻聚类的正常数据去除算法(EMNC),通过数据预处理最大程度消除正常点。只考虑k最近邻不适用分布异常的离群点,充分利用对象与其邻居的分布,同时考虑k最近邻、反近邻和共享近邻来进行密度估计。最后重新定义基于局部相对密度的离群度(ROF)对剩余可疑点进行离群判断。该算法在减少离群度计算量的同时提升了检测效率,在合成与真实数据集上和其他方法的对比实验结果表明了算法的有效性。 展开更多
关键词 离群检测 局部相对密度 互近邻聚类 共享近邻
在线阅读 下载PDF
基于CART决策树的分布式数据离群点检测算法 被引量:3
5
作者 朱华 乔勇进 董国钢 《现代电子技术》 北大核心 2024年第16期157-162,共6页
在分布式计算环境中,离群点通常表示数据中的异常情况,例如故障、欺诈、攻击等。通过检测分布式数据的离群点,可以对这些异常数据进行集中处理,保护系统和数据的安全。而进行离群点检测时,不仅要考虑数据的规模和复杂性,还要在分布式环... 在分布式计算环境中,离群点通常表示数据中的异常情况,例如故障、欺诈、攻击等。通过检测分布式数据的离群点,可以对这些异常数据进行集中处理,保护系统和数据的安全。而进行离群点检测时,不仅要考虑数据的规模和复杂性,还要在分布式环境下高效地发现离群点。因此,提出一种基于CART决策树的分布式数据离群点检测算法。在构建CART决策树时,使用类间中心距离作为分裂准则,根据分离类别对训练数据进行分类,从而确定数据的类型。在上述基础上,考虑到离群点的分布模式与其周围数据对象不同,使用空间局部偏离因子(SLDF)对空间内各个数据对象之间的离群程度展开度量,同时在高维空间内展开网格划分,引入SLDF算法检测剩余离群点集,最终实现分布式数据离群点检测。实验结果表明,所提方法的离散点检测错误率在0.010以内,可以更加精准地实现分布式数据离群点检测,具有良好的检测性能。 展开更多
关键词 CART决策树 分布式数据 离群检测 类间距离 数据分类 空间局部偏离因子
在线阅读 下载PDF
基于映射距离比离群因子的离群点检测算法 被引量:1
6
作者 张忠平 姚春辰 +3 位作者 孙光旭 刘硕 张睿博 魏永辉 《计算机集成制造系统》 EI CSCD 北大核心 2024年第5期1719-1732,共14页
针对基于邻近性的离群点检测方法需要花费大量时间过滤正常点,并且在检测全局离群点时难以检测出局部离群点的问题,提出一种基于映射距离比离群因子离群点检测(MDROF)算法。首先,为了减少正常点在检测过程中的时间消耗,给出了差异相似... 针对基于邻近性的离群点检测方法需要花费大量时间过滤正常点,并且在检测全局离群点时难以检测出局部离群点的问题,提出一种基于映射距离比离群因子离群点检测(MDROF)算法。首先,为了减少正常点在检测过程中的时间消耗,给出了差异相似度的概念,通过定义差异相似度剪枝因子过滤掉数据集中的大部分正常点。其次,定义映射k距离,通过映射距离与可达距离的比值刻画数据对象的局部离群程度,通过可达密度刻画数据对象的全局离群程度。最后,结合数据对象相互近邻点的平均排位定义映射距离比离群因子来检测离群点。在人工数据集以及真实数据集上分别对该算法与其他经典的离群点检测算法在精确率、AUC值和离群点发现曲线上进行实验对比分析。实验结果证明MDROF算法在离群点检测的准确性和稳定性上明显优于对比算法。 展开更多
关键词 数据挖掘 离群检测 差异相似度剪枝 映射k距离 映射距离比
在线阅读 下载PDF
基于改进K-means的局部离群点检测方法 被引量:4
7
作者 周玉 夏浩 +1 位作者 岳学震 王培崇 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第4期66-77,共12页
离群点检测任务是指检测与正常数据在特征属性上存在显著差异的异常数据。大多数基于聚类的离群点检测方法主要从全局角度对数据集中的离群点进行检测,而对局部离群点的检测性能较弱。基于此,本文通过引入快速搜索和发现密度峰值方法改... 离群点检测任务是指检测与正常数据在特征属性上存在显著差异的异常数据。大多数基于聚类的离群点检测方法主要从全局角度对数据集中的离群点进行检测,而对局部离群点的检测性能较弱。基于此,本文通过引入快速搜索和发现密度峰值方法改进K-means聚类算法,提出了一种名为KLOD(local outlier detection based on improved K-means and least-squares methods)的局部离群点检测方法,以实现对局部离群点的精确检测。首先,利用快速搜索和发现密度峰值方法计算数据点的局部密度和相对距离,并将二者相乘得到γ值。其次,将γ值降序排序,利用肘部法则选择γ值最大的k个数据点作为K-means聚类算法的初始聚类中心。然后,通过K-means聚类算法将数据集聚类成k个簇,计算数据点在每个维度上的目标函数值并进行升序排列。接着,确定数据点的每个维度的离散程度并选择适当的拟合函数和拟合点,通过最小二乘法对升序排列的每个簇的每1维目标函数值进行函数拟合并求导,以获取变化率。最后,结合信息熵,将每个数据点的每个维度目标函数值乘以相应的变化率进行加权,得到最终的异常得分,并将异常值得分较高的top-n个数据点视为离群点。通过人工数据集和UCI数据集,对KLOD、LOF和KNN方法在准确度上进行仿真实验对比。结果表明KLOD方法相较于KNN和LOF方法具有更高的准确度。本文提出的KLOD方法能够有效改善K-means聚类算法的聚类效果,并且在局部离群点检测方面具有较好的精度和性能。 展开更多
关键词 离群检测 K均值聚类 最小二乘法 密度峰值 目标函数值
在线阅读 下载PDF
基于离群点检测和自适应参数的三支DBSCAN算法 被引量:4
8
作者 李志聪 孙旭阳 《计算机应用研究》 CSCD 北大核心 2024年第7期1999-2004,共6页
针对经典的DBSCAN算法存在难以确定全局最优参数和误判离群点的问题,该算法首先从选择最优参数角度出发,通过数据集的分布特征生成Eps和MinPts列表,将两个列表中的参数进行全组合操作,把不同的参数组合依次进行聚类,从而寻找准确率最高... 针对经典的DBSCAN算法存在难以确定全局最优参数和误判离群点的问题,该算法首先从选择最优参数角度出发,通过数据集的分布特征生成Eps和MinPts列表,将两个列表中的参数进行全组合操作,把不同的参数组合依次进行聚类,从而寻找准确率最高点对应的参数。最后从离群点角度出发,将三支决策思想与离群点检测LOF算法进行结合。该算法与多种聚类算法进行效果对比分析,结果表明该算法能够全自动化选择全局最优参数,并提高聚类算法的准确性。 展开更多
关键词 DBSCAN算法 三支聚类 自适应参数 离群检测
在线阅读 下载PDF
改进DPC聚类算法的离群点检测与解释方法 被引量:1
9
作者 周玉 夏浩 裴泽宣 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第8期68-85,共18页
为解决全局离群点检测方法无法对局部离群点进行检测,以及局部异常因子在面对大量局部离群点时性能下降的问题,利用k近邻(KNN)和核密度估计方法(KDE)提出一种基于改进快速搜索和发现密度峰值聚类算法(KDPC)的离群点检测与解释方法,该方... 为解决全局离群点检测方法无法对局部离群点进行检测,以及局部异常因子在面对大量局部离群点时性能下降的问题,利用k近邻(KNN)和核密度估计方法(KDE)提出一种基于改进快速搜索和发现密度峰值聚类算法(KDPC)的离群点检测与解释方法,该方法能够同时对数据点的全局和局部进行分析。首先,利用k近邻和核密度估计方法计算数据点的局部密度,代替传统DPC算法中根据截断距离计算的局部密度。其次,将数据点的k近邻距离之和作为全局异常值,并通过KDPC聚类算法计算簇密度以及数据点的局部异常值。最后,将数据点的全局与局部异常值进行乘积作为最终异常得分,选取异常得分最高的Top-n作为离群点,通过构建全局-局部异常值决策图对全局和局部离群点进行解释。利用人工数据集和UCI数据集进行实验并与10种常用离群点检测方法进行比较。结果表明,该方法对全局和局部离群点都有着较高的检测精度和检测性能,并且AUC方面受k值影响较小。同时,利用该方法对NBA球员数据进行分析讨论,进一步证明了该方法的实用性和有效性。 展开更多
关键词 离群检测 聚类 密度峰值 K近邻 密度估计
在线阅读 下载PDF
基于局部信息熵的计算机网络高维数据离群点检测系统 被引量:3
10
作者 谭印 苏雯洁 《现代电子技术》 北大核心 2024年第10期91-95,共5页
通过离群点检测可以及时发现计算机网络中的异常,从而为风险预警和控制提供重要线索。为此,设计一种基于局部信息熵的计算机网络高维数据离群点检测系统。在高维数据采集模块中,利用Wireshark工具采集计算机网络原始高维数据包;并在高... 通过离群点检测可以及时发现计算机网络中的异常,从而为风险预警和控制提供重要线索。为此,设计一种基于局部信息熵的计算机网络高维数据离群点检测系统。在高维数据采集模块中,利用Wireshark工具采集计算机网络原始高维数据包;并在高维数据存储模块中建立MySQL数据库、Zooleeper数据库与Redis数据库,用于存储采集的高维数据包。在高维数据离群点检测模块中,通过微聚类划分算法划分存储的高维数据包,得到数个微聚类;然后计算各微聚类的局部信息熵,确定各微聚类内是否存在离群点;再依据偏离度挖掘微聚类内的离群点;最后,利用高维数据可视化模块呈现离群点检测结果。实验证明:所设计系统不仅可以有效采集计算机网络高维数据并划分计算机网络高维数据,还能够有效检测高维数据离群点,且离群点检测效率较快。 展开更多
关键词 计算机网络 高维数据 离群检测 局部信息熵 Wireshark工具 微聚类划分
在线阅读 下载PDF
基于多元离群点检测的动态目标去除SLAM方法
11
作者 王磊 张茗宇 +2 位作者 潘明然 张永鑫 郝涌汀 《探测与控制学报》 CSCD 北大核心 2024年第5期64-70,共7页
考虑动态环境下的目标移动对同步定位与建图(SLAM)位姿估计精度的影响,提出一种通过稠密光流计算像素运动并经过离群点检测的动态目标SLAM算法。采用稠密光流法计算图像序列的每个像素的运动信息进行动态目标判断,利用离群点检测对动态... 考虑动态环境下的目标移动对同步定位与建图(SLAM)位姿估计精度的影响,提出一种通过稠密光流计算像素运动并经过离群点检测的动态目标SLAM算法。采用稠密光流法计算图像序列的每个像素的运动信息进行动态目标判断,利用离群点检测对动态目标进行提取,通过均值滤波对动态目标进行模糊剔除,消除动态目标对SLAM精度的影响。在TUM数据集与定制数据集上进行实验,在TUM数据集测试中,与基于特征点法的Orb-slam3标杆算法进行对比分析,在动态目标影响条件下,该算法得到的轨迹误差降低43.25%;搭建开放式四旋翼无人机测试系统,在定制数据集中,进行飞行试验,得到的估计轨迹位置误差控制在1 m内,满足使用场景要求,进一步验证了算法的有效性。 展开更多
关键词 同步定位与建图 稠密光流 位姿估计 动态目标 离群检测
在线阅读 下载PDF
NLOF:一种新的基于密度的局部离群点检测算法 被引量:29
12
作者 王敬华 赵新想 +1 位作者 张国燕 刘建银 《计算机科学》 CSCD 北大核心 2013年第8期181-185,共5页
基于密度的局部离群点检测算法(LOF)的时间复杂度较高且不适用于大规模数据集和高维数据集的离群点检测。通过对LOF算法的分析,提出了一种新的局部离群点检测算法NLOF,该算法的主要思想如下:在数据对象邻域查询过程中,尽可能地利用已知... 基于密度的局部离群点检测算法(LOF)的时间复杂度较高且不适用于大规模数据集和高维数据集的离群点检测。通过对LOF算法的分析,提出了一种新的局部离群点检测算法NLOF,该算法的主要思想如下:在数据对象邻域查询过程中,尽可能地利用已知信息优化邻近对象的邻域查询操作,有关邻域的计算查找都采用这种思想。首先通过聚类算法DBSCAN对数据集进行预处理,得到初步的异常数据集。然后利用LOF算法中计算局部异常因子的方法计算初步异常数据集中对象的局部异常程度。在计算数据对象的局部异常因子的过程中,引入去一划分信息熵增量,用去一划分信息熵差确定属性的权重,対属性的权值做具体的量化,在计算各对象之间的距离时采用加权距离。在真实数据集上对NLOF算法进行了充分的验证。结果显示,该算法能够提高离群点检测的精度,降低时间复杂度,实现有效的局部离群点的检测。 展开更多
关键词 数据挖掘 离群检测 信息熵 聚类
在线阅读 下载PDF
一种基于密度的局部离群点检测算法DLOF 被引量:53
13
作者 胡彩平 秦小麟 《计算机研究与发展》 EI CSCD 北大核心 2010年第12期2110-2116,共7页
离群点可分为全局离群点和局部离群点.在很多情况下,局部离群点的挖掘比全局离群点的挖掘更有意义.提出了一种基于密度的局部离群点检测算法DLOF.该方法通过引入信息熵用于确定各对象的离群属性,在计算各对象之间的距离时采用加权距离,... 离群点可分为全局离群点和局部离群点.在很多情况下,局部离群点的挖掘比全局离群点的挖掘更有意义.提出了一种基于密度的局部离群点检测算法DLOF.该方法通过引入信息熵用于确定各对象的离群属性,在计算各对象之间的距离时采用加权距离,并给离群属性较大的权重,从而提高离群点检测的准确度.另外,该算法在计算离群因子时,采用了两步优化技术,并对采用这两步优化技术后算法的时间复杂度进行了详细分析.理论分析和实验结果表明了该方法是有效可行的. 展开更多
关键词 局部离群 密度 局部离群因子 信息熵 离群属性
在线阅读 下载PDF
基于小波密度估计的数据流离群点检测 被引量:4
14
作者 刘耀宗 张宏 +1 位作者 孟锦 韩法旺 《计算机工程》 CAS CSCD 2013年第2期178-181,共4页
为能及时发现数据流上的局部离群点,分析数据流已有的离群点挖掘算法,提出基于小波密度估计的离群点检测算法。利用小波密度估计多尺度和多粒度的特点,通过小波概率阈值判断数据流中当前滑动窗口内的数据点是否为离群点,并对数据流中离... 为能及时发现数据流上的局部离群点,分析数据流已有的离群点挖掘算法,提出基于小波密度估计的离群点检测算法。利用小波密度估计多尺度和多粒度的特点,通过小波概率阈值判断数据流中当前滑动窗口内的数据点是否为离群点,并对数据流中离群点检测过程进行讨论。仿真结果表明,与核密度估计算法相比,该算法的检测效率与精度较高。 展开更多
关键词 数据流 局部离群 离群检测 密度估计 小波密度估计
在线阅读 下载PDF
基于核密度估计的分布数据流离群点检测 被引量:9
15
作者 杨宜东 孙志挥 张净 《计算机研究与发展》 EI CSCD 北大核心 2005年第9期1498-1504,共7页
基于数据流数据的挖掘算法研究受到了越来越多的重视.针对分布式数据流环境,提出基于核密度估计的分布数据流离群点检测算法.算法将各分布节点上的数据流作为全局数据流的子集,通过分布节点与中心节点的通信,维护基于全局数据流的分布... 基于数据流数据的挖掘算法研究受到了越来越多的重视.针对分布式数据流环境,提出基于核密度估计的分布数据流离群点检测算法.算法将各分布节点上的数据流作为全局数据流的子集,通过分布节点与中心节点的通信,维护基于全局数据流的分布密度估计.各分布节点基于该估计对其上的分布数据流进行离群点检测,从而得到基于全局数据流的离群点集合.对节点之间的交互以及离群点检测算法的细节进行了讨论.通过实验验证了算法的适用性和有效性. 展开更多
关键词 分布数据流 离群检测 密度估计
在线阅读 下载PDF
基于聚类离群因子和相互密度的离群点检测算法 被引量:11
16
作者 张忠平 邱敬仰 +2 位作者 刘丛 朱梦凡 章德斌 《计算机集成制造系统》 EI CSCD 北大核心 2019年第9期2314-2323,共10页
针对大多基于聚类的离群点检测算法往往需要人工输入参数,对于不同的数据集很难选择一个合适参数的问题,将无参数的基于自然邻居的离群点检测算法的自然邻居搜索算法和密度峰值聚类算法相结合,提出一种基于聚类离群因子和相互密度的离... 针对大多基于聚类的离群点检测算法往往需要人工输入参数,对于不同的数据集很难选择一个合适参数的问题,将无参数的基于自然邻居的离群点检测算法的自然邻居搜索算法和密度峰值聚类算法相结合,提出一种基于聚类离群因子和相互密度的离群点检测算法。该算法使用相互密度和γ密度构造决策图,将γ密度异常大的样本点作为聚类中心进行聚类,最后根据聚类的离群因子找出离群聚类边界检测离群点,该算法不需要人工输入参数。在模拟数据集和真实数据集下进行了实验,证明了所提算法能很好地进行聚类和离群数据的挖掘。 展开更多
关键词 离群 数据挖掘 聚类离群因子 相互密度 γ密度
在线阅读 下载PDF
基于密度的不确定数据离群点检测研究 被引量:7
17
作者 洪沙 林佳丽 张月良 《计算机科学》 CSCD 北大核心 2015年第5期230-233,264,共5页
针对不确定数据集进行离群点检测,设计了基于密度的不确定数据的局部离群因子(Uncertain Local Outlier Factor,ULOF)算法。通过建立不确定数据的可能世界模型来确定不确定对象在可能世界中的概率。结合传统的LOF算法推导出ULOF算法,根... 针对不确定数据集进行离群点检测,设计了基于密度的不确定数据的局部离群因子(Uncertain Local Outlier Factor,ULOF)算法。通过建立不确定数据的可能世界模型来确定不确定对象在可能世界中的概率。结合传统的LOF算法推导出ULOF算法,根据ULOF值判断不确定对象的局部离群程度;然后对ULOF算法的效率性和准确性进行了详细分析,提出了基于网格的剪枝策略、k最近邻查询优化来减少数据的候选集;最后通过实验证明了ULOF算法对不确定数据检测的可行性和效率性,优化后的方法有效地提高了异常检测准确率,降低了时间复杂度,改善了不确定数据的异常检测性能。 展开更多
关键词 不确定数据 局部离群检测 可能世界模型 k最近邻
在线阅读 下载PDF
基于局部估计密度的局部离群点检测算法 被引量:9
18
作者 谢兄 唐昱 《小型微型计算机系统》 CSCD 北大核心 2020年第2期387-392,共6页
局部离群点检测是近年来数据挖掘领域的热点问题之一.针对交通数据去噪问题,提出一种基于局部估计密度的局部离群点检测算法,算法使用核密度估计方法计算每个数据对象的密度估计值,来表示该数据对象的局部估计密度,并在核函数的带宽函... 局部离群点检测是近年来数据挖掘领域的热点问题之一.针对交通数据去噪问题,提出一种基于局部估计密度的局部离群点检测算法,算法使用核密度估计方法计算每个数据对象的密度估计值,来表示该数据对象的局部估计密度,并在核函数的带宽函数计算中引入数据对象的k-邻域平均距离作为其邻域信息,然后利用求出的局部估计密度计算数据对象的局部离群因子,依据局部离群因子的大小来判断数据对象是否为离群点.实验表明,该算法在UCI标准数据集与模拟数据集上都可以取得较好的表现. 展开更多
关键词 离群检测 密度估计 邻域信息 局部离群因子
在线阅读 下载PDF
ERDOF:基于相对熵权密度离群因子的离群点检测算法 被引量:8
19
作者 张忠平 刘伟雄 +2 位作者 张玉停 邓禹 魏棉鑫 《通信学报》 EI CSCD 北大核心 2021年第9期133-143,共11页
针对现有离群点检测算法在复杂数据分布和高维度数据集上精度低的问题,提出了一种基于相对熵权密度离群因子的离群点检测算法。首先引入熵权距离取代欧氏距离以提高离群点检测精度。然后结合自然邻居的概念对数据对象进行高斯核密度估... 针对现有离群点检测算法在复杂数据分布和高维度数据集上精度低的问题,提出了一种基于相对熵权密度离群因子的离群点检测算法。首先引入熵权距离取代欧氏距离以提高离群点检测精度。然后结合自然邻居的概念对数据对象进行高斯核密度估计。同时提出相对距离来刻画数据对象偏离邻域的程度,提高所提算法在低密度区域检测离群点的能力。最后提出相对熵权密度离群因子来刻画数据对象的离群程度。在人工数据集和真实数据集下进行的实验表明,所提算法能有效适应各种数据分布和高维数据的离群点检测。 展开更多
关键词 数据挖掘 离群检测 信息熵 密度估计
在线阅读 下载PDF
离群点检测算法综述 被引量:2
20
作者 孔翎超 刘国柱 《计算机科学》 CSCD 北大核心 2024年第8期20-33,共14页
离群点检测作为数据挖掘领域的一个重要研究方向,其目的是发掘隐藏在数据集合中与众不同且具有潜在分析价值的数据,辅助研究人员甄别数据源可能存在的问题。目前,离群点检测已被广泛应用于欺诈识别、智慧医疗、入侵检测、故障诊断等诸... 离群点检测作为数据挖掘领域的一个重要研究方向,其目的是发掘隐藏在数据集合中与众不同且具有潜在分析价值的数据,辅助研究人员甄别数据源可能存在的问题。目前,离群点检测已被广泛应用于欺诈识别、智慧医疗、入侵检测、故障诊断等诸多领域。文中在总结前人经验的基础上,首先讨论离群点的定义、产生原因以及典型应用领域,综述了DBSCAN和LOF等离群点检测经典算法及其改进算法的优势和局限,分析了深度学习方法在离群点检测领域的优势;其次结合当前互联网背景下海量、高维、时序数据处理需求,对离群点检测算法在新环境下的发展状况做进一步研究;最后介绍离群点检测算法的评价指标、代价因子在离群点检测评价中的作用以及常用工具包和数据集,总结展望了离群点检测面临的挑战和未来的发展方向。 展开更多
关键词 离群 异常检测 深度学习 时序数据 数据挖掘
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部