期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于无监督学习的异质网络多尺度离群点挖掘研究 被引量:1
1
作者 朱辉 张莉芸 《现代电子技术》 北大核心 2024年第12期182-186,共5页
现有的异质网络多尺度离群点挖掘算法忽略了数据点之间的顺序关系,无法充分利用数据点在异质网络中的排列顺序信息,从而导致聚类精度下降。对此,提出一种基于无监督学习的异质网络多尺度离群点挖掘方法,对异质网络的多节点、多边特点进... 现有的异质网络多尺度离群点挖掘算法忽略了数据点之间的顺序关系,无法充分利用数据点在异质网络中的排列顺序信息,从而导致聚类精度下降。对此,提出一种基于无监督学习的异质网络多尺度离群点挖掘方法,对异质网络的多节点、多边特点进行分析。利用季节-趋势时序分解法提取异质网络数据特征。根据数据特征,结合K-means聚类算法与排序算法,将数据点的排序信息添加至聚类过程中,以实现对异质网络数据离群点的挖掘。实验结果表明,利用该方法进行网络数据节点聚类的准确率均能达到80%以上;并且实现了多尺度离群点挖掘后,能够精准地识别出离群点,为后续的网络通信维护提供了良好的保障。 展开更多
关键词 异质网络 多尺度 离群点挖掘 无监督学习 K均值聚类 网络数据 离群因子
在线阅读 下载PDF
离群点挖掘方法综述 被引量:69
2
作者 薛安荣 姚林 +2 位作者 鞠时光 陈伟鹤 马汉达 《计算机科学》 CSCD 北大核心 2008年第11期13-18,27,共7页
离群点挖掘可揭示稀有事件和现象、发现有趣的模式,有着广阔的应用前景,因此引起广泛关注。首先介绍离群点的定义、引起离群的原因和离群点挖掘算法的分类,对基于距离和基于密度的离群点挖掘算法进行了比较详细的讨论,指出了其优缺点和... 离群点挖掘可揭示稀有事件和现象、发现有趣的模式,有着广阔的应用前景,因此引起广泛关注。首先介绍离群点的定义、引起离群的原因和离群点挖掘算法的分类,对基于距离和基于密度的离群点挖掘算法进行了比较详细的讨论,指出了其优缺点和发展方向,重点对当前研究的热点——高维大数据量的挖掘、空间数据挖掘、时序离群点挖掘和离群点挖掘技术的应用进行了讨论,指出了进一步研究方向。 展开更多
关键词 离群点挖掘 局部离群 子空间 剪枝 空间离群 高维数据 数据流
在线阅读 下载PDF
基于网格和密度的海量数据增量式离群点挖掘算法 被引量:8
3
作者 张净 孙志挥 +2 位作者 杨明 倪巍伟 杨宜东 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期823-830,共8页
处理海量和高维数据已经成为设计离群点算法面临的重要任务和挑战,针对海量数据的特点提出一种基于网格和密度的增量式离群点挖掘算法IGDLOF,算法的基本思想为:采用网格的七元组信息减少数据维数和数量,利用增量更新减少内存需求.通过... 处理海量和高维数据已经成为设计离群点算法面临的重要任务和挑战,针对海量数据的特点提出一种基于网格和密度的增量式离群点挖掘算法IGDLOF,算法的基本思想为:采用网格的七元组信息减少数据维数和数量,利用增量更新减少内存需求.通过代表点过滤相应的主体数据,先判断再进行近似密度计算的方法减少计算量,降低算法的复杂度.通过在真实和仿真数据集的测试表明,IGDLOF增量算法可与LOF算法保持相同的精确度,而执行效率得到显著的提高. 展开更多
关键词 海量数据 网格 密度 离群点挖掘 增量 LOF算法
在线阅读 下载PDF
基于信息论的高维海量数据离群点挖掘 被引量:10
4
作者 张净 孙志挥 +2 位作者 宋余庆 倪巍伟 晏燕华 《计算机科学》 CSCD 北大核心 2011年第7期148-151,161,共5页
针对高维海量数据集离群点挖掘存在"维数灾难"的问题,提出了基于信息论的高维海量数据的离群点挖掘算法。该算法采用属性选择,去除冗余属性降维。利用信息熵作为离群点判断的度量标准,消除距离和密度量纲的弊端。在真实数据... 针对高维海量数据集离群点挖掘存在"维数灾难"的问题,提出了基于信息论的高维海量数据的离群点挖掘算法。该算法采用属性选择,去除冗余属性降维。利用信息熵作为离群点判断的度量标准,消除距离和密度量纲的弊端。在真实数据集上的实验结果表明,算法对高维海量数据离群点挖掘是有效可行的,其效率和精度得到了明显提高。 展开更多
关键词 离群点挖掘 信息论 属性选择 互信息
在线阅读 下载PDF
基于离群点挖掘的工业控制系统异常检测 被引量:13
5
作者 陈庄 黄勇 邹航 《计算机科学》 CSCD 北大核心 2014年第5期178-181,203,共5页
目前,工业控制系统广泛应用于我国电力、水利、污水处理、石油天然气、化工、交通运输、制药以及大型制造行业,针对工业控制系统的攻击越来越频繁,而目前市场上工业控制系统的安全产品十分稀少。虽然主流的组态软件具有控制变量报警功... 目前,工业控制系统广泛应用于我国电力、水利、污水处理、石油天然气、化工、交通运输、制药以及大型制造行业,针对工业控制系统的攻击越来越频繁,而目前市场上工业控制系统的安全产品十分稀少。虽然主流的组态软件具有控制变量报警功能模块,但其只能处理单一变量超过阈值时的报警,不能识别出由多个变量共同引起的异常。为此,针对工业控制系统的变量数据、通信协议、高实时性等特点,提出了基于自适应聚类的离群点挖掘方法——ACBOD方法,该方法包括数据采集、聚类、簇的标识以及簇的离群点检测4个阶段,对工业控制系统OPC Server上的变量数据进行数据分析。实验证明,该方法可以很好地发现工业控制系统中的异常数据,并能够发现未知的异常,能够极大地提高工业控制系统的安全防护能力。 展开更多
关键词 工业控制系统 聚类 离群点挖掘 自适应聚类 异常检测
在线阅读 下载PDF
基于混合式聚类算法的离群点挖掘在异常检测中的应用研究 被引量:14
6
作者 尹娜 张琳 《计算机科学》 CSCD 北大核心 2017年第5期116-119,140,共5页
为了提高异常检测系统的检测率,降低误警率,解决现有异常检测所存在的问题,将离群点挖掘技术应用到异常检测中,提出了一种基于混合式聚类算法的异常检测方法(NADHC)。该方法将基于距离的聚类算法与基于密度的聚类算法相结合从而形成新... 为了提高异常检测系统的检测率,降低误警率,解决现有异常检测所存在的问题,将离群点挖掘技术应用到异常检测中,提出了一种基于混合式聚类算法的异常检测方法(NADHC)。该方法将基于距离的聚类算法与基于密度的聚类算法相结合从而形成新的混合聚类算法,通过k-中心点算法找出簇中心,进而去除隐蔽性较高的少量攻击行为样本,再将重复增加样本的方法结合基于密度的聚类算法计算出异常度,从而判断出异常行为。最后在KDD CUP 99数据集上进行实验仿真,验证了所提算法的可行性和有效性。 展开更多
关键词 异常检测 离群点挖掘 NADHC
在线阅读 下载PDF
基于密度的离群点挖掘在入侵检测中的应用 被引量:5
7
作者 闫少华 张巍 滕少华 《计算机工程》 CAS CSCD 北大核心 2011年第18期240-242,245,共4页
给出一种基于密度的局部离群点挖掘方法。采用KDD99数据集进行实验,对数据集中的41个属性提取特征,利用基于密度的聚类对统计处理过的数据集实行剪枝操作,剪除数据集中大部分密集的数据对象,保留未被剪除的候选离群对象集。采用局部离... 给出一种基于密度的局部离群点挖掘方法。采用KDD99数据集进行实验,对数据集中的41个属性提取特征,利用基于密度的聚类对统计处理过的数据集实行剪枝操作,剪除数据集中大部分密集的数据对象,保留未被剪除的候选离群对象集。采用局部离群挖掘方法计算离群候选对象的离群因子,检测出异常攻击。实验结果表明,该方法能保证较高的检测率和较低的误报率。 展开更多
关键词 入侵检测 异常检测 离群点挖掘 基于密度
在线阅读 下载PDF
关联子空间离群点挖掘 被引量:2
8
作者 葛清龙 薛安荣 贾小艳 《小型微型计算机系统》 CSCD 北大核心 2015年第5期1028-1032,共5页
针对高维数据,已有的子空间离群点挖掘方法未能有效反映子空间的关联程度,对所有数据点采用统一的子空间,不能有效凸显不同离群点存在的特有子空间,导致挖掘精度不高和挖掘结果难以解释等问题.且都平等的对待数据点在多个子空间中的离... 针对高维数据,已有的子空间离群点挖掘方法未能有效反映子空间的关联程度,对所有数据点采用统一的子空间,不能有效凸显不同离群点存在的特有子空间,导致挖掘精度不高和挖掘结果难以解释等问题.且都平等的对待数据点在多个子空间中的离群得分,使离群点与非离群点之间的对比度低.为此,提出一个新的关联子空间离群点挖掘算法.算法根据数据点及其局部邻域在一维投影上的分布特性,把一维投影上具有最大非均匀分布程度的维作为关联度子空间的基准维,用类Apriori算法将关联度大的子空间快速构造成不同数据点特有的关联子空间集合,并基于关联子空间进行离群点挖掘.算法给偏离度大的赋予较大的权值,加大了离群点与非离群点之间的对比度.实验表明,算法取得较高准确度,并优于现有方法. 展开更多
关键词 离群点挖掘 子空间 子空间离群 关联子空间
在线阅读 下载PDF
IPv6远程监控网络下无状态通信数据的多尺度离群点挖掘算法 被引量:8
9
作者 刘琨 张晓涵 +1 位作者 曹汝坤 李帅 《电信科学》 2023年第8期118-126,共9页
为了准确挖掘离群点,降低离群点对通信数据造成的影响,对IPv6远程监控网络无状态通信数据多尺度离群点挖掘算法进行了研究。通过IPv6远程监控网络获得无状态通信数据,依据提取的无状态通信数据的季节性、趋势性和自相似性特征,运用傅里... 为了准确挖掘离群点,降低离群点对通信数据造成的影响,对IPv6远程监控网络无状态通信数据多尺度离群点挖掘算法进行了研究。通过IPv6远程监控网络获得无状态通信数据,依据提取的无状态通信数据的季节性、趋势性和自相似性特征,运用傅里叶变换将无状态通信数据分为两类。再用K均值法对两类分别进行聚类,确定无状态通信数据的邻域,将其作为基础。采用卷积神经网络对无状态通信数据进行离群点挖掘,初始化卷积神经网络;根据卷积神经网络输出值,判别该网络是否符合停止条件,反复重复卷积神经网络的运算步骤,挖掘全部离群点,实现无状态通信数据多尺度离群点挖掘。实验结果表明,无状态通信数据类别的个数越少,挖掘效率越高;所提方法能准确挖掘IPv6远程监控网络无状态通信数据多尺度离群点的个数,准确分析离群原因。 展开更多
关键词 IPV6 远程监控网络 无状态 通信数据 多尺度 离群点挖掘
在线阅读 下载PDF
半监督的移动对象离群轨迹检测算法 被引量:4
10
作者 黄添强 余养强 +1 位作者 郭躬德 秦小麟 《计算机研究与发展》 EI CSCD 北大核心 2011年第11期2074-2082,共9页
移动数据的研究逐渐成为了数据挖掘研究领域的热点.已有的移动对象离群轨迹检测算法部分参数敏感且需人工调节,导致算法不稳定,可扩展性不理想;同时,已有算法完全根据自己主观定义的度量来探测离群轨迹,没有充分利用已知轨迹反映的信息... 移动数据的研究逐渐成为了数据挖掘研究领域的热点.已有的移动对象离群轨迹检测算法部分参数敏感且需人工调节,导致算法不稳定,可扩展性不理想;同时,已有算法完全根据自己主观定义的度量来探测离群轨迹,没有充分利用已知轨迹反映的信息.因此,提出一种基于半监督技术的移动对象离群轨迹检测算法,利用半监督技术,根据已知的信息确定敏感参数,克服算法不稳定的缺点,并从整体与局部相结合的角度设计新的度量,以发现有意义的移动对象离群轨迹.实验表明该算法可以发现更有意义的移动对象离群轨迹并减少参数的人工调节. 展开更多
关键词 移动对象 离群轨迹 半监督学习 离群点挖掘 数据挖掘
在线阅读 下载PDF
基于数据加权策略的模糊聚类改进算法 被引量:11
11
作者 唐成龙 王石刚 徐威 《电子与信息学报》 EI CSCD 北大核心 2010年第6期1277-1283,共7页
该文提出了一种数据指数加权的模糊均值聚类策略,引入了指数权因子和影响指数,使得可以在聚类过程中差异化处理各个数据。新策略和现有的Gustafson-Kessel(G-K)算法相结合,提出了一种新的模糊聚类算法DWG-K用于提高聚类质量和挖掘离群... 该文提出了一种数据指数加权的模糊均值聚类策略,引入了指数权因子和影响指数,使得可以在聚类过程中差异化处理各个数据。新策略和现有的Gustafson-Kessel(G-K)算法相结合,提出了一种新的模糊聚类算法DWG-K用于提高聚类质量和挖掘离群点。数据试验表明DWG-K在提高聚类质量方面优于现有的G-K;在离群点挖掘方面,DWG-K对离群点的判定是全局的,离群点的物理意义清楚,且计算效率明显高于当前广泛采用的基于密度的离群点挖掘算法。 展开更多
关键词 模糊聚类 数据加权策略 数据加权G-K 离群点挖掘
在线阅读 下载PDF
基于数据间内在关联性的自适应模糊聚类模型 被引量:12
12
作者 唐成龙 王石刚 《自动化学报》 EI CSCD 北大核心 2010年第11期1544-1556,共13页
提出了一种新的模糊聚类模型(Fuzzy C-means clustering model,FCM),称为自适应模糊聚类(Adaptive FCM,AFCM).和现有的大多数模糊聚类方法不同的是,AFCM考虑了数据集中全体数据的内在关联性,模型中引入了自适应度向量W和自适应指数p.其... 提出了一种新的模糊聚类模型(Fuzzy C-means clustering model,FCM),称为自适应模糊聚类(Adaptive FCM,AFCM).和现有的大多数模糊聚类方法不同的是,AFCM考虑了数据集中全体数据的内在关联性,模型中引入了自适应度向量W和自适应指数p.其中,W在迭代过程中是自适应的,p是一个给定参数.W和p共同作用调控聚类过程.AFCM同时输出三组参数:模糊隶属度集U,自适应度向量W,以及聚类原型集V.本文给出了两组数据实验验证AFCM的性能.第1组实验验证AFCM的聚类性能,以FCM为比较对象.实验表明AFCM可以得到更好的聚类质量,而且通过合理选择自适应指数p,AFCM和FCM在时间复杂性上保持同一水平.第2组实验检验了AFCM的离群点挖掘性能,以目前常用的基于密度的LOF为比较对象.实验表明AFCM算法具有极大的计算效率优势,且AFCM得到的离群点是全局的,反映的是离群点和整个数据集的关系,离群点涵盖的信息也更丰富.文章指出,AFCM在挖掘大数据集和实时数据中的离群点应用方面,以及获得高质量的聚类结果的应用方面,特别在聚类的同时需要挖掘离群点的应用方面具有独特的优势. 展开更多
关键词 模糊聚类 离群点挖掘 自适应聚类策略 自适应度 自适应指数
在线阅读 下载PDF
On-line outlier and change point detection for time series 被引量:1
13
作者 苏卫星 朱云龙 +1 位作者 刘芳 胡琨元 《Journal of Central South University》 SCIE EI CAS 2013年第1期114-122,共9页
The detection of outliers and change points from time series has become research focus in the area of time series data mining since it can be used for fraud detection, rare event discovery, event/trend change detectio... The detection of outliers and change points from time series has become research focus in the area of time series data mining since it can be used for fraud detection, rare event discovery, event/trend change detection, etc. In most previous works, outlier detection and change point detection have not been related explicitly and the change point detections did not consider the influence of outliers, in this work, a unified detection framework was presented to deal with both of them. The framework is based on ALARCON-AQUINO and BARRIA's change points detection method and adopts two-stage detection to divide the outliers and change points. The advantages of it lie in that: firstly, unified structure for change detection and outlier detection further reduces the computational complexity and make the detective procedure simple; Secondly, the detection strategy of outlier detection before change point detection avoids the influence of outliers to the change point detection, and thus improves the accuracy of the change point detection. The simulation experiments of the proposed method for both model data and actual application data have been made and gotten 100% detection accuracy. The comparisons between traditional detection method and the proposed method further demonstrate that the unified detection structure is more accurate when the time series are contaminated by outliers. 展开更多
关键词 outlier detection change point detection time series hypothesis test
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部