期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于密度的局部离群数据挖掘方法的改进 被引量:30
1
作者 王茜 刘书志 《计算机应用研究》 CSCD 北大核心 2014年第6期1693-1696,1701,共5页
针对传统局部离群点检测算法的局限性进行了研究,提出了一种新的有效的离群数据挖掘算法。该算法在寻找数据点的近邻区域时采用了基于影响空间的局部离群点检测(INFLO)中影响空间的概念,然后在计算数据点的离群因子时,根据基于链接的离... 针对传统局部离群点检测算法的局限性进行了研究,提出了一种新的有效的离群数据挖掘算法。该算法在寻找数据点的近邻区域时采用了基于影响空间的局部离群点检测(INFLO)中影响空间的概念,然后在计算数据点的离群因子时,根据基于链接的离群点检测(COF)中链式距离的思想,提出了基于相似k距离邻居序列(SKDNS)的离群因子计算方法。通过对比该算法和其他经典局部离群点检测算法在不同数据分布情况下的挖掘结果,该算法比LOF、INFLO和COF算法的离群挖掘准确性更高,能有效克服LOF算法的不足,提高局部离群数据挖掘的准确性和多样性。 展开更多
关键词 离群数据挖掘 影响空间 链式距离 相似k距离邻居序列 离群因子
在线阅读 下载PDF
利用子空间划分的局部离群数据挖掘算法 被引量:4
2
作者 刘爱琴 葛凌云 +1 位作者 杨海峰 张继福 《小型微型计算机系统》 CSCD 北大核心 2011年第8期1628-1632,共5页
目前大多数局部离群数据挖掘算法需人为事先设置参数或阈值,且难以应用到高维数据集.给出一种新的局部离群数据挖掘算法PSO-SPLOF,该算法首先将数据集划分为互不相交的子空间,利用偏斜度判断子空间划分的优劣,并采用微粒群算法搜索最优... 目前大多数局部离群数据挖掘算法需人为事先设置参数或阈值,且难以应用到高维数据集.给出一种新的局部离群数据挖掘算法PSO-SPLOF,该算法首先将数据集划分为互不相交的子空间,利用偏斜度判断子空间划分的优劣,并采用微粒群算法搜索最优划分子空间集;其次针对每个最优划分子空间,计算其数据对象的局部离群因子SPLOF值,并用SPLOF值来度量数据对象的局部偏离程度.最后采用离散化的天体光谱数据作为数据集,实验验证了PSO-SPLOF算法具有受人为因素影响小、伸缩性强和运算效率高等优点. 展开更多
关键词 离群数据挖掘 微粒群算法 子空间 划分偏斜度 天体光谱数据
在线阅读 下载PDF
线指数特征空间内恒星光谱离群数据挖掘与分析 被引量:4
3
作者 王光沛 潘景昌 +2 位作者 衣振萍 韦鹏 姜斌 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2016年第10期3364-3368,共5页
大规模光谱巡天将产生海量的光谱数据,为搜寻一些奇异甚至于未知类型的光谱提供了机会,对这些特殊天体的研究有助于揭示宇宙的演变规律和生命起源,巡天数据的离群数据挖掘有助于这些特殊的光谱的发现。利用线指数对光谱数据进行降维能... 大规模光谱巡天将产生海量的光谱数据,为搜寻一些奇异甚至于未知类型的光谱提供了机会,对这些特殊天体的研究有助于揭示宇宙的演变规律和生命起源,巡天数据的离群数据挖掘有助于这些特殊的光谱的发现。利用线指数对光谱数据进行降维能够在尽可能多的保留光谱物理特征的同时,有效解决高维光谱数据聚类分析中运算复杂度较高的问题。提出了基于线指数特征的海量恒星光谱离群数据挖掘及分析的方法,以恒星光谱的Lick线指数作为光谱数据的特征,利用聚类搜寻离群数据的方法在海量光谱巡天数据搜寻离群数据,以此为基础并给出线指数特征空间内离群光谱数据的分析方法。实验结果证明:(1)以线指数作为光谱的特征值能快速的完成对高维光谱数据的离群数据挖掘,可以解决高维光谱数据运算复杂度高的问题;(2)该方法是在聚类结果上进行的离群数据挖掘,能够有效的挖掘出数量较少的发射线恒星、晚M型恒星、极贫金属星、缺失数据光谱等数据;(3)线指数特征空间的离群数据挖掘可以得到线指数特征空间内特殊恒星的发现规则。本文所提出的基于线指数特征的离群数据挖掘及分析方法可以应用到巡天数据的相关研究中。 展开更多
关键词 Lick线指数 离群数据挖掘 恒星光谱
在线阅读 下载PDF
离群数据挖掘及其在电力负荷预测中的应用 被引量:11
4
作者 冯丽 邱家驹 《电力系统自动化》 EI CSCD 北大核心 2004年第11期41-44,86,共5页
离群数据挖掘是数据挖掘的一个重要内容,它为分析各种海量的、复杂的、含有噪声的数据提供了新的方法,但它在电力系统中还未得到广泛的应用。文中通过对现有的主要离群数据挖掘算法的简要对比说明,针对电力系统的基本特征提出应用信息... 离群数据挖掘是数据挖掘的一个重要内容,它为分析各种海量的、复杂的、含有噪声的数据提供了新的方法,但它在电力系统中还未得到广泛的应用。文中通过对现有的主要离群数据挖掘算法的简要对比说明,针对电力系统的基本特征提出应用信息熵原则的电力负荷离群数据挖掘改进算法,然后应用Kohonen网提取相关负荷的特征曲线,并将其用于不良数据的校正,通过对电力负荷的仿真分析表明了该算法的有效性。 展开更多
关键词 离群数据挖掘 负荷预测 聚类分析 信息熵 人工神经网络
在线阅读 下载PDF
对随机投影算法的离群数据挖掘技术研究 被引量:3
5
作者 李桥 周莹莲 +1 位作者 黄胜 马翔 《计算机工程与应用》 CSCD 2013年第24期122-129,共8页
d维点集离群数据挖掘技术是目前数据挖掘领域的研究热点之一。当前基于距离或最近邻概念进行离群数据挖掘时,在高维数据情况下的挖掘效果不佳,鉴于此,将基于角度的离群因子应用到高维离群数据挖掘中,提出一种新的基于随机投影算法的离... d维点集离群数据挖掘技术是目前数据挖掘领域的研究热点之一。当前基于距离或最近邻概念进行离群数据挖掘时,在高维数据情况下的挖掘效果不佳,鉴于此,将基于角度的离群因子应用到高维离群数据挖掘中,提出一种新的基于随机投影算法的离群数据挖掘方案,它只需要用接近线性时间的方法就能预测所有数据点的基于角度的离群因子。该方法可以用于并行环境进行并行加速。对近似质量进行了理论分析,以保证算法的可靠性。合成和真实数据集实验结果表明,对超高维数据集,该方法效率高、可伸缩性强。 展开更多
关键词 离群数据挖掘 角度 随机投影算法 接近线性时间 可靠性 效率
在线阅读 下载PDF
Web网络中的离群数据挖掘技术研究与改进 被引量:8
6
作者 翁佩纯 张远海 马慧 《现代电子技术》 北大核心 2017年第18期29-31,共3页
离散数据在Web网络中分布较广,是造成数据挖掘有用信息容量低的主要原因。霍金斯离散数据挖掘方法自提出以来获得了很高的成就,但仍存在挖掘数据分类性能不高的缺点,在此,使用BP神经网络对其进行改进。霍金斯离散数据挖掘方法分离散数... 离散数据在Web网络中分布较广,是造成数据挖掘有用信息容量低的主要原因。霍金斯离散数据挖掘方法自提出以来获得了很高的成就,但仍存在挖掘数据分类性能不高的缺点,在此,使用BP神经网络对其进行改进。霍金斯离散数据挖掘方法分离散数据扫描和离散信息挖掘两个步骤进行,所提改进方法通过优化原方法中离散数据的排序规律,挖掘最优BP神经网络连接节点权值集群,改进离散数据集群的正确分区能力,降低离散信息挖掘过程的时空复杂度,提高原方法的分类精度和分类效率。实验结果表明,所提改进方法在Web网络离散数据中能获取高度可靠的挖掘结果。 展开更多
关键词 WEB网络 霍金斯离群数据挖掘 改进的离散信息挖掘 BP神经网络
在线阅读 下载PDF
NJW在离群数据挖掘中的应用研究 被引量:4
7
作者 朱庆生 钟洵 杨鹏 《计算机工程与应用》 CSCD 北大核心 2010年第7期128-130,212,共4页
最近几年,谱聚类思想开始用于数据挖掘领域,并取得了较好的效果;离群数据挖掘是对离群点进行检测,发掘出有用知识。将谱聚类中的NJW算法成功应用到离群数据挖掘领域,并结合离群指数的概念,提出了一种适合离群数据挖掘的谱聚类算法。与... 最近几年,谱聚类思想开始用于数据挖掘领域,并取得了较好的效果;离群数据挖掘是对离群点进行检测,发掘出有用知识。将谱聚类中的NJW算法成功应用到离群数据挖掘领域,并结合离群指数的概念,提出了一种适合离群数据挖掘的谱聚类算法。与原有的基于聚类的离群检测算法相比,具有更好的效率和适应性。实验验证了所提算法的有效性和可行性。 展开更多
关键词 NJW 离群数据挖掘 谱聚类
在线阅读 下载PDF
基于分形的市场营销离群数据挖掘模型 被引量:5
8
作者 夏火松 蔡淑琴 《计算机工程与应用》 CSCD 北大核心 2002年第12期24-25,28,共3页
文章探讨了在网络计算的环境下的市场营销离群数据挖掘的重要性与内容。并用分形的原理分析了市场营销离群数据的特点,构造了基于分形的市场营销离群数据挖掘模型。
关键词 分形 市场营销 离群数据挖掘
在线阅读 下载PDF
一种基于离群数据挖掘的数据抽查新方法 被引量:1
9
作者 耿焕同 于琨 +1 位作者 洪流 蔡庆生 《中国科学技术大学学报》 CAS CSCD 北大核心 2004年第2期213-218,共6页
针对传统数据抽查方法很难保证数据抽查有效性的缺点 ,结合离群数据挖掘 ,给出了一种基于离群数据挖掘的数据抽查新方法 .通过实验表明 ,该方法既能克服了随机数据抽查难以保证抽查有效性的缺陷又能克服重点数据抽查对抽查者经验的依赖 。
关键词 离群数据挖掘 数据抽查 NCL_CLARA聚类 数据 机器学习
在线阅读 下载PDF
基于滑动窗口的时间序列离群数据挖掘 被引量:2
10
作者 张宁 《燕山大学学报》 CAS 2008年第6期483-486,共4页
离群数据挖掘是数据挖掘中的重要内容。本文针对时间序列数据进行离群数据挖掘方法的研究。在引入了基于局部离群点因子的离群数据挖掘方法与时间序列上滑动窗口基础上,将二者相结合,提出了基于滑动窗口的时间序列离群数据挖掘算法,并... 离群数据挖掘是数据挖掘中的重要内容。本文针对时间序列数据进行离群数据挖掘方法的研究。在引入了基于局部离群点因子的离群数据挖掘方法与时间序列上滑动窗口基础上,将二者相结合,提出了基于滑动窗口的时间序列离群数据挖掘算法,并将算法应用于海表温度数据得到海表温度的异常之处。 展开更多
关键词 局部离群点因子 滑动窗口 时间序列 离群数据挖掘
在线阅读 下载PDF
基于群体智能的离群数据挖掘
11
作者 张然 贾瑞玉 钱光超 《计算机工程与应用》 CSCD 北大核心 2008年第23期154-156,共3页
离群数据挖掘是数据挖掘的重要任务之一。首先分析了离群数据及其挖掘方法,然后根据LF算法和CSI算法,提出了基于群体智能的离群数据挖掘算法,并进行了仿真实验。实验结果显示了基于群体智能的离群数据挖掘算法的有效性。与其它方法相比... 离群数据挖掘是数据挖掘的重要任务之一。首先分析了离群数据及其挖掘方法,然后根据LF算法和CSI算法,提出了基于群体智能的离群数据挖掘算法,并进行了仿真实验。实验结果显示了基于群体智能的离群数据挖掘算法的有效性。与其它方法相比,该算法避免了用户在设定参数初始值时给算法带来的影响,并且不需要设定初始聚类中心,因此具有更好的鲁棒性。 展开更多
关键词 离群数据挖掘 群体智能 聚类
在线阅读 下载PDF
基于构造性覆盖算法的离群数据挖掘研究
12
作者 张旻 张铃 《计算机科学》 CSCD 北大核心 2005年第4期27-30,共4页
本文提出一种通过构造覆盖领域进行离群点(outlier)挖掘的新方法。由于覆盖领域构造的特殊性,使得覆盖算法非常适合离群点的挖掘。在分析覆盖模型的基础上,给出了覆盖模型的离群点的定义和算法步骤。这样将复杂的离群点挖掘问题变成十... 本文提出一种通过构造覆盖领域进行离群点(outlier)挖掘的新方法。由于覆盖领域构造的特殊性,使得覆盖算法非常适合离群点的挖掘。在分析覆盖模型的基础上,给出了覆盖模型的离群点的定义和算法步骤。这样将复杂的离群点挖掘问题变成十分简单的覆盖领域样本分析问题,而且算法十分直观,并能很好地解释离群点的含义,同时适合对高维及海量数据的处理。本文给出实验例子,结果表明该方法是有效可行的。 展开更多
关键词 覆盖算法 离群数据挖掘 构造性 覆盖模型 离群 算法步骤 分析问题 海量数据 特殊性
在线阅读 下载PDF
一种基于p权值的离群数据挖掘算法 被引量:6
13
作者 娄圣金 张继福 刘爱琴 《小型微型计算机系统》 CSCD 北大核心 2014年第1期55-59,共5页
传统的基于距离的离群数据挖掘方法计算量大,挖掘效率和精度较低.本文利用大多数据集的聚类性特征,采用p权值和剪枝技术,给出一种基于距离的离群数据挖掘算法.该算法首先采用基于三角不等式的剪枝技术,寻找出离群候选集,仅候选集驻内存... 传统的基于距离的离群数据挖掘方法计算量大,挖掘效率和精度较低.本文利用大多数据集的聚类性特征,采用p权值和剪枝技术,给出一种基于距离的离群数据挖掘算法.该算法首先采用基于三角不等式的剪枝技术,寻找出离群候选集,仅候选集驻内存;然后对候选集中的每个数据点,分两种情况:若近邻达不到k值,赋予一个相对较大权值,若达到k值,运用p权值方法,计算该数据对象与其k最近邻的距离和,和越大,则离群的可能性越大;将离群候选集中的每个数据点按权值大小排序,并确定是否为离群数据,从而较好地克服了离群检测中的掩盖和淹没现象;最后采用UCI数据,实验验证了该算法的有效性. 展开更多
关键词 剪枝 离群数据挖掘 p权值 相似性搜索 三角不等式
在线阅读 下载PDF
基于离群指数的时序数据离群挖掘 被引量:15
14
作者 郑斌祥 席裕庚 杜秀华 《自动化学报》 EI CSCD 北大核心 2004年第1期70-77,共8页
离群数据挖掘(Outlier mining,简称离群挖掘)是数据挖掘的重要内容.该文针对时序数据进行离群数据挖掘方法的研究,提出了离群指数的概念,在此基础上设计了时序数据离群数据挖掘算法,并对某钢铁企业电力负荷时序数据进行离群数据挖掘,结... 离群数据挖掘(Outlier mining,简称离群挖掘)是数据挖掘的重要内容.该文针对时序数据进行离群数据挖掘方法的研究,提出了离群指数的概念,在此基础上设计了时序数据离群数据挖掘算法,并对某钢铁企业电力负荷时序数据进行离群数据挖掘,结果表明了算法的有效性. 展开更多
关键词 时序数据 离群数据挖掘 电力负荷 离群指数
在线阅读 下载PDF
离群数据之间模式相似性的分布式挖掘
15
作者 唐锐 《计算机工程与应用》 CSCD 北大核心 2007年第9期174-175,230,共3页
提出了分布式系统中各站点离群数据之间模式相似性挖掘算法,该算法首先利用基于距离的离群数据挖掘算法挖掘各自站点的离群数据,然后计算离群数据的知识集,最后依据各站点知识集的分布情况来判断离群数据之间的类别相似性和行为相似性。
关键词 离群数据挖掘 分布式挖掘 离群数据的模式相似性
在线阅读 下载PDF
服务于智能交通系统的离群交通数据识别 被引量:3
16
作者 陈淑燕 王炜 瞿高峰 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第4期723-726,共4页
为了提高交通建模的准确性和可靠性,或者提取重要的有价值的隐藏信息,将离群数据挖掘技术引入交通数据处理.首先分析了3种典型的离群数据挖掘算法:基于统计的方法、基于距离的方法以及基于密度的方法的原理、特点和时间复杂性;其次给出... 为了提高交通建模的准确性和可靠性,或者提取重要的有价值的隐藏信息,将离群数据挖掘技术引入交通数据处理.首先分析了3种典型的离群数据挖掘算法:基于统计的方法、基于距离的方法以及基于密度的方法的原理、特点和时间复杂性;其次给出了2个实例分析,一是在建立交通流量预测模型前,将基于统计的方法和基于距离的离群检测方法分别用于交通量时间序列,寻找离群数据;二是将基于距离的方法和基于密度的方法用于路面平整度检测.实例研究表明,离群数据挖掘算法可有效识别异常交通数据,在交通工程领域具有较大的应用潜力. 展开更多
关键词 交通数据 离群数据挖掘 识别 基于统计的方法 基于距离的方法 基于密度的方法
在线阅读 下载PDF
低信噪比巡天数据中特殊恒星光谱的搜寻方法 被引量:1
17
作者 吴明磊 潘景昌 +1 位作者 衣振萍 韦鹏 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2019年第2期618-621,共4页
特殊恒星是金属丰度异常的恒星,其中包含的信息对于研究宇宙起源、太阳系的演变以及生命的演化都有着重要的意义。因此,特殊恒星的搜寻是国内外巡天项目中的重要目标。恒星光谱中包含着恒星的化学成分、物理性质以及运动状态等丰富的信... 特殊恒星是金属丰度异常的恒星,其中包含的信息对于研究宇宙起源、太阳系的演变以及生命的演化都有着重要的意义。因此,特殊恒星的搜寻是国内外巡天项目中的重要目标。恒星光谱中包含着恒星的化学成分、物理性质以及运动状态等丰富的信息,它是开展恒星研究的重要依据。恒星的识别、分类以及特殊恒星的发现主要依据的是恒星光谱数据。随着LAMOST和SDSS等国内外大规模数字巡天项目的深入展开,恒星光谱的数据量达到了前所未有的高度,如此大的数据量为特殊恒星的发现提供了强有力的支撑。因此如何利用这些数据快速准确地发现特殊、稀少甚至于未知类型的恒星光谱是天文学研究的重要问题。数据挖掘是结合模式识别、机器学习、统计分析及相关专家背景知识,从数据中提取出隐含的过去未知的有价值的潜在信息的技术,其在处理大数据方面有着天然的优势,越来越多的数据挖掘方法被应用到巡天数据处理及分析之中。目前针对特殊恒星搜寻的数据挖掘算法主要包含随机森林、聚类分析以及异常值检测等,但随着巡天深度的拓展,观测的目标越来越暗,进而观测光谱的信噪比也随之变低。低信噪比光谱中存在着大量的无用信息,直接利用相关算法对其进行分析处理得到的结果往往存在很大的偏差。因此,如何从大量低信噪比恒星光谱巡天数据中有效地搜寻出特殊的恒星光谱,是当前面临的一个重要问题。由于低信噪比恒星光谱本身的特点,对于从中搜寻特殊恒星光谱的工作开展较少。为了解决此问题,在仔细研究光谱数据处理方法的基础上,针对低信噪比巡天数据中特殊恒星光谱的搜寻,提出了一种以主成分分析(PCA)和基于密度峰值聚类为基础的方法。该方法首先选取O,B,A,F,G,K和M各种类型的高信噪比恒星光谱,进行波长统一和流量插值后,利用主成分分析得到特征光谱;然后利用方差贡献率最大的前几个特征光谱对低信噪比的恒星光谱进行重构得到高信噪比的光谱;最后利用重构之后的高信噪比光谱进行聚类,聚类分析中得到的离群数据即为所要搜寻的特殊恒星光谱。在聚类时,考虑到恒星光谱数据本身的特点,采用了一种基于密度峰值的聚类方法来进行聚类及离群点的挖掘。实验表明,该方法能够在低信噪比的恒星光谱巡天数据中准确地搜寻出数量相对较少的特殊恒星。同时,也可应用于诸如LAMOST、SDSS等各种银河系巡天的光谱数据分析与挖掘中。 展开更多
关键词 银河系巡天 离群数据挖掘 低信噪比光谱
在线阅读 下载PDF
大流量分布式拒绝服务攻击的防御策略研究 被引量:2
18
作者 王冬琦 郭剑峰 常桂然 《信息网络安全》 2009年第7期17-20,共4页
大流量分布式拒绝服务攻击(High-rate Distributed Denial of Service Attack)是指导致网络流量激增,呈明显异常的"淹没受害者"式的DDoS,简称HDDoS。与其相对应的概念是低流量DDoS。通过建立、分析HDDoS的概念模型总结了其特... 大流量分布式拒绝服务攻击(High-rate Distributed Denial of Service Attack)是指导致网络流量激增,呈明显异常的"淹没受害者"式的DDoS,简称HDDoS。与其相对应的概念是低流量DDoS。通过建立、分析HDDoS的概念模型总结了其特点、分析了当前HDDoS防御策略的发展趋势。提出了一种基于离群数据挖掘算法的HDDoS防御策略ODM方法。实验证明,ODM方法解决了DDoS过滤中产生的间接伤害无法恢复的问题,是防御HDDoS的一种新思路。 展开更多
关键词 网络安全 分布式拒绝服务攻击 离群数据挖掘 间接伤害
在线阅读 下载PDF
一种设备实时监控新方法的研究与应用
19
作者 闫伟 童祯恭 廖西亮 《计算机集成制造系统》 EI CSCD 北大核心 2006年第8期1288-1292,共5页
根据加权K-means算法,建立历史常规参数的聚类模型,用以实时检测设备运行的参数点。对属于簇团内的参数点,分析簇团内不同相似度时的参数个数比例和阈值,提出紧密(离核)指数的定义;对簇团外的异常点,结合CBLOF(t)的概念,提出了一种新的... 根据加权K-means算法,建立历史常规参数的聚类模型,用以实时检测设备运行的参数点。对属于簇团内的参数点,分析簇团内不同相似度时的参数个数比例和阈值,提出紧密(离核)指数的定义;对簇团外的异常点,结合CBLOF(t)的概念,提出了一种新的离群指数的定义,并根据实际情况进行综合,得出了综合指数的定义。据此,可有效地对设备的运行状况进行监控,以起到设备运行优化和故障预警的作用。 展开更多
关键词 聚类分析 离群数据挖掘 紧密(离核)指数 离群指数 综合指数 流程企业
在线阅读 下载PDF
On-line outlier and change point detection for time series 被引量:1
20
作者 苏卫星 朱云龙 +1 位作者 刘芳 胡琨元 《Journal of Central South University》 SCIE EI CAS 2013年第1期114-122,共9页
The detection of outliers and change points from time series has become research focus in the area of time series data mining since it can be used for fraud detection, rare event discovery, event/trend change detectio... The detection of outliers and change points from time series has become research focus in the area of time series data mining since it can be used for fraud detection, rare event discovery, event/trend change detection, etc. In most previous works, outlier detection and change point detection have not been related explicitly and the change point detections did not consider the influence of outliers, in this work, a unified detection framework was presented to deal with both of them. The framework is based on ALARCON-AQUINO and BARRIA's change points detection method and adopts two-stage detection to divide the outliers and change points. The advantages of it lie in that: firstly, unified structure for change detection and outlier detection further reduces the computational complexity and make the detective procedure simple; Secondly, the detection strategy of outlier detection before change point detection avoids the influence of outliers to the change point detection, and thus improves the accuracy of the change point detection. The simulation experiments of the proposed method for both model data and actual application data have been made and gotten 100% detection accuracy. The comparisons between traditional detection method and the proposed method further demonstrate that the unified detection structure is more accurate when the time series are contaminated by outliers. 展开更多
关键词 outlier detection change point detection time series hypothesis test
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部