期刊文献+
共找到70篇文章
< 1 2 4 >
每页显示 20 50 100
基于概念格的天体光谱离群数据识别方法 被引量:24
1
作者 张继福 蒋义勇 +2 位作者 胡立华 蔡江辉 张素兰 《自动化学报》 EI CSCD 北大核心 2008年第9期1060-1066,共7页
在宇宙中,寻求特殊的、未知的天体是人类探索宇宙奥妙所追求的目标之一,天体光谱离群数据识别方法是实现该目标的有效手段之一.将概念格中每个概念节点内涵描述为天体光谱数据特征子空间,提出了一种天体光谱离群数据识别方法.首先将概... 在宇宙中,寻求特殊的、未知的天体是人类探索宇宙奥妙所追求的目标之一,天体光谱离群数据识别方法是实现该目标的有效手段之一.将概念格中每个概念节点内涵描述为天体光谱数据特征子空间,提出了一种天体光谱离群数据识别方法.首先将概念节点的内涵缩减看作天体光谱特征子空间,并依据稀疏度系数阈值确定稀疏子空间;其次对于稀疏子空间,依据稠密度系数判定祖先概念节点内涵是否为稠密子空间,进而判断出概念节点外延中包含的数据对象是否为天体光谱离群数据;最后以离散化天体光谱数据作为形式背景,实验验证了利用该方法识别出的天体光谱离群数据是准确的、完备的和有效的。 展开更多
关键词 天体光谱 概念格 离群数据 稠密度系数 稀疏子空间
在线阅读 下载PDF
基于MapReduce与相关子空间的局部离群数据挖掘算法 被引量:41
2
作者 张继福 李永红 +1 位作者 秦啸 荀亚玲 《软件学报》 EI CSCD 北大核心 2015年第5期1079-1095,共17页
针对高维海量数据,在Map Reduce编程模型下,提出了一种基于相关子空间的局部离群数据挖掘算法.该算法首先利用属性维上的局部稀疏程度,重新定义了相关子空间,从而能够有效地刻画各种局部数据集上的分布特征;其次,利用局部数据集的概率密... 针对高维海量数据,在Map Reduce编程模型下,提出了一种基于相关子空间的局部离群数据挖掘算法.该算法首先利用属性维上的局部稀疏程度,重新定义了相关子空间,从而能够有效地刻画各种局部数据集上的分布特征;其次,利用局部数据集的概率密度,给出了相关子空间中的局部离群因子计算公式,有效地体现了相关子空间中数据对象不服从局部数据集分布特征的程度,并选取离群程度最大的N个数据对象定义为局部离群数据;在此基础上,采用LSH分布式策略,提出了一种Map Reduce编程模型下的局部离群数据挖掘算法;最后,采用人工数据集和恒星光谱数据集,实验验证了该算法的有效性、可扩展性和可伸缩性. 展开更多
关键词 局部离群数据 相关子空间 MAP REDUCE 局部稀疏度 概率密度
在线阅读 下载PDF
快速的基于单元格的离群数据挖掘算法 被引量:8
3
作者 崔贯勋 李梁 +2 位作者 王勇 倪伟 黄丽丰 《计算机应用》 CSCD 北大核心 2009年第12期3300-3302,共3页
针对数据集中离群数据的挖掘速度的问题,提出了快速的基于单元格的离群数据挖掘算法。该算法根据网格的特点首先将数据划分成若干空间单元,从而减少区域查询次数,提高离群数据的挖掘速度,然后根据单元格的阈值来判定一个数据是否为离群... 针对数据集中离群数据的挖掘速度的问题,提出了快速的基于单元格的离群数据挖掘算法。该算法根据网格的特点首先将数据划分成若干空间单元,从而减少区域查询次数,提高离群数据的挖掘速度,然后根据单元格的阈值来判定一个数据是否为离群数据。通过数据测试表明,该算法能够快速有效地挖掘出数据集中的离群数据。 展开更多
关键词 数据挖掘 离群数据 单元格 邻居单元
在线阅读 下载PDF
相关子空间中的局部离群数据挖掘算法研究 被引量:17
4
作者 李永红 张继福 荀亚玲 《小型微型计算机系统》 CSCD 北大核心 2015年第3期460-465,共6页
针对高维数据集,采用局部稀疏差异和局部密度差异的度量因子,给出一种相关子空间中的局部离群数据挖掘算法.该算法根据K最近邻(K-NN),确定数据集中各数据对象的局部数据集,并依据属性值的稀疏因子生成全局的稀疏因子矩阵和局部稀疏因子... 针对高维数据集,采用局部稀疏差异和局部密度差异的度量因子,给出一种相关子空间中的局部离群数据挖掘算法.该算法根据K最近邻(K-NN),确定数据集中各数据对象的局部数据集,并依据属性值的稀疏因子生成全局的稀疏因子矩阵和局部稀疏因子矩阵,从而有效地反映了数据对象的局部稀疏程度;根据局部稀疏因子矩阵,计算属性维对应的局部稀疏差异因子,并确定数据对象对应的子空间定义向量,从而体现了具有任意性相关的相关子空间;如果数据对象存在相关子空间,则采用高斯误差函数体现相关子空间中各数据对象的局部密度差异,有效地降低了"维灾"的影响,使得离群数据的度量与相关子空间的维度无关,并能够度量相关子空间的数据对象,否则设置数据对象的局部密度差异为0,表明其为正常数据;选取局部密度差异(离群程度)最大的若干数据对象作为局部离群数据;最后采用UCI和恒星光谱数据集,实验验证了该算法的有效性. 展开更多
关键词 局部离群数据 高维数据 局部稀疏差异 局部密度差异 相关子空间
在线阅读 下载PDF
离群数据的挖掘方法研究 被引量:16
5
作者 史东辉 张春阳 蔡庆生 《小型微型计算机系统》 CSCD 北大核心 2001年第10期1234-1236,共3页
离群数据的挖掘是数据挖掘的一个重要部分 ,本文介绍了几个重要的离群数据挖掘方法 ,给出了一个新的基于距离的离群数据发现方法 :第 k个最近邻居法 ;其主要思想是 。
关键词 离群数据 数据挖掘 第k个最近领邻居法 数据
在线阅读 下载PDF
基于密度的局部离群数据挖掘方法的改进 被引量:30
6
作者 王茜 刘书志 《计算机应用研究》 CSCD 北大核心 2014年第6期1693-1696,1701,共5页
针对传统局部离群点检测算法的局限性进行了研究,提出了一种新的有效的离群数据挖掘算法。该算法在寻找数据点的近邻区域时采用了基于影响空间的局部离群点检测(INFLO)中影响空间的概念,然后在计算数据点的离群因子时,根据基于链接的离... 针对传统局部离群点检测算法的局限性进行了研究,提出了一种新的有效的离群数据挖掘算法。该算法在寻找数据点的近邻区域时采用了基于影响空间的局部离群点检测(INFLO)中影响空间的概念,然后在计算数据点的离群因子时,根据基于链接的离群点检测(COF)中链式距离的思想,提出了基于相似k距离邻居序列(SKDNS)的离群因子计算方法。通过对比该算法和其他经典局部离群点检测算法在不同数据分布情况下的挖掘结果,该算法比LOF、INFLO和COF算法的离群挖掘准确性更高,能有效克服LOF算法的不足,提高局部离群数据挖掘的准确性和多样性。 展开更多
关键词 离群数据挖掘 影响空间 链式距离 相似k距离邻居序列 离群因子
在线阅读 下载PDF
线指数特征空间内恒星光谱离群数据挖掘与分析 被引量:4
7
作者 王光沛 潘景昌 +2 位作者 衣振萍 韦鹏 姜斌 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2016年第10期3364-3368,共5页
大规模光谱巡天将产生海量的光谱数据,为搜寻一些奇异甚至于未知类型的光谱提供了机会,对这些特殊天体的研究有助于揭示宇宙的演变规律和生命起源,巡天数据的离群数据挖掘有助于这些特殊的光谱的发现。利用线指数对光谱数据进行降维能... 大规模光谱巡天将产生海量的光谱数据,为搜寻一些奇异甚至于未知类型的光谱提供了机会,对这些特殊天体的研究有助于揭示宇宙的演变规律和生命起源,巡天数据的离群数据挖掘有助于这些特殊的光谱的发现。利用线指数对光谱数据进行降维能够在尽可能多的保留光谱物理特征的同时,有效解决高维光谱数据聚类分析中运算复杂度较高的问题。提出了基于线指数特征的海量恒星光谱离群数据挖掘及分析的方法,以恒星光谱的Lick线指数作为光谱数据的特征,利用聚类搜寻离群数据的方法在海量光谱巡天数据搜寻离群数据,以此为基础并给出线指数特征空间内离群光谱数据的分析方法。实验结果证明:(1)以线指数作为光谱的特征值能快速的完成对高维光谱数据的离群数据挖掘,可以解决高维光谱数据运算复杂度高的问题;(2)该方法是在聚类结果上进行的离群数据挖掘,能够有效的挖掘出数量较少的发射线恒星、晚M型恒星、极贫金属星、缺失数据光谱等数据;(3)线指数特征空间的离群数据挖掘可以得到线指数特征空间内特殊恒星的发现规则。本文所提出的基于线指数特征的离群数据挖掘及分析方法可以应用到巡天数据的相关研究中。 展开更多
关键词 Lick线指数 离群数据挖掘 恒星光谱
在线阅读 下载PDF
利用子空间划分的局部离群数据挖掘算法 被引量:4
8
作者 刘爱琴 葛凌云 +1 位作者 杨海峰 张继福 《小型微型计算机系统》 CSCD 北大核心 2011年第8期1628-1632,共5页
目前大多数局部离群数据挖掘算法需人为事先设置参数或阈值,且难以应用到高维数据集.给出一种新的局部离群数据挖掘算法PSO-SPLOF,该算法首先将数据集划分为互不相交的子空间,利用偏斜度判断子空间划分的优劣,并采用微粒群算法搜索最优... 目前大多数局部离群数据挖掘算法需人为事先设置参数或阈值,且难以应用到高维数据集.给出一种新的局部离群数据挖掘算法PSO-SPLOF,该算法首先将数据集划分为互不相交的子空间,利用偏斜度判断子空间划分的优劣,并采用微粒群算法搜索最优划分子空间集;其次针对每个最优划分子空间,计算其数据对象的局部离群因子SPLOF值,并用SPLOF值来度量数据对象的局部偏离程度.最后采用离散化的天体光谱数据作为数据集,实验验证了PSO-SPLOF算法具有受人为因素影响小、伸缩性强和运算效率高等优点. 展开更多
关键词 离群数据挖掘 微粒群算法 子空间 划分偏斜度 天体光谱数据
在线阅读 下载PDF
基于约束概念格的天体光谱局部离群数据挖掘系统 被引量:5
9
作者 张继福 张素兰 蒋义勇 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2009年第2期551-555,共5页
寻找特殊的、未知的天体是人类探索宇宙奥妙所追求的目标之一,天体光谱数据挖掘是实现该目标的一种有效方法。约束概念格是一种新的概念格结构,具有构造效率高、提取知识针对性和实用性强等特点。针对天体光谱数据在特征子空间中的局部... 寻找特殊的、未知的天体是人类探索宇宙奥妙所追求的目标之一,天体光谱数据挖掘是实现该目标的一种有效方法。约束概念格是一种新的概念格结构,具有构造效率高、提取知识针对性和实用性强等特点。针对天体光谱数据在特征子空间中的局部偏离,采用VC++6.0和Oracle 9i作为开发工具,设计与实现了基于约束概念格的天体光谱局部离群数据挖掘系统,并对软件模块功能和体系结构,以及天体光谱数据预处理、约束概念格构造方法、基于链表结构的概念格构造、局部离群数据挖掘方法等关键技术进行了详细描述。运行结果表明,该系统实现天体光谱数据局部离群数据挖掘是可行的、有价值的,从而为寻找未知的、特殊的天体提供了一种新途径。 展开更多
关键词 天体光谱 局部离群数据 约束概念格 稠密子空间 稀疏度系数
在线阅读 下载PDF
离群数据挖掘及其在电力负荷预测中的应用 被引量:11
10
作者 冯丽 邱家驹 《电力系统自动化》 EI CSCD 北大核心 2004年第11期41-44,86,共5页
离群数据挖掘是数据挖掘的一个重要内容,它为分析各种海量的、复杂的、含有噪声的数据提供了新的方法,但它在电力系统中还未得到广泛的应用。文中通过对现有的主要离群数据挖掘算法的简要对比说明,针对电力系统的基本特征提出应用信息... 离群数据挖掘是数据挖掘的一个重要内容,它为分析各种海量的、复杂的、含有噪声的数据提供了新的方法,但它在电力系统中还未得到广泛的应用。文中通过对现有的主要离群数据挖掘算法的简要对比说明,针对电力系统的基本特征提出应用信息熵原则的电力负荷离群数据挖掘改进算法,然后应用Kohonen网提取相关负荷的特征曲线,并将其用于不良数据的校正,通过对电力负荷的仿真分析表明了该算法的有效性。 展开更多
关键词 离群数据挖掘 负荷预测 聚类分析 信息熵 人工神经网络
在线阅读 下载PDF
对随机投影算法的离群数据挖掘技术研究 被引量:3
11
作者 李桥 周莹莲 +1 位作者 黄胜 马翔 《计算机工程与应用》 CSCD 2013年第24期122-129,共8页
d维点集离群数据挖掘技术是目前数据挖掘领域的研究热点之一。当前基于距离或最近邻概念进行离群数据挖掘时,在高维数据情况下的挖掘效果不佳,鉴于此,将基于角度的离群因子应用到高维离群数据挖掘中,提出一种新的基于随机投影算法的离... d维点集离群数据挖掘技术是目前数据挖掘领域的研究热点之一。当前基于距离或最近邻概念进行离群数据挖掘时,在高维数据情况下的挖掘效果不佳,鉴于此,将基于角度的离群因子应用到高维离群数据挖掘中,提出一种新的基于随机投影算法的离群数据挖掘方案,它只需要用接近线性时间的方法就能预测所有数据点的基于角度的离群因子。该方法可以用于并行环境进行并行加速。对近似质量进行了理论分析,以保证算法的可靠性。合成和真实数据集实验结果表明,对超高维数据集,该方法效率高、可伸缩性强。 展开更多
关键词 离群数据挖掘 角度 随机投影算法 接近线性时间 可靠性 效率
在线阅读 下载PDF
基于模糊大间隔最小球分类模型的恒星光谱离群数据挖掘方法 被引量:8
12
作者 刘忠宝 赵文娟 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2016年第4期1245-1248,共4页
由于人类对宇宙的认识有限,因此,如何通过对光谱数据分析发现一些新的、特殊的天体成为天文学家面临的重要课题。目前,常见特殊天体发现方法的基本思想是利用智能分类算法对离群数据进行分析。然而,当前主流分类算法大多对离群数据不敏... 由于人类对宇宙的认识有限,因此,如何通过对光谱数据分析发现一些新的、特殊的天体成为天文学家面临的重要课题。目前,常见特殊天体发现方法的基本思想是利用智能分类算法对离群数据进行分析。然而,当前主流分类算法大多对离群数据不敏感,分类性能甚至受离群点影响较大,因而无法完成特殊天体发现任务。鉴于此,提出基于模糊大间隔最小球分类模型的离群数据挖掘方法,该方法利用部分一般样本和离群样本建立最小球模型,并在此基础上引入模糊技术,通过降低噪声的权重,尽量减少噪声的影响。与C-SVM,SVDD,KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明所提方法的有效性。 展开更多
关键词 恒星光谱 分类 模糊大间隔最小球 离群数据
在线阅读 下载PDF
NJW在离群数据挖掘中的应用研究 被引量:4
13
作者 朱庆生 钟洵 杨鹏 《计算机工程与应用》 CSCD 北大核心 2010年第7期128-130,212,共4页
最近几年,谱聚类思想开始用于数据挖掘领域,并取得了较好的效果;离群数据挖掘是对离群点进行检测,发掘出有用知识。将谱聚类中的NJW算法成功应用到离群数据挖掘领域,并结合离群指数的概念,提出了一种适合离群数据挖掘的谱聚类算法。与... 最近几年,谱聚类思想开始用于数据挖掘领域,并取得了较好的效果;离群数据挖掘是对离群点进行检测,发掘出有用知识。将谱聚类中的NJW算法成功应用到离群数据挖掘领域,并结合离群指数的概念,提出了一种适合离群数据挖掘的谱聚类算法。与原有的基于聚类的离群检测算法相比,具有更好的效率和适应性。实验验证了所提算法的有效性和可行性。 展开更多
关键词 NJW 离群数据挖掘 谱聚类
在线阅读 下载PDF
一种改进的基于密度的离群数据挖掘算法 被引量:8
14
作者 崔贯勋 朱庆生 《计算机应用》 CSCD 北大核心 2007年第3期559-560,573,共3页
利用基于密度的离群数据挖掘算法离群数据不在非离群数据指定的邻域内的特点,改进了原有的离群数据挖掘算法:首先判断数据是否在某个非离群数据指定的邻域内,如果不在,再判断其邻域内数据的个数。通过对二维空间数据测试表明,改进的算... 利用基于密度的离群数据挖掘算法离群数据不在非离群数据指定的邻域内的特点,改进了原有的离群数据挖掘算法:首先判断数据是否在某个非离群数据指定的邻域内,如果不在,再判断其邻域内数据的个数。通过对二维空间数据测试表明,改进的算法能够快速有效地挖掘出数据集中的离群数据,速度上数倍于原来的算法。 展开更多
关键词 数据挖掘 离群数据 基于密度
在线阅读 下载PDF
面向LAMOST的天体光谱离群数据挖掘系统研究 被引量:6
15
作者 张继福 蔡江辉 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2007年第3期606-609,共4页
在宇宙中寻求未知天体是人类探索宇宙奥妙所追求的目标之一,离群数据挖掘是发现未知天体光谱数据的一种有效途径。文章首先以VC++和Oracle9i为开发工具,设计与实现了面向LAMOST的恒星光谱离群数据挖掘系统,并给出了其软件体系结构和模... 在宇宙中寻求未知天体是人类探索宇宙奥妙所追求的目标之一,离群数据挖掘是发现未知天体光谱数据的一种有效途径。文章首先以VC++和Oracle9i为开发工具,设计与实现了面向LAMOST的恒星光谱离群数据挖掘系统,并给出了其软件体系结构和模块功能。其次,对基于中值滤波器的恒星光谱数据预处理、基于距离的恒星光谱数据聚类、基于距离支持度的恒星光谱数据离群数据挖掘、基于主分量分析法PCA的恒星光谱数据离群数据的三维可视化等主要关键技术进行了详细描述。最后,基于SDSS恒星光谱数据的运行结果表明,利用该系统寻找天体光谱离群数据是可行的,从而为寻找未知的、特殊的天体光谱数据提供了一种新途径。 展开更多
关键词 天体光谱数据 离群数据 聚类 距离支持度
在线阅读 下载PDF
Web网络中的离群数据挖掘技术研究与改进 被引量:8
16
作者 翁佩纯 张远海 马慧 《现代电子技术》 北大核心 2017年第18期29-31,共3页
离散数据在Web网络中分布较广,是造成数据挖掘有用信息容量低的主要原因。霍金斯离散数据挖掘方法自提出以来获得了很高的成就,但仍存在挖掘数据分类性能不高的缺点,在此,使用BP神经网络对其进行改进。霍金斯离散数据挖掘方法分离散数... 离散数据在Web网络中分布较广,是造成数据挖掘有用信息容量低的主要原因。霍金斯离散数据挖掘方法自提出以来获得了很高的成就,但仍存在挖掘数据分类性能不高的缺点,在此,使用BP神经网络对其进行改进。霍金斯离散数据挖掘方法分离散数据扫描和离散信息挖掘两个步骤进行,所提改进方法通过优化原方法中离散数据的排序规律,挖掘最优BP神经网络连接节点权值集群,改进离散数据集群的正确分区能力,降低离散信息挖掘过程的时空复杂度,提高原方法的分类精度和分类效率。实验结果表明,所提改进方法在Web网络离散数据中能获取高度可靠的挖掘结果。 展开更多
关键词 WEB网络 霍金斯离群数据挖掘 改进的离散信息挖掘 BP神经网络
在线阅读 下载PDF
基于分形的市场营销离群数据挖掘模型 被引量:5
17
作者 夏火松 蔡淑琴 《计算机工程与应用》 CSCD 北大核心 2002年第12期24-25,28,共3页
文章探讨了在网络计算的环境下的市场营销离群数据挖掘的重要性与内容。并用分形的原理分析了市场营销离群数据的特点,构造了基于分形的市场营销离群数据挖掘模型。
关键词 分形 市场营销 离群数据挖掘
在线阅读 下载PDF
一种基于距离的再聚类的离群数据发现算法 被引量:4
18
作者 徐雪松 刘凤玉 《计算机应用》 CSCD 北大核心 2006年第10期2398-2400,共3页
通过研究基于离群距离的数据发现(Cell-Based)算法的识别、分析和评价算法,指出了其优越性和不足,提出一种新的离群数据发现算法——基于距离的再聚类离群数据发现算法。理论分析和仿真结果表明,该算法有效地克服了传统的基于距离的数... 通过研究基于离群距离的数据发现(Cell-Based)算法的识别、分析和评价算法,指出了其优越性和不足,提出一种新的离群数据发现算法——基于距离的再聚类离群数据发现算法。理论分析和仿真结果表明,该算法有效地克服了传统的基于距离的数据发现算法易于随参数变化而需要调整单元结构,以及只适用于维度不高的离群数据发现等的缺点,并有效地避免了由于随机初始值选取导致不同的离群数据发现结果问题,同时也有较快的收敛速度。 展开更多
关键词 聚类 距离 离群数据
在线阅读 下载PDF
离群数据的探测 被引量:3
19
作者 张彦霞 赵永恒 《天文学进展》 CSCD 北大核心 2004年第1期1-9,共9页
综述了离群数据(outliers)探测是数据挖掘和知识发现的一项重要任务及其在天文学中兴起的必然性。简要介绍了离群数据的定义、特点、产生原因及影响,着重阐述了探测-维离群数据和多维离群数据的方法,并且与一些聚类算法作了对比。每一... 综述了离群数据(outliers)探测是数据挖掘和知识发现的一项重要任务及其在天文学中兴起的必然性。简要介绍了离群数据的定义、特点、产生原因及影响,着重阐述了探测-维离群数据和多维离群数据的方法,并且与一些聚类算法作了对比。每一种算法各有优劣,天文学家应根据天文数据的特点,探讨出适合天文数据特点的离群数据探测方法,以发现一些不同寻常的、稀有的、甚至新类型的天体和天文现象。 展开更多
关键词 数据处理 离群数据 数据挖掘 知识发现 天文数据 数据探测
在线阅读 下载PDF
一种基于离群数据挖掘的数据抽查新方法 被引量:1
20
作者 耿焕同 于琨 +1 位作者 洪流 蔡庆生 《中国科学技术大学学报》 CAS CSCD 北大核心 2004年第2期213-218,共6页
针对传统数据抽查方法很难保证数据抽查有效性的缺点 ,结合离群数据挖掘 ,给出了一种基于离群数据挖掘的数据抽查新方法 .通过实验表明 ,该方法既能克服了随机数据抽查难以保证抽查有效性的缺陷又能克服重点数据抽查对抽查者经验的依赖 。
关键词 离群数据挖掘 数据抽查 NCL_CLARA聚类 数据 机器学习
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部