期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
基于抽样的概念层次数据挖掘算法 被引量:1
1
作者 李波 《计算机科学》 CSCD 北大核心 2002年第7期87-89,共3页
一、引言 属性归纳算法的出现主要有以下几个原因.首先,虽然某些规律,如关联规则可以在基本概念层上发现[3,4],但是一些更让人感兴趣的规律一般只在更高的概念层上才能发现,并且表达得更简洁一些.因此有必要将数据库中的基本数据泛化到... 一、引言 属性归纳算法的出现主要有以下几个原因.首先,虽然某些规律,如关联规则可以在基本概念层上发现[3,4],但是一些更让人感兴趣的规律一般只在更高的概念层上才能发现,并且表达得更简洁一些.因此有必要将数据库中的基本数据泛化到相对高的概念层上才能更有效地挖掘数据. 展开更多
关键词 数据 属性归纳算法 概念层次数据挖掘算法 数据
在线阅读 下载PDF
基于概念层次树的数据挖掘算法的研究与实现 被引量:12
2
作者 王大玲 于戈 +2 位作者 鲍玉斌 王国仁 刘斌武 《计算机科学》 CSCD 北大核心 2001年第6期88-91,共4页
1 引言 随着计算机技术、特别是数据库技术的发展,多年来,在冶金企业中,积累了海量的生产现场参数,它们以各种形式存放在数据库中.如何通过对这些数据的分析和处理,发现其中潜在的、未知的规则和知识, 以便从中找到影响产品质量的原因,... 1 引言 随着计算机技术、特别是数据库技术的发展,多年来,在冶金企业中,积累了海量的生产现场参数,它们以各种形式存放在数据库中.如何通过对这些数据的分析和处理,发现其中潜在的、未知的规则和知识, 以便从中找到影响产品质量的原因,达到提高产品质量、降低成本等目的,是亟待解决的问题,数据挖掘技术为此提供了有利的支持. 展开更多
关键词 数据 数据挖掘算法 概念层次 数据
在线阅读 下载PDF
基于概念层次树的数据挖掘算法及应用研究 被引量:4
3
作者 肖娟 叶枫 《计算机应用研究》 CSCD 北大核心 2005年第3期61-63,共3页
概念层次树在大规模数据挖掘中已得到广泛应用。在介绍基于概念层次树的数据挖掘算法的基础上,针对已有数值型数据概念提升算法的不足,提出了改进后的算法,并通过数据测试给出两种算法的比较效果和应用实例。
关键词 概念层次 数据挖掘 闽值
在线阅读 下载PDF
一种基于取样的概念层次数据挖掘新算法 被引量:1
4
作者 李波 《计算机工程与科学》 CSCD 2002年第3期8-10,共3页
本文分析了几种传统属性归纳算法 ,针对它们的不足 ,提出了基于取样的概念层次挖掘算法 ,它不仅可以处理不平衡的概念层次 ,而且得到的泛化规则可以反映实际的数据分布。此外 ,这种算法具有最优的时间和空间复杂性。实验证明 ,本文算法... 本文分析了几种传统属性归纳算法 ,针对它们的不足 ,提出了基于取样的概念层次挖掘算法 ,它不仅可以处理不平衡的概念层次 ,而且得到的泛化规则可以反映实际的数据分布。此外 ,这种算法具有最优的时间和空间复杂性。实验证明 ,本文算法是有效。 展开更多
关键词 数据挖掘 属性归纳算法 概念层次 数据
在线阅读 下载PDF
一种有效的用于数据挖掘的动态概念聚类算法 被引量:16
5
作者 郭建生 赵奕 施鹏飞 《软件学报》 EI CSCD 北大核心 2001年第4期582-591,共10页
概念聚类适用于领域知识不完整或领域知识缺乏时的数据挖掘任务 .定义了一种基于语义的距离判定函数 ,结合领域知识对连续属性值进行概念化处理 ,对于用分类属性和数值属性混合描述数据对象的情况 ,提出了一种动态概念聚类算法 DDCA(dom... 概念聚类适用于领域知识不完整或领域知识缺乏时的数据挖掘任务 .定义了一种基于语义的距离判定函数 ,结合领域知识对连续属性值进行概念化处理 ,对于用分类属性和数值属性混合描述数据对象的情况 ,提出了一种动态概念聚类算法 DDCA(domain- based dynamic clustering algorithm) .该算法能够自动确定聚类数目 ,依据聚类内部属性值的频繁程度修正聚类中心 ,通过概念归纳处理 ,用概念合取表达式解释聚类输出 .研究表明 ,基于语义距离判定函数和基于领域知识的动态概念聚类的算法 DDCA是有效的 . 展开更多
关键词 数据挖掘 领域知识 动态概念聚类算法 数据对象 数据集合 数据
在线阅读 下载PDF
关系数据库中概念层次自动提取算法研究 被引量:4
6
作者 刘胜军 杨学兵 蔡庆生 《计算机应用研究》 CSCD 1999年第12期15-17,共3页
作为一种重要的背景知识,概念层次在KDD中发挥了重要作用。概念层次能够以层次的形式和偏序的关系组织数据和概念,能够以高层概念表示数据库中数据的关系。本文就概念层次的应用和提取进行了讨论,提出一种自动提取数值型概念层次... 作为一种重要的背景知识,概念层次在KDD中发挥了重要作用。概念层次能够以层次的形式和偏序的关系组织数据和概念,能够以高层概念表示数据库中数据的关系。本文就概念层次的应用和提取进行了讨论,提出一种自动提取数值型概念层次的算法. 展开更多
关键词 概念层次 数据挖掘 关系数据 自动提取 算法
在线阅读 下载PDF
大数据分类挖掘算法及其概念漂移应用研究 被引量:5
7
作者 陆莉莉 张永潘 +1 位作者 谈海宇 季一木 《计算机科学与探索》 CSCD 北大核心 2016年第12期1683-1692,共10页
随着大数据应用研究的不断深入和分布式机器学习中流计算框架的涌现,针对数据流中概念漂移问题的研究是面向大数据挖掘领域的研究热点之一。现有的针对概念漂移的研究成果主要还是依赖于数据结构和算法优化,通过计算资源有限的独立计算... 随着大数据应用研究的不断深入和分布式机器学习中流计算框架的涌现,针对数据流中概念漂移问题的研究是面向大数据挖掘领域的研究热点之一。现有的针对概念漂移的研究成果主要还是依赖于数据结构和算法优化,通过计算资源有限的独立计算机完成概念漂移的检测。为此,提出一种面向大数据的基于Storm的抵抗概念漂移的分类挖掘算法S-CVFDT(Storm-concept very fast decision tree)及系统。该系统采用并行化窗口和S-CVFDT算法,利用并行化窗口机制检测数据流中的突变型概念漂移,从而自适应地改变并行窗口大小,并通过S-CVFDT算法不断更新渐进性概念漂移时的模型。分析与实验结果表明,该算法可以快速有效地检测到突变型概念漂移,降低系统因为突变型概念漂移造成的资源浪费,且模型建立效率、分类精度得到提高。 展开更多
关键词 数据 数据挖掘 分类算法 概念漂移
在线阅读 下载PDF
基于抽样的概念层次挖掘算法 被引量:1
8
作者 胡江滔 汪卫 周傲英 《计算机应用与软件》 CSCD 北大核心 2001年第3期57-63,共7页
本文通过对数据挖掘的几种传统属性归纳算法的分析,发现它们存在以下不足:(1)不能处理不平衡的概念层次;(2)没有考虑实际数据分布对最后的泛化规则的影响。因此,本文提出了基于抽样的概念层次挖掘算法,它先采用抽样方法,对概念层次进行... 本文通过对数据挖掘的几种传统属性归纳算法的分析,发现它们存在以下不足:(1)不能处理不平衡的概念层次;(2)没有考虑实际数据分布对最后的泛化规则的影响。因此,本文提出了基于抽样的概念层次挖掘算法,它先采用抽样方法,对概念层次进行初步调整,然后扫描整个数据文件,利用扫描信息再次调整概念层次,最后通过统计调整后的概念层次的叶子信息就可以得到泛化规则。本算法不仅克服了传统算法的不足,而且具有最优的时间复杂度O(h)和空间复杂度O(c)。 展开更多
关键词 数据挖掘 属性归纳算法 概念层次 数据
在线阅读 下载PDF
基于最小生成树的多层次k-Means聚类算法及其在数据挖掘中的应用 被引量:17
9
作者 金晓民 张丽萍 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2018年第5期1187-1192,共6页
针对传统聚类算法存在挖掘效率慢、准确率低等问题,提出一种基于最小生成树的多层次k-means聚类算法,并应用于数据挖掘中.先分析聚类样本的数据类型,根据分析结果设计聚类准则函数;再通过最小生成树对样本数据进行划分,并选取初始聚类中... 针对传统聚类算法存在挖掘效率慢、准确率低等问题,提出一种基于最小生成树的多层次k-means聚类算法,并应用于数据挖掘中.先分析聚类样本的数据类型,根据分析结果设计聚类准则函数;再通过最小生成树对样本数据进行划分,并选取初始聚类中心,将样本的数据空间划分为矩形单元,在矩形单元中对样本对象数据进行计算、降序和选取,得到有效的初始聚类中心,减少数据挖掘时间.实验结果表明,与传统算法相比,该算法可快速、准确地挖掘数据,且挖掘效率提升约50%. 展开更多
关键词 最小生成树 层次k-means聚类算法 数据挖掘
在线阅读 下载PDF
基于概念格和Apriori的关联规则挖掘算法分析 被引量:8
10
作者 王德兴 胡学钢 +1 位作者 刘晓平 王浩 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第6期699-702,共4页
概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述;在概念格的内涵中引入等价关系并将其外延量化,得到量化概念格;利用量化概念格挖掘关联规则,与采用Apriori算法计算频繁项目集获... 概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述;在概念格的内涵中引入等价关系并将其外延量化,得到量化概念格;利用量化概念格挖掘关联规则,与采用Apriori算法计算频繁项目集获取关联规则相比较,不需要计算频繁项目集,容易获得用户感兴趣的关联规则,同时减少了大量冗余的规则,提高了挖掘效率。 展开更多
关键词 关联规则 APRIORI算法 概念 数据挖掘
在线阅读 下载PDF
一种基于层次聚类的机场噪声数据挖掘方法 被引量:12
11
作者 徐涛 谢继文 杨国庆 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2013年第5期715-721,共7页
针对机场噪声数据集特征,提出一种基于代表点的快速层次聚类算法,该算法在传统凝聚层次聚类算法的基础上,借助聚类代表点法和二分法策略进行改进。同时,提出一种聚类代表点和聚类算法相似性定义相结合的聚类结果评价方法,并采用其对聚... 针对机场噪声数据集特征,提出一种基于代表点的快速层次聚类算法,该算法在传统凝聚层次聚类算法的基础上,借助聚类代表点法和二分法策略进行改进。同时,提出一种聚类代表点和聚类算法相似性定义相结合的聚类结果评价方法,并采用其对聚类结果进行评价。实验结果表明,该算法不仅运行效率高,而且能够较准确地发现特定类型飞行事件的噪声分布模式,利用该分布模式能够较准确地预测特定类型飞行事件的噪声分布状况。 展开更多
关键词 数据挖掘 机场噪声预测 代表点 快速层次聚类算法 聚类结果评价
在线阅读 下载PDF
多层次关联规则的快速挖掘算法 被引量:2
12
作者 陈子阳 郭景峰 《燕山大学学报》 CAS 2003年第4期364-366,共3页
数据挖掘被认为是解决“数据爆炸”和“数据丰富,信息贫乏”的一种有效方法。关联规则是数据挖掘的重要研究方向。本文提出了多层次关联规则的一种快速挖掘算法,利用抽样从概念层次树的中间开始挖掘,以提高挖掘的速度。
关键词 数据挖掘 关联规则 概念层次 算法
在线阅读 下载PDF
基于概念格的Web日志路径挖掘算法 被引量:13
13
作者 杨飞 《计算机科学》 CSCD 北大核心 2004年第3期115-117,共3页
路径挖掘适用于探索用户沿超连接寻找和浏览网页的规律,而Web日志的完美结构使挖掘更加容易和有效。由二元关系导出的概念格作为一种非常有用的形式化工具,体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念的泛化与例化关... 路径挖掘适用于探索用户沿超连接寻找和浏览网页的规律,而Web日志的完美结构使挖掘更加容易和有效。由二元关系导出的概念格作为一种非常有用的形式化工具,体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念的泛化与例化关系,因此非常适于发现数据中潜在的信息。本文通过概念格模型,提出了一种Web日志的路径挖掘算法,并进行了相关的分析与展望。 展开更多
关键词 事务数据 关联规则 概念 WEB日志 路径挖掘算法 数据挖掘
在线阅读 下载PDF
多概念层次的数值关联规则挖掘 被引量:2
14
作者 高飞 谢维信 《计算机科学》 CSCD 北大核心 2001年第6期85-87,55,共4页
1 引言 文[6]中将分类规则挖掘的方法扩展到数值关联规则挖掘的情况,其基本思想是:把一个数值属性x划分为若干个等分区间,于是一个三元组〈x, 1, u〉便可对应于一个布尔项目,其中[1,u]表示一个数值区间,之后再用类似于布尔关联规则的挖... 1 引言 文[6]中将分类规则挖掘的方法扩展到数值关联规则挖掘的情况,其基本思想是:把一个数值属性x划分为若干个等分区间,于是一个三元组〈x, 1, u〉便可对应于一个布尔项目,其中[1,u]表示一个数值区间,之后再用类似于布尔关联规则的挖掘算法进行挖掘.这种采用区间分割的方法来刻画数值属性,存在三点不足之外:1)致使信息丢失;2)经济使规则具有误导性;3)产生许多冗余规则. 展开更多
关键词 数据 数值关联规则 数据挖掘 概念层次
在线阅读 下载PDF
降序加权join半概念格快速挖掘算法
15
作者 周涛 张艳宁 +1 位作者 袁和金 陆惠玲 《计算机工程与应用》 CSCD 北大核心 2006年第29期12-15,共4页
通过分析Eclat算法,对完全概念格按照支持度进行了裁减,得到了一个向下封闭的降序join半概念格,在构造半概念格的同时计算出每一个项集的支持度作为其权值,最后基于降序加权join半概念格对Eclat算法进行了改进,裁减了概念格中大量的冗... 通过分析Eclat算法,对完全概念格按照支持度进行了裁减,得到了一个向下封闭的降序join半概念格,在构造半概念格的同时计算出每一个项集的支持度作为其权值,最后基于降序加权join半概念格对Eclat算法进行了改进,裁减了概念格中大量的冗余的连接,给出了一个快速的关联规则挖掘算法。经过分析,该算法与Eclat算法相比,效率更高。 展开更多
关键词 数据挖掘 Eclat算法 概念 Join半概念
在线阅读 下载PDF
基于概念层次树的例外挖掘方法研究
16
作者 王丽珍 周丽华 陈红梅 《计算机工程与应用》 CSCD 北大核心 2002年第11期70-74,86,共6页
例外检测能够在诸如电子商务、信用卡欺骗及气象数据分析等领域中挖掘真正未预料到的知识,人们注意到,已有发现例外的方法只能处理数值型属性,同时不允许用户动态地改变参数。在此,文章基于“概念层次树”、“语义距离”及“语义贴近度... 例外检测能够在诸如电子商务、信用卡欺骗及气象数据分析等领域中挖掘真正未预料到的知识,人们注意到,已有发现例外的方法只能处理数值型属性,同时不允许用户动态地改变参数。在此,文章基于“概念层次树”、“语义距离”及“语义贴近度”等概念,研究了SDB—例外及FCB—例外,并给出了挖掘这些例外的有效算法。 展开更多
关键词 数据挖掘 数据采集 数据 概念层次 例外挖掘方法
在线阅读 下载PDF
空间数据概念树提升算法研究
17
作者 郑志强 吴春明 余建桥 《计算机科学》 CSCD 北大核心 2004年第4期120-122,共3页
本文提出了空间数据概念树提升算法,该算法对基于规则的面向属性的概念树提升算法作了改进,主要是引入可性度因子对规则进行修正,并实行主概念属性一次性泛化。整个算法无需回溯。
关键词 空间数据概念树提升算法 数据挖掘 空间数据 地理信息系统
在线阅读 下载PDF
一种高效的数据集划分关联规则挖掘算法 被引量:1
18
作者 孙雁 田忠和 王泉德 《计算机工程》 CAS CSCD 北大核心 2002年第12期118-120,共3页
设计了一种新的数据集划分关联规则挖掘算法,并对该算法的挖掘效率进行了测试,分析了影响DPARM算法挖掘效率的主要因素。
关键词 数据集划分 关联规则 数据 数据处理 概念层次 数据挖掘算法 数据
在线阅读 下载PDF
大规模交易数据库的一种有效聚类算法(英文) 被引量:17
19
作者 陈宁 陈安 +1 位作者 周龙骧 CHEN Ning 《软件学报》 EI CSCD 北大核心 2001年第4期475-484,共10页
研究大规模交易数据库的聚类问题 ,提出了一种二次聚类算法—— CATD.该算法首先将数据库划分成若干分区 ,在每个分区内利用层次聚类算法进行局部聚类 ,把交易初步划分成若干亚聚类 ,亚聚类的个数由聚类间的距离参数控制 .然后对所有的... 研究大规模交易数据库的聚类问题 ,提出了一种二次聚类算法—— CATD.该算法首先将数据库划分成若干分区 ,在每个分区内利用层次聚类算法进行局部聚类 ,把交易初步划分成若干亚聚类 ,亚聚类的个数由聚类间的距离参数控制 .然后对所有的亚聚类进行全局聚类 ,同时识别出噪声 .由于采用了分区方法和聚类的支持向量表示法 ,该算法只需扫描一次数据库 ,聚类过程在内存中进行 ,因此能处理大规模的数据库 . 展开更多
关键词 数据挖掘 层次聚类 大规模交易数据 聚类算法
在线阅读 下载PDF
基于SVM的空间数据库的层次聚类分析 被引量:9
20
作者 李侃 高春晓 刘玉树 《北京理工大学学报》 EI CAS CSCD 北大核心 2002年第4期485-488,共4页
支持向量机用于两类问题的识别研究 .本算法引入了 SVM,构造二叉树对多类问题进行层次聚类分析 .该算法采用 SVM对两类问题进行识别 ,通过合并逐步由底向上构造二叉树 ,最终二叉树的数目即为聚类数 .它适合任意形状的聚类问题 ,而且可... 支持向量机用于两类问题的识别研究 .本算法引入了 SVM,构造二叉树对多类问题进行层次聚类分析 .该算法采用 SVM对两类问题进行识别 ,通过合并逐步由底向上构造二叉树 ,最终二叉树的数目即为聚类数 .它适合任意形状的聚类问题 ,而且可以确定最优聚类的结果 ,并适于高维数据的分析 . 展开更多
关键词 支持向量机 数据挖掘 空间数据 聚类 层次算法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部