-
题名关联规则的冗余删除与聚类
被引量:15
- 1
-
-
作者
韦素云
吉根林
曲维光
-
机构
南京师范大学计算机系
苏州大学省计算机信息处理重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2006年第1期110-113,共4页
-
基金
江苏省重点实验室开放基金(KJS03064)资助.
-
文摘
关联规则挖掘常常会产生大量的规则,这使得用户分析和利用这些规则变得十分困难,尤其是数据库中属性高度相关时,问题更为突出.为了帮助用户做探索式分析,可以采用各种技术来有效地减少规则数量,如约束性关联规则挖掘、对规则进行聚类或泛化等技术.本文提出一种关联规则冗余删除算法ADRR和一种关联规则聚类算法ACAR.根据集合具有的性质,证明在挖掘到的关联规则中存在大量可以删除的冗余规则,从而提出了算法ADRR;算法ACAR采用一种新的用项目间的相关性来定义规则间距离的方法,结合DBSCAN算法的思想对关联规则进行聚类.最后将本文提出的算法加以实现,实验结果表明该算法是有效可行的,且具有较高的效率.
-
关键词
关联规则
相关性
聚类
-
Keywords
association rules
correlation
clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名树型空间索引及其在聚类中的应用研究
被引量:2
- 2
-
-
作者
栾丽华
吉根林
-
机构
南京师范大学计算机系
苏州大学省计算机信息处理重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第19期166-169,176,共5页
-
基金
江苏省重点实验室开放基金(编号:KSJ03064)资助
-
文摘
对大型高维数据集进行高效的聚类分析已成为许多领域的迫切需要,但是一般的聚类技术在处理高维数据时性能低下。树型空间索引可以高效地组织并检索高维数据,因此使用树型空间索引是改善聚类性能的有力途径。该文介绍各种树型空间索引的结构,并对它们的性能加以分析,接着讨论树型空间索引在聚类分析中的应用,并提出将树型空间索引与聚类技术相融合的思想。
-
关键词
树型空间索引
聚类
R^*树
K-D树
-
Keywords
tree-like spatial index,clustering,R*-tree,K-D-tree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名最小支持度变化时分布式数据库中频繁项目集更新
- 3
-
-
作者
吉根林
赵斌
-
机构
南京师范大学计算机科学系
苏州大学省计算机信息处理重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2005年第7期1233-1236,共4页
-
基金
国家自然科学基金(79970092)资助
江苏省重点实验室开放基金(KJS03064)资助
-
文摘
讨论分布式数据库系统中最小支持度变化时频繁项目集如何高效更新问题,提出了一种基于最小支持度变化的局部频繁项目集的更新算法ULFS和全局频繁项目集的更新算法UGFS.该算法能够充分利用已挖掘的结果,并且产生较少数量的候选频繁项目集,在求解全局频繁项目集过程中,候选局部频繁项目集支持数的通信量为O(n).将文章提出的算法用Java加以实现,并对算法性能进行了研究.实验结果表明这些算法是可行、有效的,并且具有较快的速度.
-
关键词
频繁项目集
关联规则
频繁项目集更新
分布式数据挖掘
KDD
-
Keywords
frequent itemsets
association rule
frequent itemsets updating
distributed data mining
KDD
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-