期刊文献+

一种基于hash和项集空间划分的关联规则挖掘算法 被引量:2

An Improved Association Rule Mining algorithm Based on Hash and Item sets Space
在线阅读 下载PDF
导出
摘要 在数据挖掘中关联规则是一个重要的研究方向。Apriori算法是关联规则中最著名的算法。本文针对Apriori算法的缺陷,提出一种改进算法(SAVM)。新算法采用向量运算来实现项集支持度计数,大大减少扫描数据库的次数;运用hash函数直接生成频繁2项集;利用基于前缀的划分方法对频繁项集Lk-1进行划分,在相对较小的独立子空间内进行连接生成候选k-项集,减少连接过程中模式匹配的次数,提高连接速度。实验证明,改进算法大幅提高了原算法的效率。 Association rule is an important research direction in data mining. The Apriori algorithm is a classical algorithm in mining association rules. In this paper, we point out the shortage of Apriori algorithm and present an improved one (SAVM). This improved Apriori algorithm uses the operation of vector to get supporting degree of items, applys the Hash function to generate 2-item sets directly, reduces the frequency of database scanning and divides frequent item sets Lk-1 based on prefix to generate candidate k-item sets in a relative small subspace, which can reduce the times of mode matching and improve the speed of joint. The experiments show that the improved Apriori algorithm is high efficiency.
作者 姚亮
出处 《微计算机信息》 2010年第18期154-156,共3页 Control & Automation
关键词 关联规则 SAVM算法 频繁项集 Association Rules SAVM algorithm Frequent item-set
作者简介 姚亮,男,汉族,安徽合肥人,硕士,主要研究方向:数据挖掘。通讯地址:(230061皖合肥市蒙城路109号安徽省地方税务局)
  • 相关文献

参考文献4

  • 1Han J,Pei J,Yin Y. Mining frequent patterns without candidate generation [C]//Proc 2000 ACM-SIGMOD Int Conf Management of Data(SIGMOD'00),Dalas,TX,May 2000.
  • 2PARK J S. Using a hash-based method with transaction trimming for mining association rules[J]. IEEE Transactions on Knowledge and Data Engineering, 1997,19 (5):813-825.
  • 3崔海莉,袁兆山.一种快速发现最大频繁项集的挖掘算法[J].合肥工业大学学报(自然科学版),2006,29(11):1392-1395. 被引量:4
  • 4王柏盛,刘寒冰,靳书和,马丽艳.基于矩阵的关联规则挖掘算法[J].微计算机信息,2007,23(05X):144-145. 被引量:18

二级参考文献5

共引文献20

同被引文献13

引证文献2

二级引证文献12

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部