一种基于hash和项集空间划分的关联规则挖掘算法被引量：2

An Improved Association Rule Mining algorithm Based on Hash and Item sets Space

在线阅读下载PDF

导出

摘要在数据挖掘中关联规则是一个重要的研究方向。Apriori算法是关联规则中最著名的算法。本文针对Apriori算法的缺陷,提出一种改进算法(SAVM)。新算法采用向量运算来实现项集支持度计数,大大减少扫描数据库的次数;运用hash函数直接生成频繁2项集;利用基于前缀的划分方法对频繁项集Lk-1进行划分,在相对较小的独立子空间内进行连接生成候选k-项集,减少连接过程中模式匹配的次数,提高连接速度。实验证明,改进算法大幅提高了原算法的效率。 Association rule is an important research direction in data mining. The Apriori algorithm is a classical algorithm in mining association rules. In this paper, we point out the shortage of Apriori algorithm and present an improved one （SAVM）. This improved Apriori algorithm uses the operation of vector to get supporting degree of items, applys the Hash function to generate 2-item sets directly, reduces the frequency of database scanning and divides frequent item sets Lk-1 based on prefix to generate candidate k-item sets in a relative small subspace, which can reduce the times of mode matching and improve the speed of joint. The experiments show that the improved Apriori algorithm is high efficiency.

作者姚亮

机构地区安徽省地方税务局信息中心

出处《微计算机信息》 2010年第18期154-156,共3页 Control & Automation

关键词关联规则 SAVM算法频繁项集 Association Rules SAVM algorithm Frequent item-set

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

作者简介姚亮，男，汉族，安徽合肥人，硕士，主要研究方向：数据挖掘。通讯地址：（230061皖合肥市蒙城路109号安徽省地方税务局）

引文网络
相关文献

参考文献4

1Han J,Pei J,Yin Y. Mining frequent patterns without candidate generation [C]//Proc 2000 ACM-SIGMOD Int Conf Management of Data(SIGMOD'00),Dalas,TX,May 2000.
2PARK J S. Using a hash-based method with transaction trimming for mining association rules[J]. IEEE Transactions on Knowledge and Data Engineering, 1997,19 (5):813-825.
3崔海莉,袁兆山.一种快速发现最大频繁项集的挖掘算法[J].合肥工业大学学报（自然科学版）,2006,29(11):1392-1395. 被引量：4
4王柏盛,刘寒冰,靳书和,马丽艳.基于矩阵的关联规则挖掘算法[J].微计算机信息,2007,23(05X):144-145. 被引量：18

二级参考文献5

1陈刚,李秀,刘文煌.基于“新颖度”的关联挖掘算法[J].微计算机信息,2006,22(08X):1-3. 被引量：4
2路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113
3宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164
4徐章艳,张师超,区玉明,卢景丽,刘美玲.挖掘关联规则中的一种优化的Apriori算法[J].计算机工程,2003,29(19):83-84. 被引量：50
5牛小飞,石冰.基于向量和矩阵的挖掘关联规则的高效算法[J].计算机工程与应用,2004,40(12):170-173. 被引量：12

共引文献20

1卢雪燕,王勇,周永权.一种基于位矩阵的负关联规则挖掘新算法[J].广西民族大学学报（自然科学版）,2007,13(4):57-60. 被引量：3
2李卫华,刘卫国.一种基于压缩矩阵的Apriori改进算法[J].计算机系统应用,2008,17(3):27-30. 被引量：9
3袁万莲,郑诚,翟明清.一种改进的Apriori算法[J].计算机技术与发展,2008,18(5):51-53. 被引量：19
4张忠平,李岩,林志杰,王爱杰.基于索引数组的频繁项集挖掘算法[J].计算机应用研究,2009,26(1):44-46. 被引量：2
5桂琼,程小辉.基于事务相似矩阵的关联规则挖掘算法[J].桂林工学院学报,2008,28(4):568-571. 被引量：5
6张忠平,李岩,杨静.基于矩阵的频繁项集挖掘算法[J].计算机工程,2009,35(1):84-86. 被引量：19
7徐嘉莉.一种基于矩阵压缩的Apriori优化算法[J].微计算机信息,2009,25(12):213-215. 被引量：4
8余平,汪继文.基于项集分解的快速挖掘最大频繁项集算法[J].佳木斯大学学报（自然科学版）,2009,27(4):511-513. 被引量：1
9张月琴.基于0-1矩阵的频繁项集挖掘算法研究[J].计算机工程与设计,2009,30(20):4662-4664. 被引量：8
10尤垂桔,赵绍玉.基于信息增益的征信数据关联规则挖掘模型设计[J].甘肃联合大学学报（自然科学版）,2010,24(2):70-73.

同被引文献13

1李霞,蒋盛益.改进的共享最近邻聚类算法[J].计算机工程与应用,2011,47(8):138-142. 被引量：3
2李建江,崔健,王聃,严林,黄义双.MapReduce并行编程模型研究综述[J].电子学报,2011,39(11):2635-2642. 被引量：188
3甘亮,李润恒,贾焰,刘健.HS-StreamCube:网络安全事件流实时多维分析系统[J].计算机工程与科学,2013,35(3):72-79. 被引量：3
4孙逢啸,倪世宏,谢川.一种基于矩阵的Apriori改进算法[J].计算机仿真,2013,30(8):245-249. 被引量：21
5罗丹,李陶深.一种基于压缩矩阵的Apriori算法改进研究[J].计算机科学,2013,40(12):75-80. 被引量：46
6宋文慧,高建瓴.基于矩阵的Apriori算法改进[J].计算机技术与发展,2016,26(6):62-64. 被引量：14
7刘木林,朱庆华.基于Hadoop的关联规则挖掘算法研究——以Apriori算法为例[J].计算机技术与发展,2016,26(7):1-5. 被引量：18
8王艳辉,王淑君,李曼,林帅.基于改进FP-Growth算法的CRHX型动车组牵引系统关联失效模型研究[J].铁道学报,2016,38(9):72-80. 被引量：5
9杜佼玲,张向利.基于Hadoop的DG-Apriori算法[J].桂林电子科技大学学报,2016,36(5):387-390. 被引量：3
10朱坤,黄瑞章,张娜娜.一种基于MapReduce模型的高效频繁项集挖掘算法[J].计算机科学,2017,44(7):31-37. 被引量：9

引证文献2

1伍荣,褚龙,余兴华.大数据技术在信息安全领域中的应用[J].通信技术,2017,50(6):1295-1298. 被引量：11
2梅俊,陈建敏.一种基于hadoop平台下的矩阵优化Apriori改进算法[J].黄山学院学报,2020,22(5):35-38. 被引量：1

二级引证文献12

1方晓炎.刍议大数据技术在信息安全领域中的应用[J].电脑编程技巧与维护,2018(6):91-92. 被引量：3
2王大鹏.浅析商业银行大数据应用[J].中国商论,2018,0(34):15-16. 被引量：1
3宋璐璐.试论信息安全领域中大数据技术的应用[J].技术与市场,2019,26(5):123-123. 被引量：3
4孔宇强.大数据技术在信息安全系统中的应用研究[J].无线互联科技,2020,17(3):57-58. 被引量：4
5侯宇.大数据技术在人工智能中的应用[J].电子技术与软件工程,2020(9):186-187. 被引量：1
6高刚强.基于大数据的社交平台用户个人信息安全保护策略[J].数码设计,2020,9(24):31-31.
7潘娟娟,李明.基于大数据技术的电子支付信息安全加密系统[J].现代电子技术,2021,44(13):71-74. 被引量：12
8赵宾华,杨国瑞,贾哲.基于人工智能的网络空间防御技术[J].计算机与网络,2021,47(12):57-60.
9郑羽,胡积宝.基于遗传算法的Hadoop作业调度模型性能评价[J].池州学院学报,2021,35(3):24-28.
10张鹏.基于人工智能的信息安全防御技术研究[J].移动信息,2024,46(8):171-173.

1张倩,王治和,杨俊.一种Apriori的改进算法[J].沈阳理工大学学报,2006,25(1):40-42. 被引量：3
2陈燕红,黄名选.基于Apriori改进算法的局部反馈查询扩展[J].现代图书情报技术,2007(9):84-87. 被引量：3
3岳鹏宇,李培仁,袁怀亭,于万荣.关联规则挖掘算法的探讨[J].山西气象,2008(2):34-35.
4程玉,熊英.数据挖掘中关联规则算法的研究[J].软件导刊,2009,8(11):63-65.
5宋凯,王开祥.关联规则在电信业务交叉销售中的应用[J].沈阳理工大学学报,2015,34(4):75-79. 被引量：1
6吕锋华.关系数据库数据挖掘技术具体实现的探讨[J].软件导刊,2009,8(7):150-151.
7杨景,郑钟志,宋金歌,段鹏.基于矩阵的频繁项集挖掘算法[J].云南民族大学学报（自然科学版）,2010,19(5):334-336. 被引量：2
8焦亚冰.数据挖掘中关联规则算法的研究[J].福建电脑,2008,24(3):77-77.
9徐正光,闫恒川,张利欣.基于表情识别的独立成分分析方法的研究[J].计算机工程,2006,32(24):183-185. 被引量：8
10孙永宣,谢昭,高隽.图像奇异性检测的核分类新方法[J].光学学报,2013,33(10):173-180. 被引量：2

微计算机信息

2010年第18期

浏览历史

内容加载中请稍等...

一种基于hash和项集空间划分的关联规则挖掘算法被引量：2

参考文献4

二级参考文献5

共引文献20

同被引文献13

引证文献2

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

一种基于hash和项集空间划分的关联规则挖掘算法 被引量：2

参考文献4

二级参考文献5

共引文献20

同被引文献13

引证文献2

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

一种基于hash和项集空间划分的关联规则挖掘算法被引量：2