基于效用表的快速高平均效用挖掘算法被引量：5

Fast high average-utility itemset mining algorithm based on utility-list structure

在线阅读下载PDF

导出

摘要高效用项集挖掘在数据挖掘领域中受到了广泛的关注,但是高效用项集挖掘并没有考虑项集长度对效用值的影响,所以高平均效用项集挖掘被提出;而目前的一些高平均效用项集挖掘算法需要耗费大量的时间才能挖掘出有效的高平均效用项集。针对此问题,给出了一个高平均效用项集挖掘的改进算法——FHAUI。FHAUI算法将效用信息保存到效用列表中,通过效用列表的比较来挖掘出所有的高平均效用值,同时FHAUI算法还采用了一个二维矩阵来有效减少二项效用值的连接比较次数。最后将FHAUI算法在多个经典的数据集上测试。实验结果表明,FHAUI算法在效用列表的连接比较次数上有了极大的降低,同时其时间性能也有非常大提高。 In the field of data mining, high utility itemset mining has been widely studied. However, high utility itemset mining does not consider the effect of the itemset length. To address this issue, high average-utility itemset mining has been proposed. At present, the proposed high average utility itemset mining algorithms take a lot of time to dig out the high averageutility itemset. To solve this problem, an improved high average itemset mining algorithm, named FHAUI （ Fast High Average Utility Itemset）, was proposed. FHAUI stored the utility information in the utility-list and mined all the high average-utility itemsets from the utility-list structure. At the same time, FHAUI adopted a two-dimensional matrix to effectively reduce the number of join-operations. Finally, the experimental results on several classical datasets show that FHAUI has greatly reduced the number of join-operations, and reduced its cost in time consumption.

作者王敬华罗相洲吴倩

机构地区华中师范大学计算机学院

出处《计算机应用》 CSCD 北大核心 2016年第11期3062-3066,共5页 journal of Computer Applications

基金国家自然科学基金资助项目(61370108)~~

关键词平均效用高效用模式挖掘数据挖掘频繁模式 average utility high utility pattern mining data mining frequent pattern

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

作者简介王敬华（1965-），男，湖北红安人，副教授，硕士，主要研究方向：数据挖掘、现代信息系统；通信作者电子邮箱wwwlxzwww@163．com罗相洲（1991-），男，湖北武汉人，硕士研究生，主要研究方向：数据库、数据挖掘；吴倩（1990-），女，湖北汉川人，硕士研究生，主要研究方向：数据挖掘、复杂网络。

引文网络
相关文献

参考文献2

1李也白,唐辉,张淳,贺玉明.基于改进的FP-tree的频繁模式挖掘算法[J].计算机应用,2011,31(1):101-103. 被引量：21
2祝孔涛,李兴建,王乐.高效用项集挖掘算法[J].计算机工程与设计,2013,34(12):4220-4225. 被引量：9

二级参考文献25

1AGRAWAL R, IMIELINSKI T, SWAMI A. Mining association rules between sets of items in large databases[ C]// Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data. New York: ACM, 1993:207-216.
2AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules[ C]// VLDB 1994: Proceedings of the 20th International Conference on Very Large Database. [ S. l. ] : Morgan Kaufmann, 1994: 478 - 499.
3HAN JIAWEI, KAMBER M. Data mining: Concepts and techniques [M].影印版.北京:高等教育出版社,2001.
4HAN JIAWEI, PEI JIAN, YIN YIWEN. Mining frequent patterns without candidate generation[J]. ACM SIGMOD Record, 2000, 29 (2): 1-12.
5ZHOU QINGHUA, CHU W W, LU BAOJING. SmartMiner: A depth first algorithm guided by tail information for mining maximal frequent itemsets[ C]//ICDM 2002: Proceedings of IEEE International Conference on Data Mining. Washington, DC: IEEE, 2002: 570- 577.
6GRAHNE G, ZHU JIANFEI. Fast algorithms for frequent itemset mining using FP-trees[ J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(10) : 1347 - 1362.
7PIETRACAPRINA A, ZANDOLIN D. Mining frequent itemsets using patficia tries[C] //FIMI '03: Proceedings of the 1st Workshop on Frequent Itcmset Mining Implementations. Melbourne, Florida, USA: [ s. n. ], 2003:204 -208.
8朱明.数据挖掘[M].2版.合肥:中国科学技术大学出版社,2008.
9Frequent itemset mining implementations repository[ EB/OL]. [ 2010 -01 -25]. http: //tirol. cs. helsinkl. ft.
10Tseng V S,Shie B,Wu C,et al.Efficient algorithms for mininghigh utility itemsets from transactional databases[J].IEEE Transa-ctions on Knowledge and Data Engineering,2012(1); 1-10.

共引文献28

1蒋廷耀,廖强.一种基于局部重构树的改进频繁子图挖掘算法[J].武汉理工大学学报（信息与管理工程版）,2011,33(6):864-867.
2王会金.中观信息系统审计风险控制体系研究——以COBIT框架与数据挖掘技术相结合为视角[J].审计与经济研究,2012,27(1):16-23. 被引量：24
3王体春,陈炳发,卜良峰.基于公理化设计的产品方案设计可拓配置模型[J].中国机械工程,2012,23(19):2269-2275. 被引量：6
4吐尔地·托合提,维尼拉·木沙江,艾斯卡尔·艾木都拉.基于频繁模式挖掘的维吾尔文智能组词方法[J].计算机应用,2012,32(10):2920-2922. 被引量：6
5杨艳霞,张伟丰.卷烟产品销售规律挖掘算法的应用[J].数字技术与应用,2013,31(1):121-121. 被引量：1
6杨艳霞,杨丽华,张伟丰.基于FP-Growth算法的卷烟产品销售规律挖掘研究[J].科技创业月刊,2013,26(4):31-32. 被引量：1
7刘彩苹,毛建频,毛建旭,屈卫兰,蔡玉武.基于格的快速频繁项集挖掘算法[J].湖南大学学报（自然科学版）,2013,40(10):52-57. 被引量：2
8陈刚,闫英战,刘秉权.一种基于CAN-tree快速构建算法[J].微电子学与计算机,2014,31(1):76-82. 被引量：4
9马强,杨金民.基于MapReduce的频繁项集并行挖掘算法[J].计算机应用与软件,2015,32(9):13-16. 被引量：9
10王润芳,时庆涛.车辆拥堵状态下的最优路径规划建模研究[J].计算机仿真,2016,33(2):204-206. 被引量：10

同被引文献19

1任家东,王倩,王蒙.一种基于频繁模式有向无环图的数据流频繁模式挖掘算法[J].燕山大学学报,2011,35(2):115-120. 被引量：4
2欧阳志平,王丽珍,陈红梅.模糊对象的空间Co-location模式挖掘研究[J].计算机学报,2011,34(10):1947-1955. 被引量：27
3冯岭,王丽珍,高世健.一种带稀有特征的空间co-location模式挖掘新方法[J].南京大学学报（自然科学版）,2012,48(1):99-107. 被引量：13
4王晨,杜义华,卢景秀,李新.基于效用模式树的高效用频繁模式挖掘算法[J].计算机应用,2013,33(A02):111-115. 被引量：3
5杨世晟,王丽珍,芦俊丽,高源.空间高效用Co-location模式挖掘技术初探[J].小型微型计算机系统,2014,35(10):2302-2307. 被引量：9
6宋威,吉红蕾,李晋宏.一种高效用项集并行挖掘算法[J].计算机工程与科学,2015,37(3):422-428. 被引量：3
7慕欢欢,柴玉梅,王黎明.面向数据流的一个高效用项集挖掘算法[J].计算机应用与软件,2015,32(4):283-287. 被引量：4
8王乐,熊松泉,常艳芬,王水.基于模式增长方式的高效用模式挖掘算法[J].自动化学报,2015,41(9):1616-1626. 被引量：10
9张亚梅,张皓,海本斋,廖晓飞.扩展WIT-树融合Diffset策略的频繁加权项集快速挖掘算法[J].计算机应用研究,2015,32(12):3574-3578. 被引量：2
10曾新,杨健.带时间约束的co-location模式挖掘[J].计算机科学,2016,43(2):293-296. 被引量：4

引证文献5

1曾新,李晓伟,杨健.空间co-location模式挖掘表实例的计算方法[J].大理大学学报,2017,2(12):27-31.
2曾新,李晓伟,杨健.带邻近作用的高增益率co-location模式挖掘[J].计算机应用,2018,38(2):491-496.
3浦蓉,邵剑飞,胡常礼,曲坤.基于优化上界的高平均效用项集垂直挖掘算法[J].计算机工程与科学,2020,42(5):931-937. 被引量：1
4高曼,韩萌,雷冰冰.高效用模式产生策略综述[J].计算机工程与应用,2020,56(16):1-12. 被引量：4
5刘淑娟,韩萌,高智慧,穆栋梁,李昂.衍生高效用模式挖掘算法综述[J].燕山大学学报,2024,48(2):138-156. 被引量：1

二级引证文献6

1李慕航,韩萌,陈志强,武红鑫,张喜龙.面向复杂高效用模式的挖掘算法综述[J].广西师范大学学报（自然科学版）,2022,40(3):13-30. 被引量：2
2王斌,周伟,李晓华,胡克勇.Top-k高模糊效用项集挖掘算法[J].计算机工程与设计,2023,44(11):3312-3319. 被引量：1
3孙丽君.电炉企业异构网络共享数据跨级高效项集挖掘系统[J].工业加热,2024,53(3):55-58.
4谢婷萱,武优西,王月华,李艳.一种对比序列模式挖掘算法[J].小型微型计算机系统,2024,45(8):1808-1815. 被引量：2
5韩萌,何菲菲,张瑞华,李春鹏,孟凡兴.生物启发式的模式挖掘方法综述[J].计算机工程与应用,2024,60(16):19-33. 被引量：2
6张瑞华,韩萌,何菲菲,孟凡兴,李春鹏.一种快速的高效用序列模式挖掘算法[J].燕山大学学报,2025,49(4):349-366.

1宋威,刘宇,李晋宏.基于数据库垂直表示的高效用项集挖掘算法研究[J].北方工业大学学报,2011,23(1):20-24. 被引量：1
2刘畅畅.高效用项集挖掘算法综述[J].福建电脑,2016,32(3):90-92.
3祝孔涛,李兴建,王乐.高效用项集挖掘算法[J].计算机工程与设计,2013,34(12):4220-4225. 被引量：9
4宋威,刘明渊,李晋宏.基于事务型滑动窗口的数据流中高效用项集挖掘算法[J].南京大学学报（自然科学版）,2014,50(4):494-504. 被引量：4
5宋威,吉红蕾,李晋宏.一种高效用项集并行挖掘算法[J].计算机工程与科学,2015,37(3):422-428. 被引量：3
6李慧,刘贵全,瞿春燕.频繁和高效用项集挖掘[J].计算机科学,2015,42(5):82-87. 被引量：4
7汪峰坤,张婷婷.一种改进的高效用频繁集挖掘算法[J].宿州学院学报,2016,31(7):103-105.
8林树宽,王晓丛,乔建忠,王蕊.基于索引效用的Top-k高效用项集挖掘方法[J].东北大学学报（自然科学版）,2016,37(1):24-28. 被引量：3
9王敬华,罗相洲,吴倩.基于投影的高效用项集挖掘算法[J].小型微型计算机系统,2016,37(6):1212-1216. 被引量：5
10余光柱,刘旭辉,邵世煌.高激励项集的挖掘研究[J].计算机工程与应用,2009,45(33):125-127.

计算机应用

2016年第11期

浏览历史

内容加载中请稍等...

基于效用表的快速高平均效用挖掘算法被引量：5

参考文献2

二级参考文献25

共引文献28

同被引文献19

引证文献5

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于效用表的快速高平均效用挖掘算法 被引量：5

参考文献2

二级参考文献25

共引文献28

同被引文献19

引证文献5

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于效用表的快速高平均效用挖掘算法被引量：5