-
题名频繁闭项目集挖掘算法研究
被引量:10
- 1
-
-
作者
朱玉全
宋余庆
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第7期1177-1183,共7页
-
基金
国家自然科学基金项目(60572112)
-
文摘
目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出事务数据库中所有的频繁项目集,并对其更新问题进行了研究,提出了一种相应的频繁闭项目集增量式更新算法UMFCIA,该算法将充分利用先前的挖掘结果来节省发现新的频繁闭项目集的时间开销.实验结果表明算法MFCIA是有效可行的.
-
关键词
频繁项目集
频繁闭项目集
最小频繁闭项目集
最大频繁闭项目集
增量式更新
-
Keywords
frequent itemsets
frequent closed itemsets
minimum frequent closed itemsets
maximal frequent closed itemsets
incremental updating
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于FC-tree的频繁闭项目集挖掘算法
被引量:1
- 2
-
-
作者
任永功
张亮
付玉
吕君义
-
机构
辽宁师范大学计算机与信息技术学院
辽河油田锦州工程技术处
-
出处
《计算机科学》
CSCD
北大核心
2008年第9期149-152,164,共5页
-
基金
国家自然科学基金项目(60603047
60703068)
+2 种基金
辽宁省自然科学基金
辽宁省教育厅高等学校科研基金
大连市优秀青年科技人才基金
-
文摘
目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,但这类算法会产生巨大的候选集并且重复扫描数据库。本文针对这一问题,给出了一种基于FC-tree的频繁闭项目集挖掘算法Max-FCIA,该算法将频繁项目集存储在哈希表中,节省了程序的搜索时间。此外,利用广度优先搜索和有效的剪枝策略,大大限制了候选项目集的生成,缩小了搜索空间从而提高了程序的性能。实验结果表明该算法是快速有效的。
-
关键词
频繁项目集
频繁闭项目集
最小频繁闭项目集
最大频繁闭项目集
FC-tree(频繁闭模式树)
-
Keywords
Frequent itemsets, Frequent closed itemsets, Minimum frequent closed itemsets, Maximal frequent closed itemsets, FC-tree (Frequent Pattern Tree )
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TN405
[电子电信—微电子学与固体电子学]
-