-
题名一种挖掘频繁闭项集的深度优先算法
被引量:2
- 1
-
-
作者
张炘
廖频
郭波
-
机构
南昌大学科学技术学院
-
出处
《计算机应用》
CSCD
北大核心
2010年第3期806-809,共4页
-
基金
江西省自然科学基金资助项目(0611065
2007GZS2246)
-
文摘
频繁闭项集挖掘是许多数据挖掘应用中的重要问题。为减少候选项集数量和降低支持度计算的开销,提出一种新的深度优先搜索频繁闭项集(DFFCI)的算法。将改进的压缩频繁模式树(CFP-Tree)表示的数据集信息投影到划分矩阵,使用二进制向量逻辑运算计算支持度,简化了计算过程,减少了时间开销;采用基于支持度预计算技术的全局2-项剪枝和局部扩展剪枝,有效削减了搜索空间。实验结果表明该算法的性能优于其他主流深度优先算法。
-
关键词
数据挖掘
频繁闭项集
压缩频繁模式树
划分矩阵
-
Keywords
data mining
frequent closed itemset
Compressed Frequent Pattern Tree(CFP-Tree)
partition matrix
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名压缩FP-Tree的改进搜索算法
被引量:8
- 2
-
-
作者
吴倩
罗健旭
-
机构
华东理工大学信息学院
-
出处
《计算机工程与设计》
北大核心
2015年第7期1771-1777,共7页
-
基金
国家自然科学基金项目(61304071)
中央高校基本科研业务费专项基金项目
-
文摘
为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁模式树紧凑的数据结构,采用自底向上的搜索策略,快速挖掘压缩频繁模式树及其子树,更快得到候选项集的支持数。实验结果表明,该算法可以高效计算出候选频繁项集出现的频次,挖掘效率明显优于Apriori和FPGrowth算法。
-
关键词
数据挖掘
关联规则
压缩频繁模式树
APRIORI算法
频繁模式增长算法
-
Keywords
data mining
association rules
compressed frequent pattern tree
Apriori algorithm
FP-Growth algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-