-
题名一种基于Rymon枚举树的快速挖掘无关集算法
- 1
-
-
作者
许普乐
纪允
-
机构
芜湖职业技术学院教务处
浙江出入境检验检疫局信息化管理处
-
出处
《轻工学报》
CAS
2017年第5期103-108,共6页
-
基金
安徽高校自然科学研究重点项目(KJ2017A552)
高校优秀青年人才支持计划重点项目(gxyq ZD2016591)
-
文摘
针对传统的挖掘算法在挖掘δ无关集时存在重复生成候选项集、遍历子项集等导致挖掘效率过低的问题,提出一个无关集判断定律,进而给出一种快速挖掘无关集算法FMFS.该算法利用Rymon枚举树作为搜索空间,结合一定的剪枝策略,再利用这个无关集判断定律对候选项集进行快速筛选.实验结果表明,该算法不仅能够挖掘出所有的无关集,且挖掘过程中的时间消耗优于目前已有算法.
-
关键词
数据挖掘
频繁项集
精简表示
δ无关集
rymon枚举树
剪枝策略
-
Keywords
data mining
frequent itemsets
concise representation
δ free sets
rymon setenumeration tree
pruning strategy
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种频繁核心项集的快速挖掘算法
被引量:6
- 2
-
-
作者
田卫东
纪允
-
机构
合肥工业大学计算机与信息学院
-
出处
《计算机工程》
CAS
CSCD
2014年第6期120-124,共5页
-
基金
国家自然科学基金资助项目(60603068)
-
文摘
传统的频繁核心项集挖掘需多次生成和反复扫描数据库,导致生成效率低下。为此,提出一种快速生成频繁核心项集算法FMEP。该算法使用Rymon枚举树作为搜索空间,并采用分而治之的策略选择特定的路径进行剪枝。利用频繁核心项集特有的反单调性质,可以快速地判断某一个候选项集是否为频繁核心项集,而无需和所有直接子集的析取支持度进行比较。通过上述方法,可以达到快速挖掘的目的。实验结果证明,该算法能够在挖掘出所有的频繁核心项集精简表示元素的同时,降低消耗时间,与MEP算法相比,在密集型数据集上的时间可缩短2倍以上,在稀疏型数据集上时间至少缩短30%。
-
关键词
数据挖掘
频繁项集
精简表示
频繁核心项集
rymon枚举树
-
Keywords
data mining
frequent itemsets
concise representation
frequent essential itemsets
rymon enumeration tree
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-