-
题名基于包含索引的频繁闭序列模式挖掘的新算法
被引量:1
- 1
-
-
作者
李晋宏
杨炳儒
宋威
侯伟
-
机构
北京科技大学信息工程学院
北方工业大学信息工程学院
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2009年第10期2485-2488,共4页
-
基金
国家自然科学基金(60675030)
北京市属市管高等学校人才强教计划资助课题
-
文摘
频繁闭序列模式惟一确定全体频繁序列模式,且规模小得多。传统的闭序列模式挖掘算法对每个频繁项目都进行扩展,往往会产生大量的非闭合序列。为解决这一问题,提出了一种新的基于包含索引的频繁闭序列模式挖掘算法,其主要思想是只对闭项集进行扩展,大大减少了非闭合序列的产生。首先,论证了闭序列模式只能由闭项集组成;其次,说明了如何利用包含索引来快速发现闭项集;最后,给出了一种深度优先的挖掘频繁闭序列模式的新算法。实验结果表明,该算法具有较高的效率。
-
关键词
数据挖掘
频繁闭项集
频繁闭序列模式
包含索引
-
Keywords
data mining
frequent closed itemset
frequent closed sequence pattern
subsume index
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于不确定数据的可能频繁闭序列模式挖掘
被引量:7
- 2
-
-
作者
李立波
白树仁
陈磊
张威
-
机构
湖南大学信息科学与工程学院
国家超级计算长沙中心
-
出处
《计算机应用研究》
CSCD
北大核心
2016年第4期983-988,共6页
-
基金
国家科技支撑计划资助项目(2012BAH09B02)
长沙市重点科技计划资助项目(K1204006-11-1)
-
文摘
对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCSM。此算法中,基于一种元组不确定数据模型计算序列的可能频繁性,应用BIDE算法的闭序列思想判断可能频繁序列是否是可能频繁闭序列模式;为了减少搜索空间与避免冗余的计算,应用了几个剪枝与边界技术。U-FCSM算法的有效性与效率通过大量的实验得以表明。
-
关键词
不确定数据
可能频繁闭序列模式
概率频繁
不确定数据挖掘
闭序列模式
序列模式增长
-
Keywords
uncertain databases
probabilistically frequent closed sequential patterns
probabilistic frequentness
uncertain data mining
closed sequential patterns
sequential pattern growth
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-