-
题名分段扫描生成频繁项目序列集的挖掘算法
- 1
-
-
作者
毛国君
刘椿年
-
机构
北京市多媒体与智能软件重点实验室
北京工业大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第7期19-21,202,共4页
-
基金
国家自然科学基金(编号:60173014)
北京市自然科学基金(编号:4022003)
北京市教委资金资助
-
文摘
关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列集又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目集的算法已经被提出。近几年来,人们更关注于在大型数据集中高效发现频繁项目集的算法研究,特别是在减少数据库的扫描次数、提高内存利用率等方面。该文提出一个称为DFISP的算法,它是基于数据分段扫描策略的,并且只需两次数据库扫描即可完成频繁项目序列集的生成。实验表明,DFISP算法是稳定而高效的。
-
关键词
数据挖掘
关联规则
项目序列(集)
数据分段扫描
-
Keywords
Data Mining,Association Rules,Itemsequences(Itemsequence Sets),Data-Partitioning Scan
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-