-
题名基于列表结构的加权可擦除项集挖掘算法
被引量:1
- 1
-
-
作者
文凯
许萌萌
张许红
-
机构
重庆邮电大学通信与信息工程学院
重庆邮电大学通信新技术应用研究中心
重庆信科设计有限公司
-
出处
《计算机工程与科学》
CSCD
北大核心
2021年第9期1676-1683,共8页
-
文摘
可擦除项集挖掘是从大规模产品数据库中挖掘出低利润项集,以解决厂商财务危机的方法。传统挖掘方法只处理静态产品数据库,在提取可擦除项集时忽略项本身的权值。为解决现有可擦除项集挖掘算法考虑条件单一、效率低下的问题,提出一种有效的在增量数据集上挖掘加权可擦除项集的算法WELI。该算法综合考虑了数据不断积累和项具有不同重要性的因素,采用简洁的列表结构减少内存消耗,利用权重条件进行项集修剪,并结合包含索引和差集思想简化增益的计算过程,以实现高效的增量挖掘操作。实验表明:就运行时间和内存消耗而言,该算法在稠密数据集和稀疏数据集上均具有良好的实验效果,就可伸缩性而言,该算法也优于以往算法。
-
关键词
数据挖掘
可擦除项集
增量挖掘
权重条件
包含索引
-
Keywords
data mining
erasable itemset
incremental mining
weighted conditions
subsume index
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-