-
题名Top-k高模糊效用项集挖掘算法
被引量:1
- 1
-
-
作者
王斌
周伟
李晓华
胡克勇
-
机构
青岛理工大学信息与控制工程学院
-
出处
《计算机工程与设计》
北大核心
2023年第11期3312-3319,共8页
-
基金
国家自然科学基金项目(61902205)。
-
文摘
针对高模糊效用项集挖掘算法中存在的阈值选择难题,提出一种Top-k高模糊效用项集挖掘算法TKHFU(top-k high fuzzy utility itemset mining)。将高模糊效用项集挖掘算法中设定阈值的问题转化为设定所需高模糊效用项集数量k的问题。提出模糊项集效用列表结构,有效保存事务数据库中的关键信息,避免项集间复杂的连接操作。提出一种更紧密的模糊效用上界和两种剪枝策略,将剪枝策略运用至列表中,减少搜索空间。实验结果表明,该算法在运行时间、内存消耗及可伸缩性方面均优于最新算法。
-
关键词
数据挖掘
项集挖掘
阈值
高模糊效用
效用列表
模糊效用上界
剪枝策略
-
Keywords
data mining
itemsets mining
threshold value
high fuzzy utility
utility list
fuzzy utility upper bound
pruning strategy
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名高平均模糊效用项集挖掘算法
- 2
-
-
作者
王斌
李晓华
周伟
胡克勇
-
机构
青岛理工大学信息与控制工程学院
-
出处
《计算机工程与设计》
北大核心
2024年第5期1398-1405,共8页
-
基金
国家自然科学基金项目(61902205)。
-
文摘
为解决高模糊效用项集挖掘算法中存在的挖掘结果中含有大量无效的长项集以及搜索空间过大的问题,提出一种高平均模糊效用项集挖掘算法HAFUIM(high average fuzzy utility itemset mining algorithm)。定义平均模糊效用,考虑项集的模糊效用和长度的关系,解决倾向于挖掘长项集的问题;提出平均模糊上限模型和4种剪枝性质,缩小搜索空间;设计平均模糊列表结构用于存储必要的效用信息,减少数据库扫描次数。通过仿真实验验证了所提算法的可行性和高效性。
-
关键词
数据挖掘
项集挖掘
高模糊效用
平均模糊效用
平均模糊上限模型
平均模糊列表
剪枝策略
-
Keywords
data mining
itemset mining
high fuzzy utility
average fuzzy utility
average fuzzy upper bound model
average utility list
pruning strategy
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名衍生高效用模式挖掘算法综述
- 3
-
-
作者
刘淑娟
韩萌
高智慧
穆栋梁
李昂
-
机构
北方民族大学计算机科学与工程学院
-
出处
《燕山大学学报》
CAS
北大核心
2024年第2期138-156,共19页
-
基金
国家自然科学基金资助项目(62062004)
宁夏自然科学基金资助项目(2022AAC03279)。
-
文摘
在数据挖掘领域中,高效用模式挖掘任务具有较高的理论研究价值和广泛的实际应用场景。针对多变的应用场合,提出了一系列衍生高效用模式。首先从关键技术的角度对高平均效用模式挖掘算法进行了分类论述,主要包括基于先验、基于树、基于列表、基于投影和基于数据格式的方法。其次,分析讨论了基于全集、精简集以及融合模式的含有负效用的高效用模式挖掘算法。再次,从模糊高效用模式、相关高效用模式和其他新兴高效用模式三个方面概述和总结了扩展高效用模式算法。最后,针对现阶段研究方向的不足,给出下一步的研究方向。
-
关键词
衍生高效用模式
高平均效用模式
负效用
模糊高效用模式
相关高效用模式
综述
-
Keywords
derived high utility pattern
high average utility pattern
negative utility
fuzzy high utility pattern
correlated high utility pattern
survey
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-