题名 基于滑动窗口含负项的高效用模式挖掘
1
作者
武妍
荀亚玲
马煜
机构
太原科技大学经济与管理学院
太原科技大学计算机科学与技术学院
出处
《计算机工程与设计》
北大核心
2024年第3期845-851,共7页
基金
国家自然科学基金项目(62272336)
山西省自然科学基金项目(201901D211302)。
文摘
针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有效的逐批次挖掘,避免重复的数据库扫描,在不产生候选效用模式集的情况下,直接挖掘出高效用模式,使HUPN_SW有效适应于动态流数据。实验结果表明,HUPN_SW算法在运行时间和可扩展性方面有良好表现。
关键词
频繁模式挖掘
滑动窗口
高效用 模式挖掘
高效用 项集
负效用
流数据
效用列表
Keywords
frequent pattern mining
sliding window
high utility pattern mining
high utility itemsets
negative utility
strea-ming data
utility list
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 数据流上的约束跨层级高效用项集挖掘
2
作者
刘淑娟
韩萌
高智慧
穆栋梁
李昂
机构
北方民族大学计算机科学与工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2024年第13期287-300,共14页
基金
国家自然科学基金(62062004)
宁夏自然科学基金(2022AAC03279)。
文摘
传统的高效用项集挖掘算法无法发现不同抽象层级类别之间的关系。因此,有研究者提出了跨层级的高效用项集挖掘算法。针对当前跨层级的高效用项集挖掘算法仅能处理静态数据并且无法控制挖掘层级范围的问题,提出了一种动态类别列表结构DTUL存储并维护窗口内的项集效用和类别信息。基于此结构,首次提出了基于滑动窗口的约束跨层级高效用项集挖掘算法,包括自下而上挖掘的CCLHM_DTU算法和自上而下挖掘的CCLHM_UTD算法。在含有类别信息的数据集上进行了大量实验,实验结果表明提出的算法能够有效处理数据流并灵活约束项集的层级范围。
关键词
高效用 项集挖掘
跨层级高效用 项集
数据流
滑动窗口
效用列表
Keywords
high utility itemsets mining
cross-level high utility itemset
data stream
sliding window
utility list
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于滑动窗口模型的数据流闭合高效用项集挖掘
被引量:17
3
作者
程浩东
韩萌
张妮
李小娟
王乐
机构
北方民族大学计算机科学与工程学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2021年第11期2500-2514,共15页
基金
国家自然科学基金项目(62062004)
宁夏自然科学基金项目(2020AAC03216)
北方民族大学研究生创新项目(YCX20077)。
文摘
从数据流中挖掘高效用项集是一项具有挑战性的任务,因为传入的数据必须在时间和存储内存约束下进行实时处理.数据流挖掘通常会产生大量冗余的项集,为了减少这些无用的项集数量且保证无损压缩,需要挖掘闭合项集,它可以比全集高效用项集的集合小几个数量级.为了解决以上问题,提出一种基于滑动窗口模型的数据流闭合高效用项集挖掘(closed high utility itemsets mining over data stream based on sliding window model,CHUI_DS)算法.在CHUI_DS中设计了一种新的效用列表结构,该结构在提升批次插入和删除的速度方面非常有效.此外,应用修剪策略来改进闭合项集挖掘过程,消除潜在的低效用候选对象.对真实数据集和合成数据集进行的广泛实验评估显示了该算法的效率以及可行性.就速度而言,它优于先前提出的主要以批处理模式运行的算法.且它适用于不同大小的滑动窗口,在事务数量等方面具有较强的扩展性.
关键词
模式挖掘
数据流挖掘
闭合高效用 项集
滑动窗口
效用列表
Keywords
pattern mining
data stream mining
closed high utility itemsets
sliding window
utility list
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于滑动窗口的数据流高效用模糊项集挖掘
被引量:1
4
作者
单芝慧
韩萌
韩强
机构
北方民族大学计算机科学与工程学院
北方民族大学图像图形智能处理国家民委重点实验室
出处
《南京师大学报(自然科学版)》
CAS
北大核心
2023年第1期120-129,共10页
基金
国家自然科学基金项目(62062004、61862001)
宁夏自然科学基金项目(2020AAC03216)。
文摘
高效用项集挖掘可以提供有趣的结果集,但并不能提供单个项的数量,因此,本文提出了高效用模糊项集.但是,现实世界的数据是不断出现的,需要实时处理新到来的数据.为解决当前高效用模糊项集不能处理数据流的问题,又提出了模糊效用列表(fuzzy utility list,FUL)结构用于存储当前窗口中项的批次号、项在事务中的事务标识符、项的模糊效用以及项的剩余模糊效用,该结构能有效的对批次进行插入和删除操作.最后,基于FUL提出了数据流高效用模糊项集挖掘算法.对真实数据集和合成数据集进行了广泛的实验,结果证实了算法的效率及可行性.
关键词
数据流挖掘
滑动窗口
高效用 项集挖掘
模糊效用
效用列表
Keywords
data stream mining
sliding window
high utility itemsets mining
fuzzy utility
utility list
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 增量数据上的闭合定量高效用项集挖掘算法
被引量:1
5
作者
单芝慧
韩萌
韩强
机构
北方民族大学计算机科学与工程学院
出处
《计算机应用》
CSCD
北大核心
2023年第7期2049-2056,共8页
基金
国家自然科学基金资助项目(62062004,61862001)
宁夏自然科学基金资助项目(2020AAC03216)。
文摘
高效用项集(HUI)挖掘能够提供数据集中高利润的项的组合信息,有利于在现实应用中制定有效的营销策略。然而,HUI仅提供项集及其总效用,不提供单个项的购买数量,而现实场景中项的数量能提供更精准的信息。因此,研究者提出定量高效用项集(HUQI)挖掘算法。针对当前的HUQI挖掘算法仅能处理静态数据且存在结果集冗余的问题,提出增量更新的定量效用列表结构来存储并更新数据集中项的效用信息,并基于该结构提出一种挖掘闭合定量高效用项集(CHUQI)的算法。将所提出的算法与FHUQI-Miner(Faster High Utility Quantitative Itemset Miner)算法在结果集数量、最小效用阈值、批次数目以及可扩展性上对比时间与内存消耗。实验结果表明,所提算法能够有效处理增量数据,挖掘出更有趣的项集。
关键词
增量挖掘
高效用 项集
定量高效用 项集
闭合高效用 项集
效用列表
Keywords
incremental mining
High Utility Itemset(HUI)
High Utility Quantitative Itemset(HUQI)
Closed High Utility Itemset(CHUI)
utility list
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 Top-k高模糊效用项集挖掘算法
被引量:1
6
作者
王斌
周伟
李晓华
胡克勇
机构
青岛理工大学信息与控制工程学院
出处
《计算机工程与设计》
北大核心
2023年第11期3312-3319,共8页
基金
国家自然科学基金项目(61902205)。
文摘
针对高模糊效用项集挖掘算法中存在的阈值选择难题,提出一种Top-k高模糊效用项集挖掘算法TKHFU(top-k high fuzzy utility itemset mining)。将高模糊效用项集挖掘算法中设定阈值的问题转化为设定所需高模糊效用项集数量k的问题。提出模糊项集效用列表结构,有效保存事务数据库中的关键信息,避免项集间复杂的连接操作。提出一种更紧密的模糊效用上界和两种剪枝策略,将剪枝策略运用至列表中,减少搜索空间。实验结果表明,该算法在运行时间、内存消耗及可伸缩性方面均优于最新算法。
关键词
数据挖掘
项集挖掘
阈值
高模糊效用
效用列表
模糊效用 上界
剪枝策略
Keywords
data mining
itemsets mining
threshold value
high fuzzy utility
utility list
fuzzy utility upper bound
pruning strategy
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 一种快速的高效用序列模式挖掘算法
7
作者
张瑞华
韩萌
何菲菲
孟凡兴
李春鹏
机构
北方民族大学计算机科学与工程学院
出处
《燕山大学学报》
2025年第4期349-366,共18页
基金
国家自然科学基金资助项目(62062004)
宁夏自然科学基金资助项目(2023AAC03315)
+1 种基金
北方民族大学中央高校基本科研业务费专项资金资助项目(2021KJCX10)
北方民族大学研究生创新项目(YCX24120)。
文摘
高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与空间消耗成本过高的问题,提出了一种紧凑的效用索引列表结构,用于存储挖掘过程中序列的效用与位置等信息,基于该结构设计了一种快速的高效用序列模式挖掘算法。为了进一步提高算法的挖掘效率,提出了一种新的序列效用计算上界,用于缩减搜索空间。在真实和合成数据集上的大量实验表明,本文设计的算法在时间、内存、搜索空间缩减和可扩展性方面均优于目前先进算法。
关键词
模式挖掘
高效用 序列模式
序列分析
效用 挖掘
效用 索引列表
Keywords
pattern mining
high utility sequential patterns
sequence analysis
utility-oriented mining
utility index list
分类号
TP311.13
[自动化与计算机技术]