期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
一种快速的高效用序列模式挖掘算法
1
作者 张瑞华 韩萌 +2 位作者 何菲菲 孟凡兴 李春鹏 《燕山大学学报》 北大核心 2025年第4期349-366,共18页
高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与... 高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与空间消耗成本过高的问题,提出了一种紧凑的效用索引列表结构,用于存储挖掘过程中序列的效用与位置等信息,基于该结构设计了一种快速的高效用序列模式挖掘算法。为了进一步提高算法的挖掘效率,提出了一种新的序列效用计算上界,用于缩减搜索空间。在真实和合成数据集上的大量实验表明,本文设计的算法在时间、内存、搜索空间缩减和可扩展性方面均优于目前先进算法。 展开更多
关键词 模式挖掘 效用序列模式 序列分析 效用挖掘 效用索引列表
在线阅读 下载PDF
非冗余统计显著判别高效用模式挖掘算法
2
作者 吴军 欧阳艾嘉 王亚 《计算机应用》 北大核心 2025年第8期2572-2581,共10页
针对高效用模式挖掘任务中假阳性模式和冗余模式的判别问题,提出一种基于无限制检验和独立成长率的判别高效用模式挖掘算法UTDHU(Unlimited Testing for Discriminative High Utility pattern mining)。首先,找到目标事务集合中满足效... 针对高效用模式挖掘任务中假阳性模式和冗余模式的判别问题,提出一种基于无限制检验和独立成长率的判别高效用模式挖掘算法UTDHU(Unlimited Testing for Discriminative High Utility pattern mining)。首先,找到目标事务集合中满足效用阈值和差异阈值的判别高效用模式;其次,建立前缀项共享树以快速计算每个模式的独立成长率,并基于独立成长率筛除未超过独立阈值的冗余判别高效用模式;最后,使用无限制检验计算余下每个模式的统计显著性度量p值,并根据错误率判断族过滤整体结果中的假阳性判别高效用模式。在4个基准事务集合和2个仿真事务集合上的实验结果表明,相较于Hamm和YBHU(Yekutieli-Benjamini resampling for High Utility pattern mining)等算法,所提算法在模式数量方面输出最少,过滤了至少97.8%的被检验模式;在模式质量方面,所提算法的假阳性判别高效用模式占比低于5.2%,且构造特征的分类准确率高于对比算法至少1.5个百分点;虽然所提算法在运行时间方面慢于Hamm算法,但快于其余3个基于统计显著性检验的算法。可见,所提算法能够有效剔除一定数量的假阳性和冗余判别高效用模式,在挖掘性能上更优,且运行效率更高。 展开更多
关键词 数据挖掘 判别高效用模式挖掘 模式评估 假阳性模式过滤 冗余模式筛除
在线阅读 下载PDF
一种有效的周期高效用序列模式增量挖掘算法 被引量:2
3
作者 荀亚玲 任姿芊 闫海博 《计算机应用研究》 CSCD 北大核心 2024年第8期2301-2308,共8页
周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,... 周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,有效地实现了周期高效用序列模式(PHUSPs)的增量挖掘。IncPUS-Miner引入了一种名为pu-tree的新型数据结构,每个树节点对应一个更新效用列表(UUL)用于存储相应序列的辅助信息,当有增量数据加入时,该结构使得项目信息能够灵活更新,从而增强了算法的动态适应性和可扩展性。此外,还提出了两种新的序列效用上界PUB和EUB,以及两种相应的剪枝策略,有效地减少了计算负担。实验结果表明,在真实数据集上,IncPUS-Miner算法可以有效地增量挖掘PHUSPs,与其他算法相比,在运行效率和内存消耗上展现出了优越的性能。 展开更多
关键词 增量挖掘 效用序列模式 周期序列模式 序列模式挖掘
在线阅读 下载PDF
基于滑动窗口含负项的高效用模式挖掘
4
作者 武妍 荀亚玲 马煜 《计算机工程与设计》 北大核心 2024年第3期845-851,共7页
针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有... 针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有效的逐批次挖掘,避免重复的数据库扫描,在不产生候选效用模式集的情况下,直接挖掘出高效用模式,使HUPN_SW有效适应于动态流数据。实验结果表明,HUPN_SW算法在运行时间和可扩展性方面有良好表现。 展开更多
关键词 频繁模式挖掘 滑动窗口 效用模式挖掘 效用项集 效用 流数据 效用列表
在线阅读 下载PDF
衍生高效用模式挖掘算法综述 被引量:1
5
作者 刘淑娟 韩萌 +2 位作者 高智慧 穆栋梁 李昂 《燕山大学学报》 CAS 北大核心 2024年第2期138-156,共19页
在数据挖掘领域中,高效用模式挖掘任务具有较高的理论研究价值和广泛的实际应用场景。针对多变的应用场合,提出了一系列衍生高效用模式。首先从关键技术的角度对高平均效用模式挖掘算法进行了分类论述,主要包括基于先验、基于树、基于... 在数据挖掘领域中,高效用模式挖掘任务具有较高的理论研究价值和广泛的实际应用场景。针对多变的应用场合,提出了一系列衍生高效用模式。首先从关键技术的角度对高平均效用模式挖掘算法进行了分类论述,主要包括基于先验、基于树、基于列表、基于投影和基于数据格式的方法。其次,分析讨论了基于全集、精简集以及融合模式的含有负效用的高效用模式挖掘算法。再次,从模糊高效用模式、相关高效用模式和其他新兴高效用模式三个方面概述和总结了扩展高效用模式算法。最后,针对现阶段研究方向的不足,给出下一步的研究方向。 展开更多
关键词 衍生高效用模式 高平均效用模式 效用 模糊高效用模式 相关高效用模式 综述
在线阅读 下载PDF
空间高效用Co-location模式挖掘技术初探 被引量:9
6
作者 杨世晟 王丽珍 +1 位作者 芦俊丽 高源 《小型微型计算机系统》 CSCD 北大核心 2014年第10期2302-2307,共6页
空间Co-location模式是一个空间特征集,集合中各个特征的实例在邻近区域内频繁并发出现.在经典的频繁模式挖掘研究中,最近的突破之一是将效用概念作为新的兴趣度量,它允许事务中同一个项可以有多个实例出现且不同的项可以具有不同价值.... 空间Co-location模式是一个空间特征集,集合中各个特征的实例在邻近区域内频繁并发出现.在经典的频繁模式挖掘研究中,最近的突破之一是将效用概念作为新的兴趣度量,它允许事务中同一个项可以有多个实例出现且不同的项可以具有不同价值.本文将效用概念引入到空间Co-location模式挖掘中,定义了模式效用、模式效用率等概念,提出一种基础算法挖掘空间高效用Co-location模式.接着定义了扩展模式效用,并根据它的反单调性提出一种剪枝策略:完全剪枝算法,加快了空间高效用Co-location模式的产生.最后通过大量实验来说明完全剪枝算法的效果和效率. 展开更多
关键词 效用模式挖掘 空间Co—location模式 完全剪枝算法 模式效用
在线阅读 下载PDF
基于模式增长方式的高效用模式挖掘算法 被引量:10
7
作者 王乐 熊松泉 +1 位作者 常艳芬 王水 《自动化学报》 EI CSCD 北大核心 2015年第9期1616-1626,共11页
高效用模式挖掘是数据挖掘领域的一个重要研究内容;由于其计算过程包含对模式的内、外效用值的处理,计算复杂度较大,因此挖掘算法的主要研究热点问题就是提高算法的时间效率.针对此问题,本文给出一个基于模式增长方式的高效用模式挖掘算... 高效用模式挖掘是数据挖掘领域的一个重要研究内容;由于其计算过程包含对模式的内、外效用值的处理,计算复杂度较大,因此挖掘算法的主要研究热点问题就是提高算法的时间效率.针对此问题,本文给出一个基于模式增长方式的高效用模式挖掘算法HUPM-FP,该算法可以从全局树上挖掘高效用模式,避免产生候选项集.实验中,采用6个典型数据集进行实验,并和目前效率较好的算法FHM(Faster high-utility itemset mining)做了对比,实验结果表明本文给出的算法时空效率都有较大的提高,特别是时间效率提高较大,可以达到1个数量级以上. 展开更多
关键词 效用模式 频繁模式 频繁项集 数据挖掘
在线阅读 下载PDF
基于MapReduce的top-k高效用模式挖掘算法 被引量:7
8
作者 吴倩 王林平 +2 位作者 罗相洲 崔建群 王海 《计算机应用研究》 CSCD 北大核心 2017年第10期2897-2900,2932,共5页
高效用模式挖掘被广泛地应用于数据挖掘领域。为了挖掘指定数量的高效用模式,一些基于树结构和效用表结构的top-k高效用挖掘算法被提出,但前者在挖掘过程中产生了大量候选模式,后者在效用模式增长时需要进行多次比较;同时,由于在信息社... 高效用模式挖掘被广泛地应用于数据挖掘领域。为了挖掘指定数量的高效用模式,一些基于树结构和效用表结构的top-k高效用挖掘算法被提出,但前者在挖掘过程中产生了大量候选模式,后者在效用模式增长时需要进行多次比较;同时,由于在信息社会,数据量呈爆炸性增长,所以在数据集过大的情况下,挖掘高效用模式需以大量存储空间以及计算开销为代价。为了解决这两个问题,基于MapReduce的top-k高效用模式挖掘算法(TKHUP_MaR)被提出。该算法通过两次扫描数据库,利用三次MapReduce来实现并行top-k高效用模式的挖掘。通过实验表明TKHUP_MaR算法在并行挖掘top-k高效用模式的过程中是有效的。 展开更多
关键词 数据挖掘 TOP-K 效用模式 MAPREDUCE 并行算法
在线阅读 下载PDF
不产生候选项集的TOP-K高效用模式挖掘算法 被引量:9
9
作者 王乐 冯林 王水 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期445-455,共11页
目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候... 目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候选项集的挖掘算法TOPKHUP;HUPTree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保持平稳. 展开更多
关键词 效用模式 频繁模式 频繁项集 数据挖掘 TOP—K
在线阅读 下载PDF
一种快速挖掘top-k高效用模式的算法 被引量:5
10
作者 吴倩 王林平 +2 位作者 罗相洲 崔建群 王海 《计算机应用研究》 CSCD 北大核心 2017年第11期3303-3307,共5页
高效用模式挖掘是数据挖掘领域的一个基础研究方向,其中关于top-k高效用模式的挖掘算法也越来越多,k指的是用户需要挖掘的高效用模式的个数。它们可以归纳为二阶段top-k算法和一阶段top-k算法两类,两者的主要区别是,前者在挖掘的过程中... 高效用模式挖掘是数据挖掘领域的一个基础研究方向,其中关于top-k高效用模式的挖掘算法也越来越多,k指的是用户需要挖掘的高效用模式的个数。它们可以归纳为二阶段top-k算法和一阶段top-k算法两类,两者的主要区别是,前者在挖掘的过程中会产生大量的候选模式,这是影响算法性能的主要因素;后者在挖掘的过程中不产生候选模式。为了更加高效地挖掘效用值最高的k个模式,一阶段算法TKHUP被提出,该算法在进行数据挖掘的过程中主要是通过四个有效策略来减少时间和空间的消耗。通过大量的实验数据表明,TKHUP在时间性能上优于其他top-k高效用模式挖掘算法。 展开更多
关键词 效用模式 top-k模式挖掘 效用挖掘 数据挖掘
在线阅读 下载PDF
一种频率约束的高效用模式挖掘算法 被引量:1
11
作者 张全贵 曹阳 李志强 《计算机应用与软件》 北大核心 2018年第11期266-271,共6页
现有的高效用模式挖掘将效用作为唯一指标,可能会导致挖掘出来的模式是低频的,这样往往满足不了实际的需求。因此,兼顾频率的高效用模式挖掘具有较强的应用价值。针对此问题,提出频率约束的高效用模式挖掘算法UFCP-Miner。算法将项集在... 现有的高效用模式挖掘将效用作为唯一指标,可能会导致挖掘出来的模式是低频的,这样往往满足不了实际的需求。因此,兼顾频率的高效用模式挖掘具有较强的应用价值。针对此问题,提出频率约束的高效用模式挖掘算法UFCP-Miner。算法将项集在整个数据库中出现的频率考虑进高效用模式挖掘中,重新定义了高效用模式,并提出新的交易权重效用值的概念。采用四个典型数据集对算法的性能进行测试,结果表明该算法能够有效地识别出特定的高效用模式,并且有很好的可扩展性。 展开更多
关键词 频率约束 效用模式 模式挖掘
在线阅读 下载PDF
基于多效用阈值的分布式高效用序列模式挖掘 被引量:1
12
作者 曾毅 张福泉 《计算机工程与设计》 北大核心 2020年第2期449-457,共9页
针对序列模式的高效用模式挖掘过程中搜索空间大、计算复杂度高的问题,提出一种基于多效用阈值的分布式高效用序列模式挖掘算法。采用数组结构保存模式的效用信息,解决效用矩阵导致的内存消耗大的缺点。设计1-项集与2-项集的深度剪枝策... 针对序列模式的高效用模式挖掘过程中搜索空间大、计算复杂度高的问题,提出一种基于多效用阈值的分布式高效用序列模式挖掘算法。采用数组结构保存模式的效用信息,解决效用矩阵导致的内存消耗大的缺点。设计1-项集与2-项集的深度剪枝策略,深入地缩小候选模式的搜索空间,减少搜索时间成本与缓存成本。提出挖掘算法的分布式实现方案,通过并行处理进一步降低模式挖掘的时间。基于中等规模与大规模的序列数据集分别进行实验,实验结果表明,该算法有效减少了候选模式的数量,降低了挖掘的时间成本与存储成本,对于大数据集表现出较好的可扩展能力与稳定性。 展开更多
关键词 序列模式 大数据 效用模式挖掘 分布式计算 频繁项集 剪枝策略
在线阅读 下载PDF
基于聚类划分的高效用模式并行挖掘算法 被引量:25
13
作者 邢淑凝 刘方爱 赵晓晖 《计算机应用》 CSCD 北大核心 2016年第8期2202-2206,2212,共6页
针对在大规模数据库中挖掘高效用模式产生大量基于内存的效用模式树,从而导致内存空间占用较大以及丢失一些高效用项集的问题,提出在Hadoop分布式计算平台下的基于聚类划分的高效用模式并行挖掘算法PUCP。首先,采用聚类的方法把数据库... 针对在大规模数据库中挖掘高效用模式产生大量基于内存的效用模式树,从而导致内存空间占用较大以及丢失一些高效用项集的问题,提出在Hadoop分布式计算平台下的基于聚类划分的高效用模式并行挖掘算法PUCP。首先,采用聚类的方法把数据库中相似的事务划分为若干数据子集;然后,把若干划分好的数据子集分配到Hadoop平台的各个节点中构造效用模式树;最后,把各个节点中相同项的条件模式基分配到同一个节点中进行挖掘,以减少各个节点交叉操作的次数。通过实验结果和理论分析表明:PUCP算法在不影响挖掘结果可靠性的前提下,与主流串行高效用模式挖掘——效用模式增长挖掘算法(UP-Growth)和现有的并行高效用模式挖掘算法PHUI-Growth相比,挖掘效率分别提高了61.2%和16.6%;并且使用了Hadoop计算平台,能有效缓解挖掘大规模数据的内存压力。 展开更多
关键词 大数据 效用模式挖掘 聚类 并行计算 HADOOP
在线阅读 下载PDF
价值创新战略:基于组织学习矩阵影响的效用模式分析
14
作者 张韬 《企业活力》 2009年第11期82-85,共4页
运用组织学习矩阵,构筑了组织学习对企业价值创新的影响模式,指出单环学习是组织价值创新的重要基础,双环学习是实施组织价值创新的重要手段,混合学习通过促进学习来保证组织价值创新得以实现,最终揭示出单一的学习方式并不能保证企业... 运用组织学习矩阵,构筑了组织学习对企业价值创新的影响模式,指出单环学习是组织价值创新的重要基础,双环学习是实施组织价值创新的重要手段,混合学习通过促进学习来保证组织价值创新得以实现,最终揭示出单一的学习方式并不能保证企业获得持续竞争优势,只有采用与环境特性适配的战略学习组合才是企业基业常青之道。 展开更多
关键词 组织学习矩阵 价值创新战略 效用模式
在线阅读 下载PDF
基于效用模式树的高效用频繁模式挖掘算法 被引量:3
15
作者 王晨 杜义华 +1 位作者 卢景秀 李新 《计算机应用》 CSCD 北大核心 2013年第A02期111-115,141,共6页
为了提高效用模式挖掘的效率,提出了一种基于效用模式树的两阶段效用模式挖掘算法。在第一阶段,该算法能够对全局非候选节点进行合理的舍弃,并能降低全局效用模式树中节点的估计效用。通过效用模式增长算法,递归地生成候选高效用项集。... 为了提高效用模式挖掘的效率,提出了一种基于效用模式树的两阶段效用模式挖掘算法。在第一阶段,该算法能够对全局非候选节点进行合理的舍弃,并能降低全局效用模式树中节点的估计效用。通过效用模式增长算法,递归地生成候选高效用项集。在第二阶段,通过扫描调整后的事务数据库,缩小第二阶段的搜索空间。实验表明,该算法能够减少候选集的数量,提高高效用项集的生成效率。 展开更多
关键词 效用挖掘 频繁模式 效用模式 估计效用 数据挖掘
在线阅读 下载PDF
动态数据上的高效用模式挖掘综述 被引量:6
16
作者 单芝慧 韩萌 韩强 《计算机应用》 CSCD 北大核心 2022年第1期94-108,共15页
高效用模式挖掘(HUPM)考虑了项的购买数量及单位利润,提供了项更详细的信息,使用户能够做出更好的经济决策。针对大多数HUPM算法都应用在与不断产生数据的现实世界不符的静态数据集上的问题,近些年不断提出了动态数据上的HUPM算法。首先... 高效用模式挖掘(HUPM)考虑了项的购买数量及单位利润,提供了项更详细的信息,使用户能够做出更好的经济决策。针对大多数HUPM算法都应用在与不断产生数据的现实世界不符的静态数据集上的问题,近些年不断提出了动态数据上的HUPM算法。首先,对增量数据、数据流、动态删除和动态修改数据上的HUPM算法以及融合高效用模式(高效用序列模式、平均高效用模式、top-k高效用模式等)挖掘算法进行了总结;然后,对使用不同类型数据的算法进行了总结,包括动态利润数据、动态序列数据等数据类型;其次,从算法使用的数据结构、剪枝策略、窗口模型、优缺点等角度对HUPM算法进行分类总结;最后,针对目前研究的不足,提出了下一步动态数据上的HUPM算法研究方向。 展开更多
关键词 效用模式 增量数据 数据流 动态删除 动态修改 动态数据
在线阅读 下载PDF
精简高效用模式挖掘综述 被引量:3
17
作者 孙蕊 韩萌 +2 位作者 张春砚 申明尧 杜诗语 《计算机应用研究》 CSCD 北大核心 2021年第4期975-981,共7页
全集高效用模式挖掘算法存在的关键问题之一是会产生冗余的高效用项集,这将导致用户很难在大量的高效用项集中发现有用的信息,严重降低了高效用模式挖掘算法的性能。为解决这一问题,衍生出了精简高效用模式挖掘算法,其主要包括最大高效... 全集高效用模式挖掘算法存在的关键问题之一是会产生冗余的高效用项集,这将导致用户很难在大量的高效用项集中发现有用的信息,严重降低了高效用模式挖掘算法的性能。为解决这一问题,衍生出了精简高效用模式挖掘算法,其主要包括最大高效用模式、闭合高效用模式、top-k高效用模式以及三者之间的组合高效用模式挖掘算法等。首先,介绍了精简高效用模式的相关问题描述;然后,从有无候选项集生成、一两阶段挖掘方法、数据结构类型和剪枝策略等角度,重点分类总结了精简高效用模式挖掘方法;最后,给出了精简高效用模式的进一步研究方向,包括处理基于负项的高效用精简模式、处理基于时间的高效用精简模式及处理动态复杂的数据等。 展开更多
关键词 精简高效用模式挖掘 最大高效用模式 闭合高效用模式 top-k高效用模式
在线阅读 下载PDF
含负项的高效用序列模式挖掘算法 被引量:4
18
作者 吕存伟 黄德才 陆亿红 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1724-1729,共6页
高效用模式挖掘在现实中有广泛的应用,也是数据挖掘研究的热点.数据库中的事务在以序列形式存在的情况下,又引申出高效用序列模式挖掘问题.序列模式的搜索空间比一般模式的大,所以计算复杂度比高效用模式挖掘大.目前对高效用序列模式算... 高效用模式挖掘在现实中有广泛的应用,也是数据挖掘研究的热点.数据库中的事务在以序列形式存在的情况下,又引申出高效用序列模式挖掘问题.序列模式的搜索空间比一般模式的大,所以计算复杂度比高效用模式挖掘大.目前对高效用序列模式算法研究比较少,且都没有考虑序列数据库中项的外部效用值为负的情况.面对含负项的外部效用值,首次提出了含负项的高效用序列模式挖掘算法EHUSN,该算法提出1-2-UM和2-2-UM结构模型,结合效用信息列表能快速剪枝非候选序列,从而使挖掘算法在时空效率上的得到提升. 展开更多
关键词 序列模式挖掘 效用序列模式挖掘 模式挖掘
在线阅读 下载PDF
面向复杂高效用模式的挖掘算法综述 被引量:2
19
作者 李慕航 韩萌 +2 位作者 陈志强 武红鑫 张喜龙 《广西师范大学学报(自然科学版)》 CAS 北大核心 2022年第3期13-30,共18页
复杂高效用模式挖掘是当前研究的一个新兴主题。本文首次从高效用融合模式和衍生模式2个角度进行讨论。首先,对于融合模式,根据数据结构的不同对高效用序列模式进行分类论述;按照时间顺序对高效用片段模式、周期高效用模式进行概述。针... 复杂高效用模式挖掘是当前研究的一个新兴主题。本文首次从高效用融合模式和衍生模式2个角度进行讨论。首先,对于融合模式,根据数据结构的不同对高效用序列模式进行分类论述;按照时间顺序对高效用片段模式、周期高效用模式进行概述。针对衍生模式,从数据结构角度对高平均效用模式、带有负项的高效用模式、on-shelf高效用模式进行总结;从精简类型角度概述精简高效用模式,并对现有融合模式和衍生模式挖掘算法的优缺点、上边界等进行对比分析。最后,针对现阶段研究缺陷与不足,给出了下一步研究方向,包括不确定数据中的高效用模式挖掘方法、数据流上的高效用on-shelf模式挖掘方法和大数据环境下的并行高效用模式挖掘方法。 展开更多
关键词 综述 模式挖掘 复杂高效用模式 效用融合模式 效用衍生模式
在线阅读 下载PDF
数据流高效用模式挖掘综述 被引量:5
20
作者 王少峰 韩萌 +2 位作者 贾涛 张春砚 孙蕊 《计算机应用研究》 CSCD 北大核心 2020年第9期2571-2578,共8页
数据流高效用模式挖掘方法是以二进制的频繁模式挖掘方法为前提,引入项的内部效用和外部效用,在模式挖掘过程中可以考虑项的重要性,从而挖掘更有价值的模式。从关键窗口技术、常用方法、表示形式等角度对数据流高效用模式挖掘方法进行... 数据流高效用模式挖掘方法是以二进制的频繁模式挖掘方法为前提,引入项的内部效用和外部效用,在模式挖掘过程中可以考虑项的重要性,从而挖掘更有价值的模式。从关键窗口技术、常用方法、表示形式等角度对数据流高效用模式挖掘方法进行分析并总结其相关算法,从而研究其特点、优势、劣势以及其关键问题所在。具体来说,说明了数据流高效用模式常用的概念;对处理数据流高效用模式的关键窗口技术进行了分析,涉及到滑动、衰减、界标和倾斜窗口模型;研究了一阶段和两阶段的数据流高效用模式挖掘方法;分析了高效用模式的表示形式,即完全高效用模式和压缩高效用模式;介绍了其他的数据流高效用模式,包括序列高效用模式、混合高效用模式以及高平均效用模式等;最后展望了数据流高效用模式挖掘的进一步研究方向。 展开更多
关键词 数据流挖掘 效用模式 窗口模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部