期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于MapReduce的top-k高效用模式挖掘算法 被引量:7
1
作者 吴倩 王林平 +2 位作者 罗相洲 崔建群 王海 《计算机应用研究》 CSCD 北大核心 2017年第10期2897-2900,2932,共5页
高效用模式挖掘被广泛地应用于数据挖掘领域。为了挖掘指定数量的高效用模式,一些基于树结构和效用表结构的top-k高效用挖掘算法被提出,但前者在挖掘过程中产生了大量候选模式,后者在效用模式增长时需要进行多次比较;同时,由于在信息社... 高效用模式挖掘被广泛地应用于数据挖掘领域。为了挖掘指定数量的高效用模式,一些基于树结构和效用表结构的top-k高效用挖掘算法被提出,但前者在挖掘过程中产生了大量候选模式,后者在效用模式增长时需要进行多次比较;同时,由于在信息社会,数据量呈爆炸性增长,所以在数据集过大的情况下,挖掘高效用模式需以大量存储空间以及计算开销为代价。为了解决这两个问题,基于MapReduce的top-k高效用模式挖掘算法(TKHUP_MaR)被提出。该算法通过两次扫描数据库,利用三次MapReduce来实现并行top-k高效用模式的挖掘。通过实验表明TKHUP_MaR算法在并行挖掘top-k高效用模式的过程中是有效的。 展开更多
关键词 数据挖掘 top-k 效用模式 MAPREDUCE 并行算法
在线阅读 下载PDF
一种快速挖掘top-k高效用模式的算法 被引量:5
2
作者 吴倩 王林平 +2 位作者 罗相洲 崔建群 王海 《计算机应用研究》 CSCD 北大核心 2017年第11期3303-3307,共5页
高效用模式挖掘是数据挖掘领域的一个基础研究方向,其中关于top-k高效用模式的挖掘算法也越来越多,k指的是用户需要挖掘的高效用模式的个数。它们可以归纳为二阶段top-k算法和一阶段top-k算法两类,两者的主要区别是,前者在挖掘的过程中... 高效用模式挖掘是数据挖掘领域的一个基础研究方向,其中关于top-k高效用模式的挖掘算法也越来越多,k指的是用户需要挖掘的高效用模式的个数。它们可以归纳为二阶段top-k算法和一阶段top-k算法两类,两者的主要区别是,前者在挖掘的过程中会产生大量的候选模式,这是影响算法性能的主要因素;后者在挖掘的过程中不产生候选模式。为了更加高效地挖掘效用值最高的k个模式,一阶段算法TKHUP被提出,该算法在进行数据挖掘的过程中主要是通过四个有效策略来减少时间和空间的消耗。通过大量的实验数据表明,TKHUP在时间性能上优于其他top-k高效用模式挖掘算法。 展开更多
关键词 效用模式 top-k模式挖掘 效用挖掘 数据挖掘
在线阅读 下载PDF
动态数据库中增量Top-k高效用模式挖掘算法 被引量:6
3
作者 吴倩 王林平 +1 位作者 罗相洲 崔建群 《计算机应用研究》 CSCD 北大核心 2017年第5期1401-1405,共5页
高效用模式的挖掘需要设定一个合适的阈值,而阈值设定对用户来说并非易事,阈值过小导致产生大量低效用模式,阈值过大可能导致无高效用模式生成。因而Top-k高效用模式挖掘方法被提出,k指效用值前k大的模式。并且大量的高效用挖掘研究仅... 高效用模式的挖掘需要设定一个合适的阈值,而阈值设定对用户来说并非易事,阈值过小导致产生大量低效用模式,阈值过大可能导致无高效用模式生成。因而Top-k高效用模式挖掘方法被提出,k指效用值前k大的模式。并且大量的高效用挖掘研究仅针对静态数据库,但在实际应用中常常会遇到新事务的加入的情况。针对以上问题,提出了增量的Top-k高效用挖掘算法TOPK-HUP-INS。算法通过四个有效的策略,在增量数据的情况下,有效地挖掘用户所需数量的高效用模式。通过在不同数据集上的对比实验表明TOPK-HUP-INS算法在时空性能上表现优异。 展开更多
关键词 增量挖掘 效用挖掘 top-k模式挖掘 动态数据库
在线阅读 下载PDF
不产生候选项集的TOP-K高效用模式挖掘算法 被引量:9
4
作者 王乐 冯林 王水 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期445-455,共11页
目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候... 目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候选项集的挖掘算法TOPKHUP;HUPTree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保持平稳. 展开更多
关键词 效用模式 频繁模式 频繁项集 数据挖掘 TOP—K
在线阅读 下载PDF
一次性条件下top-k高平均效用序列模式挖掘算法 被引量:2
5
作者 杨克帅 武优西 +2 位作者 耿萌 刘靖宇 李艳 《计算机应用》 CSCD 北大核心 2024年第2期477-484,共8页
针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首... 针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首先,提出基于各项出现位置与项重复关系数组的CSP(Calculation Support of Pattern)算法计算模式支持度,从而实现模式平均效用的快速计算;其次,采用项集扩展和序列扩展生成候选模式,并提出了最大平均效用上界,基于该上界实现对候选模式的有效剪枝。在5个真实数据集和1个合成数据集上的实验结果表明,相较于TOUP-dfs和HAOP-ms算法,TOUP算法的候选模式数分别降低了38.5%~99.8%和0.9%~77.6%;运行时间分别降低了33.6%~97.1%和57.9%~97.2%。TOUP的算法性能更优,能更高效地挖掘用户感兴趣的模式。 展开更多
关键词 数据挖掘 序列模式挖掘 平均效用 一次性条件 top-k
在线阅读 下载PDF
非冗余统计显著判别高效用模式挖掘算法
6
作者 吴军 欧阳艾嘉 王亚 《计算机应用》 北大核心 2025年第8期2572-2581,共10页
针对高效用模式挖掘任务中假阳性模式和冗余模式的判别问题,提出一种基于无限制检验和独立成长率的判别高效用模式挖掘算法UTDHU(Unlimited Testing for Discriminative High Utility pattern mining)。首先,找到目标事务集合中满足效... 针对高效用模式挖掘任务中假阳性模式和冗余模式的判别问题,提出一种基于无限制检验和独立成长率的判别高效用模式挖掘算法UTDHU(Unlimited Testing for Discriminative High Utility pattern mining)。首先,找到目标事务集合中满足效用阈值和差异阈值的判别高效用模式;其次,建立前缀项共享树以快速计算每个模式的独立成长率,并基于独立成长率筛除未超过独立阈值的冗余判别高效用模式;最后,使用无限制检验计算余下每个模式的统计显著性度量p值,并根据错误率判断族过滤整体结果中的假阳性判别高效用模式。在4个基准事务集合和2个仿真事务集合上的实验结果表明,相较于Hamm和YBHU(Yekutieli-Benjamini resampling for High Utility pattern mining)等算法,所提算法在模式数量方面输出最少,过滤了至少97.8%的被检验模式;在模式质量方面,所提算法的假阳性判别高效用模式占比低于5.2%,且构造特征的分类准确率高于对比算法至少1.5个百分点;虽然所提算法在运行时间方面慢于Hamm算法,但快于其余3个基于统计显著性检验的算法。可见,所提算法能够有效剔除一定数量的假阳性和冗余判别高效用模式,在挖掘性能上更优,且运行效率更高。 展开更多
关键词 数据挖掘 判别效用模式挖掘 模式评估 假阳性模式过滤 冗余模式筛除
在线阅读 下载PDF
一种有效的周期高效用序列模式增量挖掘算法 被引量:1
7
作者 荀亚玲 任姿芊 闫海博 《计算机应用研究》 CSCD 北大核心 2024年第8期2301-2308,共8页
周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,... 周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,有效地实现了周期高效用序列模式(PHUSPs)的增量挖掘。IncPUS-Miner引入了一种名为pu-tree的新型数据结构,每个树节点对应一个更新效用列表(UUL)用于存储相应序列的辅助信息,当有增量数据加入时,该结构使得项目信息能够灵活更新,从而增强了算法的动态适应性和可扩展性。此外,还提出了两种新的序列效用上界PUB和EUB,以及两种相应的剪枝策略,有效地减少了计算负担。实验结果表明,在真实数据集上,IncPUS-Miner算法可以有效地增量挖掘PHUSPs,与其他算法相比,在运行效率和内存消耗上展现出了优越的性能。 展开更多
关键词 增量挖掘 效用序列模式 周期序列模式 序列模式挖掘
在线阅读 下载PDF
基于滑动窗口含负项的高效用模式挖掘
8
作者 武妍 荀亚玲 马煜 《计算机工程与设计》 北大核心 2024年第3期845-851,共7页
针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有... 针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有效的逐批次挖掘,避免重复的数据库扫描,在不产生候选效用模式集的情况下,直接挖掘出高效用模式,使HUPN_SW有效适应于动态流数据。实验结果表明,HUPN_SW算法在运行时间和可扩展性方面有良好表现。 展开更多
关键词 频繁模式挖掘 滑动窗口 效用模式挖掘 效用项集 效用 流数据 效用列表
在线阅读 下载PDF
衍生高效用模式挖掘算法综述
9
作者 刘淑娟 韩萌 +2 位作者 高智慧 穆栋梁 李昂 《燕山大学学报》 CAS 北大核心 2024年第2期138-156,共19页
在数据挖掘领域中,高效用模式挖掘任务具有较高的理论研究价值和广泛的实际应用场景。针对多变的应用场合,提出了一系列衍生高效用模式。首先从关键技术的角度对高平均效用模式挖掘算法进行了分类论述,主要包括基于先验、基于树、基于... 在数据挖掘领域中,高效用模式挖掘任务具有较高的理论研究价值和广泛的实际应用场景。针对多变的应用场合,提出了一系列衍生高效用模式。首先从关键技术的角度对高平均效用模式挖掘算法进行了分类论述,主要包括基于先验、基于树、基于列表、基于投影和基于数据格式的方法。其次,分析讨论了基于全集、精简集以及融合模式的含有负效用的高效用模式挖掘算法。再次,从模糊高效用模式、相关高效用模式和其他新兴高效用模式三个方面概述和总结了扩展高效用模式算法。最后,针对现阶段研究方向的不足,给出下一步的研究方向。 展开更多
关键词 衍生效用模式 平均效用模式 效用 模糊效用模式 相关效用模式 综述
在线阅读 下载PDF
基于Top-k的高效用模式挖掘算法 被引量:4
10
作者 赵林柳 吕鑫 陶飞飞 《计算机工程》 CAS CSCD 北大核心 2019年第5期169-174,181,共7页
通过用户设定阈值获取高效用模式的算法效率较低且挖掘结果不一定满足用户需求。针对这一问题,基于EFIM算法提出一种高效用Top-k模式挖掘算法。由用户指定高效用模式个数来代替人为阈值设定。采用基于扩展效用和剩余效用的双重剪枝策略... 通过用户设定阈值获取高效用模式的算法效率较低且挖掘结果不一定满足用户需求。针对这一问题,基于EFIM算法提出一种高效用Top-k模式挖掘算法。由用户指定高效用模式个数来代替人为阈值设定。采用基于扩展效用和剩余效用的双重剪枝策略,有效控制模式的增长。在数据库投影过程中,应用事务排序及合并策略减少运行时间和内存消耗。实验结果表明,该算法在运行时间和内存消耗上具有较大优势,尤其适用于密集型数据集的高效用模式挖掘。 展开更多
关键词 效用模式 top-k模式 扩展效用 剩余效用 数据库投影
在线阅读 下载PDF
精简高效用模式挖掘综述 被引量:3
11
作者 孙蕊 韩萌 +2 位作者 张春砚 申明尧 杜诗语 《计算机应用研究》 CSCD 北大核心 2021年第4期975-981,共7页
全集高效用模式挖掘算法存在的关键问题之一是会产生冗余的高效用项集,这将导致用户很难在大量的高效用项集中发现有用的信息,严重降低了高效用模式挖掘算法的性能。为解决这一问题,衍生出了精简高效用模式挖掘算法,其主要包括最大高效... 全集高效用模式挖掘算法存在的关键问题之一是会产生冗余的高效用项集,这将导致用户很难在大量的高效用项集中发现有用的信息,严重降低了高效用模式挖掘算法的性能。为解决这一问题,衍生出了精简高效用模式挖掘算法,其主要包括最大高效用模式、闭合高效用模式、top-k高效用模式以及三者之间的组合高效用模式挖掘算法等。首先,介绍了精简高效用模式的相关问题描述;然后,从有无候选项集生成、一两阶段挖掘方法、数据结构类型和剪枝策略等角度,重点分类总结了精简高效用模式挖掘方法;最后,给出了精简高效用模式的进一步研究方向,包括处理基于负项的高效用精简模式、处理基于时间的高效用精简模式及处理动态复杂的数据等。 展开更多
关键词 精简效用模式挖掘 最大效用模式 闭合效用模式 top-k高效用模式
在线阅读 下载PDF
基于模式增长方式的高效用模式挖掘算法 被引量:10
12
作者 王乐 熊松泉 +1 位作者 常艳芬 王水 《自动化学报》 EI CSCD 北大核心 2015年第9期1616-1626,共11页
高效用模式挖掘是数据挖掘领域的一个重要研究内容;由于其计算过程包含对模式的内、外效用值的处理,计算复杂度较大,因此挖掘算法的主要研究热点问题就是提高算法的时间效率.针对此问题,本文给出一个基于模式增长方式的高效用模式挖掘算... 高效用模式挖掘是数据挖掘领域的一个重要研究内容;由于其计算过程包含对模式的内、外效用值的处理,计算复杂度较大,因此挖掘算法的主要研究热点问题就是提高算法的时间效率.针对此问题,本文给出一个基于模式增长方式的高效用模式挖掘算法HUPM-FP,该算法可以从全局树上挖掘高效用模式,避免产生候选项集.实验中,采用6个典型数据集进行实验,并和目前效率较好的算法FHM(Faster high-utility itemset mining)做了对比,实验结果表明本文给出的算法时空效率都有较大的提高,特别是时间效率提高较大,可以达到1个数量级以上. 展开更多
关键词 效用模式 频繁模式 频繁项集 数据挖掘
在线阅读 下载PDF
一种频率约束的高效用模式挖掘算法 被引量:1
13
作者 张全贵 曹阳 李志强 《计算机应用与软件》 北大核心 2018年第11期266-271,共6页
现有的高效用模式挖掘将效用作为唯一指标,可能会导致挖掘出来的模式是低频的,这样往往满足不了实际的需求。因此,兼顾频率的高效用模式挖掘具有较强的应用价值。针对此问题,提出频率约束的高效用模式挖掘算法UFCP-Miner。算法将项集在... 现有的高效用模式挖掘将效用作为唯一指标,可能会导致挖掘出来的模式是低频的,这样往往满足不了实际的需求。因此,兼顾频率的高效用模式挖掘具有较强的应用价值。针对此问题,提出频率约束的高效用模式挖掘算法UFCP-Miner。算法将项集在整个数据库中出现的频率考虑进高效用模式挖掘中,重新定义了高效用模式,并提出新的交易权重效用值的概念。采用四个典型数据集对算法的性能进行测试,结果表明该算法能够有效地识别出特定的高效用模式,并且有很好的可扩展性。 展开更多
关键词 频率约束 效用模式 模式挖掘
在线阅读 下载PDF
基于多效用阈值的分布式高效用序列模式挖掘 被引量:1
14
作者 曾毅 张福泉 《计算机工程与设计》 北大核心 2020年第2期449-457,共9页
针对序列模式的高效用模式挖掘过程中搜索空间大、计算复杂度高的问题,提出一种基于多效用阈值的分布式高效用序列模式挖掘算法。采用数组结构保存模式的效用信息,解决效用矩阵导致的内存消耗大的缺点。设计1-项集与2-项集的深度剪枝策... 针对序列模式的高效用模式挖掘过程中搜索空间大、计算复杂度高的问题,提出一种基于多效用阈值的分布式高效用序列模式挖掘算法。采用数组结构保存模式的效用信息,解决效用矩阵导致的内存消耗大的缺点。设计1-项集与2-项集的深度剪枝策略,深入地缩小候选模式的搜索空间,减少搜索时间成本与缓存成本。提出挖掘算法的分布式实现方案,通过并行处理进一步降低模式挖掘的时间。基于中等规模与大规模的序列数据集分别进行实验,实验结果表明,该算法有效减少了候选模式的数量,降低了挖掘的时间成本与存储成本,对于大数据集表现出较好的可扩展能力与稳定性。 展开更多
关键词 序列模式 大数据 效用模式挖掘 分布式计算 频繁项集 剪枝策略
在线阅读 下载PDF
空间高效用Co-location模式挖掘技术初探 被引量:9
15
作者 杨世晟 王丽珍 +1 位作者 芦俊丽 高源 《小型微型计算机系统》 CSCD 北大核心 2014年第10期2302-2307,共6页
空间Co-location模式是一个空间特征集,集合中各个特征的实例在邻近区域内频繁并发出现.在经典的频繁模式挖掘研究中,最近的突破之一是将效用概念作为新的兴趣度量,它允许事务中同一个项可以有多个实例出现且不同的项可以具有不同价值.... 空间Co-location模式是一个空间特征集,集合中各个特征的实例在邻近区域内频繁并发出现.在经典的频繁模式挖掘研究中,最近的突破之一是将效用概念作为新的兴趣度量,它允许事务中同一个项可以有多个实例出现且不同的项可以具有不同价值.本文将效用概念引入到空间Co-location模式挖掘中,定义了模式效用、模式效用率等概念,提出一种基础算法挖掘空间高效用Co-location模式.接着定义了扩展模式效用,并根据它的反单调性提出一种剪枝策略:完全剪枝算法,加快了空间高效用Co-location模式的产生.最后通过大量实验来说明完全剪枝算法的效果和效率. 展开更多
关键词 效用模式挖掘 空间Co—location模式 完全剪枝算法 模式效用
在线阅读 下载PDF
基于聚类划分的高效用模式并行挖掘算法 被引量:25
16
作者 邢淑凝 刘方爱 赵晓晖 《计算机应用》 CSCD 北大核心 2016年第8期2202-2206,2212,共6页
针对在大规模数据库中挖掘高效用模式产生大量基于内存的效用模式树,从而导致内存空间占用较大以及丢失一些高效用项集的问题,提出在Hadoop分布式计算平台下的基于聚类划分的高效用模式并行挖掘算法PUCP。首先,采用聚类的方法把数据库... 针对在大规模数据库中挖掘高效用模式产生大量基于内存的效用模式树,从而导致内存空间占用较大以及丢失一些高效用项集的问题,提出在Hadoop分布式计算平台下的基于聚类划分的高效用模式并行挖掘算法PUCP。首先,采用聚类的方法把数据库中相似的事务划分为若干数据子集;然后,把若干划分好的数据子集分配到Hadoop平台的各个节点中构造效用模式树;最后,把各个节点中相同项的条件模式基分配到同一个节点中进行挖掘,以减少各个节点交叉操作的次数。通过实验结果和理论分析表明:PUCP算法在不影响挖掘结果可靠性的前提下,与主流串行高效用模式挖掘——效用模式增长挖掘算法(UP-Growth)和现有的并行高效用模式挖掘算法PHUI-Growth相比,挖掘效率分别提高了61.2%和16.6%;并且使用了Hadoop计算平台,能有效缓解挖掘大规模数据的内存压力。 展开更多
关键词 大数据 效用模式挖掘 聚类 并行计算 HADOOP
在线阅读 下载PDF
模糊特征的top-k平均效用co-location模式挖掘 被引量:2
17
作者 李金红 王丽珍 周丽华 《计算机科学与探索》 CSCD 北大核心 2022年第5期1053-1063,共11页
空间并置(co-location)模式是指在空间邻域内空间特征的实例频繁地出现在一起所形成的非空特征子集。人们已经对确定数据和不确定数据的top-k空间co-location模式挖掘进行了相关研究,但是针对模糊特征的top-k平均效用co-location模式挖... 空间并置(co-location)模式是指在空间邻域内空间特征的实例频繁地出现在一起所形成的非空特征子集。人们已经对确定数据和不确定数据的top-k空间co-location模式挖掘进行了相关研究,但是针对模糊特征的top-k平均效用co-location模式挖掘的研究还没有。提出模糊特征的top-k平均效用co-location模式挖掘。首先,定义了模糊特征的top-k平均效用co-location模式的相关概念,分析了模式的扩展模糊平均效用具有的“向下闭合”性质。其次,设计了一种基于扩展模糊平均效用值挖掘top-k平均效用co-location模式的算法,解决模糊平均效用不满足“向下闭合”性质的问题。在此基础上,又提出了一种基于局部扩展模糊平均效用的剪枝方法,有效地减小了top-k平均效用co-location模式挖掘的搜索空间,进一步提高了挖掘算法的效率。最后,在真实和合成数据集上验证了所提出算法的实用性、高效性和鲁棒性。 展开更多
关键词 空间co-location模式 平均效用 模糊特征 top-k
在线阅读 下载PDF
含负项的高效用序列模式挖掘算法 被引量:4
18
作者 吕存伟 黄德才 陆亿红 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1724-1729,共6页
高效用模式挖掘在现实中有广泛的应用,也是数据挖掘研究的热点.数据库中的事务在以序列形式存在的情况下,又引申出高效用序列模式挖掘问题.序列模式的搜索空间比一般模式的大,所以计算复杂度比高效用模式挖掘大.目前对高效用序列模式算... 高效用模式挖掘在现实中有广泛的应用,也是数据挖掘研究的热点.数据库中的事务在以序列形式存在的情况下,又引申出高效用序列模式挖掘问题.序列模式的搜索空间比一般模式的大,所以计算复杂度比高效用模式挖掘大.目前对高效用序列模式算法研究比较少,且都没有考虑序列数据库中项的外部效用值为负的情况.面对含负项的外部效用值,首次提出了含负项的高效用序列模式挖掘算法EHUSN,该算法提出1-2-UM和2-2-UM结构模型,结合效用信息列表能快速剪枝非候选序列,从而使挖掘算法在时空效率上的得到提升. 展开更多
关键词 序列模式挖掘 效用序列模式挖掘 模式挖掘
在线阅读 下载PDF
动态数据上的高效用模式挖掘综述 被引量:5
19
作者 单芝慧 韩萌 韩强 《计算机应用》 CSCD 北大核心 2022年第1期94-108,共15页
高效用模式挖掘(HUPM)考虑了项的购买数量及单位利润,提供了项更详细的信息,使用户能够做出更好的经济决策。针对大多数HUPM算法都应用在与不断产生数据的现实世界不符的静态数据集上的问题,近些年不断提出了动态数据上的HUPM算法。首先... 高效用模式挖掘(HUPM)考虑了项的购买数量及单位利润,提供了项更详细的信息,使用户能够做出更好的经济决策。针对大多数HUPM算法都应用在与不断产生数据的现实世界不符的静态数据集上的问题,近些年不断提出了动态数据上的HUPM算法。首先,对增量数据、数据流、动态删除和动态修改数据上的HUPM算法以及融合高效用模式(高效用序列模式、平均高效用模式、top-k高效用模式等)挖掘算法进行了总结;然后,对使用不同类型数据的算法进行了总结,包括动态利润数据、动态序列数据等数据类型;其次,从算法使用的数据结构、剪枝策略、窗口模型、优缺点等角度对HUPM算法进行分类总结;最后,针对目前研究的不足,提出了下一步动态数据上的HUPM算法研究方向。 展开更多
关键词 效用模式 增量数据 数据流 动态删除 动态修改 动态数据
在线阅读 下载PDF
k-近邻关系下的空间高效用核模式挖掘 被引量:4
20
作者 罗金 王丽珍 +1 位作者 王晓璇 肖清 《计算机学报》 EI CAS CSCD 北大核心 2022年第2期354-368,共15页
空间数据挖掘旨在从空间数据库中发现和提取有价值的潜在知识.空间co-location(共存)模式挖掘一直以来都是空间数据挖掘领域的重要研究方向之一,其目的是发现一组频繁邻近出现的空间特征子集,而空间高效用co-location模式挖掘则考虑了... 空间数据挖掘旨在从空间数据库中发现和提取有价值的潜在知识.空间co-location(共存)模式挖掘一直以来都是空间数据挖掘领域的重要研究方向之一,其目的是发现一组频繁邻近出现的空间特征子集,而空间高效用co-location模式挖掘则考虑了特征的效用属性.二者在度量空间实例的邻近关系时一般都需要预先给定一个距离阈值d,挖掘算法的效率很受距离阈值d的影响,尤其对分布不均匀的数据集表现不好.另外,传统的空间高效用模式挖掘在分析评估模式的效用时,将模式中所有特征的效用值都计算到模式效用中是不合理的,如在国内5A级景区周围进行高收益商业项目的规划时,项目的预期收益本身不应包含景点的收益.基于上述问题,本文在空间高效用co-location模式挖掘过程中融入了空间k-近邻计算,使得空间实例之间的邻近关系更为客观、合理.进一步地,定义了核元素和核模式等概念,对核模式效用的高低进行了度量,并提出了k-近邻关系下的空间高效用核模式挖掘的通用框架,设计了一个行之有效的基本挖掘算法,考虑到核模式效用度不满足反单调性质,在基本算法之上提出了4个剪枝策略.大量的实验结果表明本文方法挖掘到的空间高效用核模式更具有现实意义,在同等的参数设置下,剪枝优化算法的效率比基本算法至少提高了50%. 展开更多
关键词 空间数据挖掘 空间co-location模式 空间效用模式 K-近邻
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部