期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
大数据中效用挖掘的快速单阶段算法 被引量:1
1
作者 刘君强 周青峰 +1 位作者 王文慧 时磊 《电信科学》 北大核心 2015年第4期78-86,共9页
现有数据挖掘算法的缺点是在挖掘大数据时会出现大量候选模式,从而造成可伸缩性瓶颈,个别算法虽然不生成候选模式,但是计算代价高昂,缺乏有效剪裁,运行效率存在瓶颈。为此,提出一个全新的单阶段不生成候选模式的数据挖掘算法,其... 现有数据挖掘算法的缺点是在挖掘大数据时会出现大量候选模式,从而造成可伸缩性瓶颈,个别算法虽然不生成候选模式,但是计算代价高昂,缺乏有效剪裁,运行效率存在瓶颈。为此,提出一个全新的单阶段不生成候选模式的数据挖掘算法,其创新性有3点:一是基于前缀生长的模式枚举和基于效用上限值评估的剪裁策略;二是基于稀疏矩阵和虚拟投影的效用信息表达;三是节省存储空间的深度优先搜索方法。大量实验表明.新算法的时间效率比现有算法高5倍以上,并且内存使用量比现有算法少20%~60%,可伸缩性高。 展开更多
关键词 大数据 效用挖掘 效用模式 频繁模式
在线阅读 下载PDF
基于BCU-Tree与字典的高效用挖掘快速脱敏算法 被引量:2
2
作者 尹春勇 李荧 《计算机应用》 CSCD 北大核心 2023年第2期413-422,共10页
针对隐私保护效用挖掘(PPUM)中脱敏时间长、计算复杂度高,以及算法副作用大等问题,提出一种基于BCU-Tree和字典(BCUTD)的高效用挖掘快速脱敏算法。该算法提出了一种新的树结构BCU-Tree来存储敏感项信息,基于按位运算符编码模型降低树的... 针对隐私保护效用挖掘(PPUM)中脱敏时间长、计算复杂度高,以及算法副作用大等问题,提出一种基于BCU-Tree和字典(BCUTD)的高效用挖掘快速脱敏算法。该算法提出了一种新的树结构BCU-Tree来存储敏感项信息,基于按位运算符编码模型降低树的构建时间并减小搜索空间。采用字典表存储树结构中的所有节点,修改敏感项时只需访问字典表,最终达到数据库脱敏目的。在4个不同的数据集上进行的实验中,BCUTD算法在脱敏时间和副作用上的表现要明显优于经典的优先隐藏高效用项(HHUIF)算法、最大敏感效用-最大项效用(MSU-MAU)算法和使用树与表结构的快速扰动(FPUTT)算法。实验结果表明,BCUTD算法能够有效减少脱敏时间,降低算法副作用以及计算复杂度。 展开更多
关键词 敏感信息 效用挖掘 隐私保护 字典 位图编码
在线阅读 下载PDF
一种快速的高效用序列模式挖掘算法
3
作者 张瑞华 韩萌 +2 位作者 何菲菲 孟凡兴 李春鹏 《燕山大学学报》 北大核心 2025年第4期349-366,共18页
高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与... 高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与空间消耗成本过高的问题,提出了一种紧凑的效用索引列表结构,用于存储挖掘过程中序列的效用与位置等信息,基于该结构设计了一种快速的高效用序列模式挖掘算法。为了进一步提高算法的挖掘效率,提出了一种新的序列效用计算上界,用于缩减搜索空间。在真实和合成数据集上的大量实验表明,本文设计的算法在时间、内存、搜索空间缩减和可扩展性方面均优于目前先进算法。 展开更多
关键词 模式挖掘 效用序列模式 序列分析 效用挖掘 效用索引列表
在线阅读 下载PDF
非冗余统计显著判别高效用模式挖掘算法
4
作者 吴军 欧阳艾嘉 王亚 《计算机应用》 北大核心 2025年第8期2572-2581,共10页
针对高效用模式挖掘任务中假阳性模式和冗余模式的判别问题,提出一种基于无限制检验和独立成长率的判别高效用模式挖掘算法UTDHU(Unlimited Testing for Discriminative High Utility pattern mining)。首先,找到目标事务集合中满足效... 针对高效用模式挖掘任务中假阳性模式和冗余模式的判别问题,提出一种基于无限制检验和独立成长率的判别高效用模式挖掘算法UTDHU(Unlimited Testing for Discriminative High Utility pattern mining)。首先,找到目标事务集合中满足效用阈值和差异阈值的判别高效用模式;其次,建立前缀项共享树以快速计算每个模式的独立成长率,并基于独立成长率筛除未超过独立阈值的冗余判别高效用模式;最后,使用无限制检验计算余下每个模式的统计显著性度量p值,并根据错误率判断族过滤整体结果中的假阳性判别高效用模式。在4个基准事务集合和2个仿真事务集合上的实验结果表明,相较于Hamm和YBHU(Yekutieli-Benjamini resampling for High Utility pattern mining)等算法,所提算法在模式数量方面输出最少,过滤了至少97.8%的被检验模式;在模式质量方面,所提算法的假阳性判别高效用模式占比低于5.2%,且构造特征的分类准确率高于对比算法至少1.5个百分点;虽然所提算法在运行时间方面慢于Hamm算法,但快于其余3个基于统计显著性检验的算法。可见,所提算法能够有效剔除一定数量的假阳性和冗余判别高效用模式,在挖掘性能上更优,且运行效率更高。 展开更多
关键词 数据挖掘 判别高效用模式挖掘 模式评估 假阳性模式过滤 冗余模式筛除
在线阅读 下载PDF
基于滑动窗口含负项的高效用模式挖掘
5
作者 武妍 荀亚玲 马煜 《计算机工程与设计》 北大核心 2024年第3期845-851,共7页
针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有... 针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有效的逐批次挖掘,避免重复的数据库扫描,在不产生候选效用模式集的情况下,直接挖掘出高效用模式,使HUPN_SW有效适应于动态流数据。实验结果表明,HUPN_SW算法在运行时间和可扩展性方面有良好表现。 展开更多
关键词 频繁模式挖掘 滑动窗口 效用模式挖掘 效用项集 效用 流数据 效用列表
在线阅读 下载PDF
动态数据库中增量Top-k高效用模式挖掘算法 被引量:6
6
作者 吴倩 王林平 +1 位作者 罗相洲 崔建群 《计算机应用研究》 CSCD 北大核心 2017年第5期1401-1405,共5页
高效用模式的挖掘需要设定一个合适的阈值,而阈值设定对用户来说并非易事,阈值过小导致产生大量低效用模式,阈值过大可能导致无高效用模式生成。因而Top-k高效用模式挖掘方法被提出,k指效用值前k大的模式。并且大量的高效用挖掘研究仅... 高效用模式的挖掘需要设定一个合适的阈值,而阈值设定对用户来说并非易事,阈值过小导致产生大量低效用模式,阈值过大可能导致无高效用模式生成。因而Top-k高效用模式挖掘方法被提出,k指效用值前k大的模式。并且大量的高效用挖掘研究仅针对静态数据库,但在实际应用中常常会遇到新事务的加入的情况。针对以上问题,提出了增量的Top-k高效用挖掘算法TOPK-HUP-INS。算法通过四个有效的策略,在增量数据的情况下,有效地挖掘用户所需数量的高效用模式。通过在不同数据集上的对比实验表明TOPK-HUP-INS算法在时空性能上表现优异。 展开更多
关键词 增量挖掘 效用挖掘 Top-k模式挖掘 动态数据库
在线阅读 下载PDF
一种快速挖掘top-k高效用模式的算法 被引量:5
7
作者 吴倩 王林平 +2 位作者 罗相洲 崔建群 王海 《计算机应用研究》 CSCD 北大核心 2017年第11期3303-3307,共5页
高效用模式挖掘是数据挖掘领域的一个基础研究方向,其中关于top-k高效用模式的挖掘算法也越来越多,k指的是用户需要挖掘的高效用模式的个数。它们可以归纳为二阶段top-k算法和一阶段top-k算法两类,两者的主要区别是,前者在挖掘的过程中... 高效用模式挖掘是数据挖掘领域的一个基础研究方向,其中关于top-k高效用模式的挖掘算法也越来越多,k指的是用户需要挖掘的高效用模式的个数。它们可以归纳为二阶段top-k算法和一阶段top-k算法两类,两者的主要区别是,前者在挖掘的过程中会产生大量的候选模式,这是影响算法性能的主要因素;后者在挖掘的过程中不产生候选模式。为了更加高效地挖掘效用值最高的k个模式,一阶段算法TKHUP被提出,该算法在进行数据挖掘的过程中主要是通过四个有效策略来减少时间和空间的消耗。通过大量的实验数据表明,TKHUP在时间性能上优于其他top-k高效用模式挖掘算法。 展开更多
关键词 效用模式 top-k模式挖掘 效用挖掘 数据挖掘
在线阅读 下载PDF
基于效用模式树的高效用频繁模式挖掘算法 被引量:3
8
作者 王晨 杜义华 +1 位作者 卢景秀 李新 《计算机应用》 CSCD 北大核心 2013年第A02期111-115,141,共6页
为了提高效用模式挖掘的效率,提出了一种基于效用模式树的两阶段效用模式挖掘算法。在第一阶段,该算法能够对全局非候选节点进行合理的舍弃,并能降低全局效用模式树中节点的估计效用。通过效用模式增长算法,递归地生成候选高效用项集。... 为了提高效用模式挖掘的效率,提出了一种基于效用模式树的两阶段效用模式挖掘算法。在第一阶段,该算法能够对全局非候选节点进行合理的舍弃,并能降低全局效用模式树中节点的估计效用。通过效用模式增长算法,递归地生成候选高效用项集。在第二阶段,通过扫描调整后的事务数据库,缩小第二阶段的搜索空间。实验表明,该算法能够减少候选集的数量,提高高效用项集的生成效率。 展开更多
关键词 效用挖掘 频繁模式 效用模式树 估计效用 数据挖掘
在线阅读 下载PDF
基于PreHU-tree的高效用项集动态挖掘 被引量:2
9
作者 葛娜 尹四清 《计算机工程与设计》 北大核心 2016年第1期100-106,共7页
针对效用增量挖掘算法在由1-频项生成n-频项时产生大量无用候选频项且不能同时挖掘变化和新增数据集的问题,基于次频繁项的概念,在prelarge-tree结构的基础上每个节点中增加事务加权效用和前缀项集链表,提出一种效用挖掘模式树(PreHU-tr... 针对效用增量挖掘算法在由1-频项生成n-频项时产生大量无用候选频项且不能同时挖掘变化和新增数据集的问题,基于次频繁项的概念,在prelarge-tree结构的基础上每个节点中增加事务加权效用和前缀项集链表,提出一种效用挖掘模式树(PreHU-tree)来挖掘变化事务集的高效用项集。通过搜索PreHU-tree各节点的事务加权效用和前缀项集链表直接确定n-频项,结合前缀项集链表中的项集支持度和项的外部效用挖掘变化式高效用频繁项集。实验结果表明,PreHUtree算法在数据更新后能够快速挖掘出高效用项集,具有良好的可扩展性。 展开更多
关键词 效用挖掘 次频繁项集 动态挖掘 PreHU-tree 频繁项集
在线阅读 下载PDF
基于滑动窗口挖掘数据流高效用项集的有效算法 被引量:6
10
作者 郭世明 高宏 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第4期721-729,共9页
现有的基于滑动窗口挖掘高效用项集的研究方法存在:候选项集通常数量巨大,需要大量的存储空间及计算候选项集的真实效用是非常耗时的问题。本文提出一种不生成候选项集的挖掘算法HUISW(high utility itemset mining over a siding windo... 现有的基于滑动窗口挖掘高效用项集的研究方法存在:候选项集通常数量巨大,需要大量的存储空间及计算候选项集的真实效用是非常耗时的问题。本文提出一种不生成候选项集的挖掘算法HUISW(high utility itemset mining over a siding window),HUISW采用一种新的树结构HUIL-Tree(high utility itemset tee which arranges items according to lexicographic order)存储滑动窗口中的项集信息,采用效用数据库存储项集在窗口事务中的效用信息,在挖掘过程中HUISW采用模式增长的方法对由HUIL-Tree生成的项集通过其与效用数据库的对应关系,直接计算其在滑动窗口中的效用,整个过程避免了候选项集的生成。在实验中通过由稀疏和稠密数据集模拟的数据流对HUISW进行性能评估,并与同类算法SHU-Growth(siding window based high utility growth)进行比较,实验结果表明HUISW显著优于SHU-Growth,运行时间最快可提升两个数量级。 展开更多
关键词 效用项集 模式增长 数据流 效用挖掘 滑动窗口 数据挖掘
在线阅读 下载PDF
基于优化上界的高平均效用项集垂直挖掘算法 被引量:1
11
作者 浦蓉 邵剑飞 +1 位作者 胡常礼 曲坤 《计算机工程与科学》 CSCD 北大核心 2020年第5期931-937,共7页
高平均效用项集挖掘是当前研究的热点之一。针对高平均效用项集挖掘算法产生大量无意义的候选项集,而导致高内存消耗和运行时间长的问题,提出了dMHAUI算法。首先定义了集成矩阵Q,并提出了4种基于垂直数据库表示的紧凑平均效用上界及3种... 高平均效用项集挖掘是当前研究的热点之一。针对高平均效用项集挖掘算法产生大量无意义的候选项集,而导致高内存消耗和运行时间长的问题,提出了dMHAUI算法。首先定义了集成矩阵Q,并提出了4种基于垂直数据库表示的紧凑平均效用上界及3种有效的修剪策略;将高平均效用项集挖掘所需的信息存储于IDUL结构树,利用改进的diffset技术快速计算项集的平均效用和上界;最后通过递归调用搜索函数得到高平均效用项集。与EHAUPM算法和MHAI算法进行仿真比较,结果表明,dMHAUI算法在运行时间、连接比较次数和可扩展性等方面都有较优的性能。 展开更多
关键词 模式挖掘 高平均效用项集挖掘 dMHAUI算法 上界 效用挖掘
在线阅读 下载PDF
基于多效用阈值的分布式高效用序列模式挖掘 被引量:1
12
作者 曾毅 张福泉 《计算机工程与设计》 北大核心 2020年第2期449-457,共9页
针对序列模式的高效用模式挖掘过程中搜索空间大、计算复杂度高的问题,提出一种基于多效用阈值的分布式高效用序列模式挖掘算法。采用数组结构保存模式的效用信息,解决效用矩阵导致的内存消耗大的缺点。设计1-项集与2-项集的深度剪枝策... 针对序列模式的高效用模式挖掘过程中搜索空间大、计算复杂度高的问题,提出一种基于多效用阈值的分布式高效用序列模式挖掘算法。采用数组结构保存模式的效用信息,解决效用矩阵导致的内存消耗大的缺点。设计1-项集与2-项集的深度剪枝策略,深入地缩小候选模式的搜索空间,减少搜索时间成本与缓存成本。提出挖掘算法的分布式实现方案,通过并行处理进一步降低模式挖掘的时间。基于中等规模与大规模的序列数据集分别进行实验,实验结果表明,该算法有效减少了候选模式的数量,降低了挖掘的时间成本与存储成本,对于大数据集表现出较好的可扩展能力与稳定性。 展开更多
关键词 序列模式 大数据 效用模式挖掘 分布式计算 频繁项集 剪枝策略
在线阅读 下载PDF
基于聚类划分的高效用模式并行挖掘算法 被引量:25
13
作者 邢淑凝 刘方爱 赵晓晖 《计算机应用》 CSCD 北大核心 2016年第8期2202-2206,2212,共6页
针对在大规模数据库中挖掘高效用模式产生大量基于内存的效用模式树,从而导致内存空间占用较大以及丢失一些高效用项集的问题,提出在Hadoop分布式计算平台下的基于聚类划分的高效用模式并行挖掘算法PUCP。首先,采用聚类的方法把数据库... 针对在大规模数据库中挖掘高效用模式产生大量基于内存的效用模式树,从而导致内存空间占用较大以及丢失一些高效用项集的问题,提出在Hadoop分布式计算平台下的基于聚类划分的高效用模式并行挖掘算法PUCP。首先,采用聚类的方法把数据库中相似的事务划分为若干数据子集;然后,把若干划分好的数据子集分配到Hadoop平台的各个节点中构造效用模式树;最后,把各个节点中相同项的条件模式基分配到同一个节点中进行挖掘,以减少各个节点交叉操作的次数。通过实验结果和理论分析表明:PUCP算法在不影响挖掘结果可靠性的前提下,与主流串行高效用模式挖掘——效用模式增长挖掘算法(UP-Growth)和现有的并行高效用模式挖掘算法PHUI-Growth相比,挖掘效率分别提高了61.2%和16.6%;并且使用了Hadoop计算平台,能有效缓解挖掘大规模数据的内存压力。 展开更多
关键词 大数据 效用模式挖掘 聚类 并行计算 HADOOP
在线阅读 下载PDF
空间高效用Co-location模式挖掘技术初探 被引量:9
14
作者 杨世晟 王丽珍 +1 位作者 芦俊丽 高源 《小型微型计算机系统》 CSCD 北大核心 2014年第10期2302-2307,共6页
空间Co-location模式是一个空间特征集,集合中各个特征的实例在邻近区域内频繁并发出现.在经典的频繁模式挖掘研究中,最近的突破之一是将效用概念作为新的兴趣度量,它允许事务中同一个项可以有多个实例出现且不同的项可以具有不同价值.... 空间Co-location模式是一个空间特征集,集合中各个特征的实例在邻近区域内频繁并发出现.在经典的频繁模式挖掘研究中,最近的突破之一是将效用概念作为新的兴趣度量,它允许事务中同一个项可以有多个实例出现且不同的项可以具有不同价值.本文将效用概念引入到空间Co-location模式挖掘中,定义了模式效用、模式效用率等概念,提出一种基础算法挖掘空间高效用Co-location模式.接着定义了扩展模式效用,并根据它的反单调性提出一种剪枝策略:完全剪枝算法,加快了空间高效用Co-location模式的产生.最后通过大量实验来说明完全剪枝算法的效果和效率. 展开更多
关键词 效用模式挖掘 空间Co—location模式 完全剪枝算法 模式效用
在线阅读 下载PDF
含负项的高效用序列模式挖掘算法 被引量:4
15
作者 吕存伟 黄德才 陆亿红 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1724-1729,共6页
高效用模式挖掘在现实中有广泛的应用,也是数据挖掘研究的热点.数据库中的事务在以序列形式存在的情况下,又引申出高效用序列模式挖掘问题.序列模式的搜索空间比一般模式的大,所以计算复杂度比高效用模式挖掘大.目前对高效用序列模式算... 高效用模式挖掘在现实中有广泛的应用,也是数据挖掘研究的热点.数据库中的事务在以序列形式存在的情况下,又引申出高效用序列模式挖掘问题.序列模式的搜索空间比一般模式的大,所以计算复杂度比高效用模式挖掘大.目前对高效用序列模式算法研究比较少,且都没有考虑序列数据库中项的外部效用值为负的情况.面对含负项的外部效用值,首次提出了含负项的高效用序列模式挖掘算法EHUSN,该算法提出1-2-UM和2-2-UM结构模型,结合效用信息列表能快速剪枝非候选序列,从而使挖掘算法在时空效率上的得到提升. 展开更多
关键词 序列模式挖掘 效用序列模式挖掘 模式挖掘
在线阅读 下载PDF
高效用模式挖掘关键技术综述 被引量:5
16
作者 张春砚 韩萌 +2 位作者 孙蕊 杜诗语 申明尧 《计算机应用研究》 CSCD 北大核心 2021年第2期330-340,共11页
通过分析有关高效用模式挖掘(high utility pattern mining,HUPM)最先进的方法,对其进行全面和结构化的概述。首先,通过介绍HUPM的相关概念、公式并给出应用示例,对HUPM有更深一步的理解;针对用于挖掘不同类型HUPM的最常见和最先进的关... 通过分析有关高效用模式挖掘(high utility pattern mining,HUPM)最先进的方法,对其进行全面和结构化的概述。首先,通过介绍HUPM的相关概念、公式并给出应用示例,对HUPM有更深一步的理解;针对用于挖掘不同类型HUPM的最常见和最先进的关键技术进行分类,包括基于Apriori、基于树、基于列表、基于映射、基于垂直/水平数据格式、基于索引等方法。针对现有关键技术的用途和优缺点进行了全面概述,由于静态数据难以满足实际需要,总结了在数据流上应用的HUPM方法,主要包括基于增量方法、基于滑动窗口模型方法、基于时间衰减模型方法、基于地标模型方法等。最后,给出了现有技术的不足和改进方向,并且有针对性地提出了新的研究方法。 展开更多
关键词 模式挖掘 效用模式挖掘 数据流 增量型数据
在线阅读 下载PDF
一种改进的流数据上的高效用模式挖掘算法 被引量:3
17
作者 谢志轩 李玉强 《小型微型计算机系统》 CSCD 北大核心 2017年第9期2080-2085,共6页
为了快速地从无限的流数据中挖掘出高效用模式,基于已有算法HUM-UT提出一种流数据上的高效用模式挖掘算法——IHUM-UT(Improved High Utility Mining based on Utility Tree)算法.IHUM-UT算法通过压缩HUM-UT算法的头表大小,使其只包含... 为了快速地从无限的流数据中挖掘出高效用模式,基于已有算法HUM-UT提出一种流数据上的高效用模式挖掘算法——IHUM-UT(Improved High Utility Mining based on Utility Tree)算法.IHUM-UT算法通过压缩HUM-UT算法的头表大小,使其只包含滑动窗口中关注的数据,减少挖掘时所要遍历的数据量,达到提高时间效率的目的.结合两个数据集,调节最小效用阈值、批大小和窗口大小,对两个算法进行对比实验,实验结果表明,IHUM-UT算法得到的高效用模式集与HUM-UT算法完全一致,在时间效率上有较大提升,这种提升在关注数据量较少、不同数据项个数较多的情况下更为突出. 展开更多
关键词 流数据 滑动窗口 效用模式挖掘
在线阅读 下载PDF
面向安防系统的高效用语义轨迹模式挖掘 被引量:2
18
作者 付嘉豪 杨嘉怡 李爱国 《计算机工程》 CAS CSCD 北大核心 2023年第6期62-70,共9页
在安防系统中,将大量目标轨迹先转化为语义轨迹后再进行频繁模式挖掘,有助于分析目标行为模式、识别危险源及增强安防系统内部防控。针对现有频繁模式挖掘方法未考虑目标停留点的效用差异问题,提出一种高效用语义轨迹模式挖掘算法。综... 在安防系统中,将大量目标轨迹先转化为语义轨迹后再进行频繁模式挖掘,有助于分析目标行为模式、识别危险源及增强安防系统内部防控。针对现有频繁模式挖掘方法未考虑目标停留点的效用差异问题,提出一种高效用语义轨迹模式挖掘算法。综合停留点兴趣度、目标停留时间以及目标语义轨迹支持度这3个参数定义语义轨迹效用值,采用蚁群算法挖掘高效用语义轨迹模式。利用精英蚂蚁策略改进蚂蚁种群的迭代方式,通过轮盘赌选择法优化蚂蚁对于下一个节点的选择策略,运用无效用编码向量剪枝策略提高算法执行效率。在Chess、Mushroom、Foodmart、Retail等4个公开数据集以及某安防系统的RFID定位数据集上的实验结果表明,相比于HUIM-ACS算法,该算法挖掘的高效用语义轨迹模式数量增加了10%~15%,运行时间减少了7%~12%。 展开更多
关键词 安防系统 语义轨迹 效用模式挖掘 蚁群算法 剪枝策略
在线阅读 下载PDF
基于滑动窗口的含负项高效用模式挖掘方法 被引量:1
19
作者 张妮 韩萌 +2 位作者 王乐 李小娟 程浩东 《郑州大学学报(理学版)》 北大核心 2022年第4期55-63,共9页
现有的面向数据流的高效用模式挖掘方法局限性之一在于假定数据都带有正的效用值,且在挖掘过程中使用效用列表会消耗大量的时间和内存。为了解决以上问题,首次提出在数据流中挖掘含负项的高效用模式挖掘算法,在算法中设计了一种新颖的... 现有的面向数据流的高效用模式挖掘方法局限性之一在于假定数据都带有正的效用值,且在挖掘过程中使用效用列表会消耗大量的时间和内存。为了解决以上问题,首次提出在数据流中挖掘含负项的高效用模式挖掘算法,在算法中设计了一种新颖的列表索引结构(list index structure,LIS),LIS包括数据段和索引段,依据索引段中的索引值以及项集中的正负效用值,在滑动窗口中可快速访问或更新数据段并及时剪枝,有效挖掘含负项的高效用模式,以此来提升算法的时空性能。进行了广泛的实验评估来验证算法的效率,实验结果表明,提出算法在内存消耗及运行时间方面均表现出良好的性能。 展开更多
关键词 效用模式挖掘 数据流 效用 列表索引
在线阅读 下载PDF
基于窗口内投影的闭合高效用模式挖掘
20
作者 李慕航 韩萌 +2 位作者 陈志强 武红鑫 张喜龙 《太原理工大学学报》 CAS 北大核心 2022年第2期257-265,共9页
提出了一种快速且有效的数据流高效用模式挖掘算法EFIM_Closed_DS.算法基于窗口内投影技术,在每个窗口中使用数据库投影技术以及事务合并方法有效地减少了数据库扫描的代价。使用高效的剪枝技术和有效的闭合项集检测方法能够剪枝大量低... 提出了一种快速且有效的数据流高效用模式挖掘算法EFIM_Closed_DS.算法基于窗口内投影技术,在每个窗口中使用数据库投影技术以及事务合并方法有效地减少了数据库扫描的代价。使用高效的剪枝技术和有效的闭合项集检测方法能够剪枝大量低效用项集以及非闭合项集。大量实验结果显示,提出的算法比之前最先进的算法在内存和时间上都更为有效。 展开更多
关键词 模式挖掘 数据流 闭合模式 效用模式挖掘 窗口内投影
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部