期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于FP-Tree模型的频繁轨迹模式挖掘方法 被引量:8
1
作者 牛新征 牛嘉郡 +1 位作者 苏大壮 佘堃 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第1期86-90,134,共6页
通过对经典频繁模式数据结构FP-tree的扩展与改进,提出了一种适用于处理轨迹数据的灵活高效的FP-tree轨迹挖掘方法(NFTM)。首先运用二维筛选和GPS格式过滤的方法对轨迹进行预处理,然后将有效数据经一次扫描后,生成按照真实轨迹顺序排列... 通过对经典频繁模式数据结构FP-tree的扩展与改进,提出了一种适用于处理轨迹数据的灵活高效的FP-tree轨迹挖掘方法(NFTM)。首先运用二维筛选和GPS格式过滤的方法对轨迹进行预处理,然后将有效数据经一次扫描后,生成按照真实轨迹顺序排列且具备时空属性的改进型FP-tree,使用动态数组存储模式挖掘过程中得到的候选集,根据用户的输入针对性输出相应时间和频率范围的频繁轨迹。最后通过与GSP算法、Prefixspan算法的对比测试表明,该算法具有更短执行时间和更优性能。 展开更多
关键词 fp-tree 频繁轨迹模式 模式挖掘 时空属性
在线阅读 下载PDF
基于FP-tree的项约束关联规则挖掘算法研究 被引量:1
2
作者 王利钢 陈平 胡松 《信息化研究》 2014年第6期11-15,共5页
介绍了项约束关联规则的基本概念和技术现状,详细分析了FP-tree关联规则算法的关键技术。对FPC、CMFIMA、CCFP、DCMFI和CMFI五种基于FP-tree的项约束关联规则算法思想及技术进行分析和评价,通过比较,给出各算法的优点和不足,最后介绍了... 介绍了项约束关联规则的基本概念和技术现状,详细分析了FP-tree关联规则算法的关键技术。对FPC、CMFIMA、CCFP、DCMFI和CMFI五种基于FP-tree的项约束关联规则算法思想及技术进行分析和评价,通过比较,给出各算法的优点和不足,最后介绍了基于FP-tree项约束关联规则的应用,并展望了FP-tree项约束关联规则挖掘未来的研究方向,为基于FP-tree的项约束关联规则技术的研究与发展提供参考。 展开更多
关键词 项约束 频繁模式树 频繁项目集 数据挖掘 关联规则
在线阅读 下载PDF
频繁项目集的快速增量式更新算法 被引量:6
3
作者 杨明 孙志挥 +1 位作者 宋余庆 陈耿 《应用科学学报》 CAS CSCD 2003年第4期367-372,共6页
提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.
关键词 频繁项目集 快速增量式更新算法 频繁模式树 数据挖掘 数据库
在线阅读 下载PDF
基于频繁模式树的约束最大频繁项目集挖掘算法研究 被引量:4
4
作者 陈耿 朱玉全 +2 位作者 宋余庆 陆介平 孙志挥 《应用科学学报》 CAS CSCD 北大核心 2006年第1期64-69,共6页
目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快... 目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快速的基于频繁模式树(FP-tree:一种扩展前缀树结构)的约束最大频繁项目集挖掘及其更新算法.实验结果表明该算法是快速有效的. 展开更多
关键词 关联规则 项约束 最大频繁项目集 频繁模式树 增量式更新
在线阅读 下载PDF
一种基于DOM树的XML数据频繁模式挖掘算法 被引量:4
5
作者 吉根林 韦素云 鲍培明 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2006年第2期206-211,共6页
由于XM L数据具有半结构化特性,使得面向XM L数据的数据挖掘不同于面向关系数据库的数据挖掘,它具有更复杂的层次结构。研究基于DOM树的XM L数据频繁模式挖掘算法,提出面向XM L数据的频繁模式增量式挖掘算法F reqtT ree。该算法首先将X... 由于XM L数据具有半结构化特性,使得面向XM L数据的数据挖掘不同于面向关系数据库的数据挖掘,它具有更复杂的层次结构。研究基于DOM树的XM L数据频繁模式挖掘算法,提出面向XM L数据的频繁模式增量式挖掘算法F reqtT ree。该算法首先将XM L数据转化成DOM树,然后从DOM树挖掘所有频繁模式。F reqtT ree算法采用最右扩展技术,只在树的最右分支上增加新结点生成新树。同时充分利用已生成的频繁模式信息,使得产生的候选模式数量较少。F reqtT ree算法利用频繁k-1模式的支持数计算候选k模式的支持数,该算法只对DOM树遍历一次,具有较高的效率。采用多组数据对此算法的性能进行检验,并与其他算法作对比实验,实验结果表明该算法高效可行。 展开更多
关键词 XML DOM树 频繁模式 增量式挖掘 数据挖掘
在线阅读 下载PDF
多分类-关联规则分类的一种改进算法 被引量:1
6
作者 赵传申 孙志挥 《应用科学学报》 CAS CSCD 北大核心 2005年第6期615-619,共5页
提出了一种基于多分类-关联规则的快速分类算法———FCMAR,该算法在建立频繁模式树(FP-tree)时裁减掉不能生成频繁规则的项目,因而可减少FP-tree的节点数目,有效地降低时间和空间复杂度,实验结果表明该算法是有效可行的.
关键词 数据挖掘 分类 关联分类 频繁模式树
在线阅读 下载PDF
通信网告警加权关联规则挖掘算法的研究 被引量:4
7
作者 李彤岩 肖海林 李兴明 《电子科技大学学报》 EI CAS CSCD 北大核心 2008年第6期807-810,共4页
关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,加权算法MINWAL(O)则需要多次扫描数据库,使得在通信网环境下挖掘关联规则... 关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,加权算法MINWAL(O)则需要多次扫描数据库,使得在通信网环境下挖掘关联规则的难度非常大。该文提出了一种高效的基于加权频繁模式树的通信网告警关联规则挖掘算法,算法性能测试表明,该算法与已有的加权关联规则挖掘算法相比较,节约了大量的存储空间,提高了算法的挖掘速度,对通信网的故障诊断和故障定位有着积极的意义。 展开更多
关键词 告警相关性分析 故障诊断 故障定位 加权关联规则 加权频繁模式树
在线阅读 下载PDF
一种基于混合搜索的高效Top-K最频繁模式挖掘算法 被引量:2
8
作者 敖富江 杜静 +1 位作者 陈彬 黄柯棣 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第2期90-93,共4页
挖掘数据集中的Top-K最频繁模式具有重要意义。已有Top-K最频繁模式挖掘算法通常采用最频繁的k个项目作为初始项目,并将初始项目中频率最低的项目的支持度作为初始边界支持度。但实际组成Top-K最频繁模式的项目数目可能远少于k,从而制... 挖掘数据集中的Top-K最频繁模式具有重要意义。已有Top-K最频繁模式挖掘算法通常采用最频繁的k个项目作为初始项目,并将初始项目中频率最低的项目的支持度作为初始边界支持度。但实际组成Top-K最频繁模式的项目数目可能远少于k,从而制约了算法的效率。为此,提出了一种基于混合搜索方式的高效Top-K最频繁模式挖掘算法MTKFP。该算法首先利用宽度优先搜索获得少量的短项集,并利用短项集确定数目少于k的初始项目范围以及较高的初始边界支持度;然后利用深度优先搜索获得所有Top-K最频繁模式。实验表明,MTKFP算法所获得的初始项目数目至少低于已有算法70%,初始边界支持度高于已有算法;MTKFP算法的性能优于已有最好算法。 展开更多
关键词 Top-K最频繁模式 边界支持度 混合搜索 fp-tree
在线阅读 下载PDF
分布式存储结构的频繁闭合模式挖掘并行算法 被引量:3
9
作者 缪裕青 尹东 《微电子学与计算机》 CSCD 北大核心 2007年第10期161-163,共3页
研究分布式存储结构下频繁闭合模式挖掘的并行化问题,针对频繁闭合模式的特点,提出了两阶段并行判断频繁模式闭合性的方法,基于串行算法FPclose和两种FP-tree的并行构造方式,分别给出了两个频繁闭合模式挖掘并行算法DP-FP和DL-FP,性能... 研究分布式存储结构下频繁闭合模式挖掘的并行化问题,针对频繁闭合模式的特点,提出了两阶段并行判断频繁模式闭合性的方法,基于串行算法FPclose和两种FP-tree的并行构造方式,分别给出了两个频繁闭合模式挖掘并行算法DP-FP和DL-FP,性能分析表明,这两个算法具有较大的并行化,较小的I/O开销与良好的负载平衡。 展开更多
关键词 关联规则 频繁模式 频繁闭合模式 fp-tree 并行算法
在线阅读 下载PDF
一种不产生候选集的最大频繁集快速挖掘算法 被引量:4
10
作者 杨君锐 赵群礼 《微电子学与计算机》 CSCD 北大核心 2004年第11期125-128,共4页
发现最大频繁(项目)集是关联规则挖掘中的重要问题。提出一个基于频繁模式树FP-Tree(FrequentPat鄄ternTree)的快速发现最大频繁项目集算法MFP-growth(MaximumFrequentPatterngrowth),其发现过程中不需要产生候选(项目)集,从而提高了挖... 发现最大频繁(项目)集是关联规则挖掘中的重要问题。提出一个基于频繁模式树FP-Tree(FrequentPat鄄ternTree)的快速发现最大频繁项目集算法MFP-growth(MaximumFrequentPatterngrowth),其发现过程中不需要产生候选(项目)集,从而提高了挖掘效率。由实验结果表明,此算法在发现最大频繁项目集方面具有很好的性能。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 频繁模式树
在线阅读 下载PDF
最大频繁模式的挖掘算法 被引量:6
11
作者 徐欣 阮幼林 《舰船电子工程》 2009年第3期102-106,共5页
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。采用Apriori类的候选生成-检验方法或基于FP-Tree的挖掘方法需要产生大量候选或动态创建大量条件模式树,代价太高。因此,提出一种挖掘最大频繁模式的新算法。该算法利用前缀树压缩存... 挖掘最大频繁模式是多种数据挖掘应用中的关键问题。采用Apriori类的候选生成-检验方法或基于FP-Tree的挖掘方法需要产生大量候选或动态创建大量条件模式树,代价太高。因此,提出一种挖掘最大频繁模式的新算法。该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,既不需要生成候选也不需要创建条件模式树,提高了挖掘效率。 展开更多
关键词 最大频繁模式 fp-tree前缀树
在线阅读 下载PDF
一种高效挖掘高维数据的频繁闭合模式算法 被引量:1
12
作者 胡孔法 唐小丽 +1 位作者 达庆利 陈崚 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第4期569-573,共5页
为了克服传统高维数据挖掘频繁闭合模式算法迭代产生子表,引起算法执行时间长和存储开销大等问题,提出了一种高效挖掘高维数据的频繁闭合模式的算法EMHCP.EMHCP算法采用一种新型结构位图表来压缩存储数据,在仅扫描数据库一次后,建立位... 为了克服传统高维数据挖掘频繁闭合模式算法迭代产生子表,引起算法执行时间长和存储开销大等问题,提出了一种高效挖掘高维数据的频繁闭合模式的算法EMHCP.EMHCP算法采用一种新型结构位图表来压缩存储数据,在仅扫描数据库一次后,建立位图转换表.根据位图转换表来构建混合树结构,采用深度优先的方式和有效的剪枝策略高效挖掘出所有的闭合模式.从而有效地缩小了搜索空间,加快了处理速度.通过在生物数据库应用的实验结果表明,EMH-CP算法比已有的CARPENTER和TD-close等算法更为有效. 展开更多
关键词 数据挖掘 频繁闭合模式 行枚举 混合树
在线阅读 下载PDF
考虑数据不确定性的非均匀挖掘算法 被引量:2
13
作者 刘竹松 陈洁 《华侨大学学报(自然科学版)》 CAS 北大核心 2016年第3期308-311,共4页
针对高维大数据不确定性的非均匀挖掘问题,提出一种基于不确定频繁模式树的模糊逻辑非均匀数据挖掘算法.首先,在考虑数据不确定性的前提下建立高维数据的区域连接演算(RCC)模型,并基于数据集合组元定义分析不确定数据集合的模糊距离;然... 针对高维大数据不确定性的非均匀挖掘问题,提出一种基于不确定频繁模式树的模糊逻辑非均匀数据挖掘算法.首先,在考虑数据不确定性的前提下建立高维数据的区域连接演算(RCC)模型,并基于数据集合组元定义分析不确定数据集合的模糊距离;然后,采用不确定模式树对数据的非均匀特性进行均匀泛化处理,并给出了具体的实现步骤.仿真结果表明:文中方法有效地提升不确定非均匀数据集合在不同支持度情况下的挖掘效率. 展开更多
关键词 高维大数据 数据挖掘 模糊逻辑 不确定频繁模式树 区域连接演算
在线阅读 下载PDF
一种分布环境中最大频繁项目集挖掘算法 被引量:1
14
作者 李忠哗 何丕廉 《微电子学与计算机》 CSCD 北大核心 2006年第9期162-164,共3页
挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法... 挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP-tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度。采用传递侯选最大频繁项目集的方法。实验表明该算法是有效的并行算法。 展开更多
关键词 分布数据库 数据挖掘 最大频繁项目集 频繁模式树
在线阅读 下载PDF
频繁子树模式在中心词识别中的应用研究 被引量:1
15
作者 田卫东 黄勇 《微电子学与计算机》 CSCD 北大核心 2015年第11期27-32,共6页
中文问句中心词识别领域中,现有方法未能有效利用依存句法中的深层统计关系.为解决此问题并探究中心词在词的多维属性上的统计关系,首次提出多维树概念,给出多维频繁模式挖掘方案并应用于中文问句中心词识别中.针对此应用给出频繁子树... 中文问句中心词识别领域中,现有方法未能有效利用依存句法中的深层统计关系.为解决此问题并探究中心词在词的多维属性上的统计关系,首次提出多维树概念,给出多维频繁模式挖掘方案并应用于中文问句中心词识别中.针对此应用给出频繁子树模式精简及规则冲突解决方案,训练出一个中文中心词识别模型.此方法是典型的客观方法,实验表明,此方法有较好的稳定性、适应性与鲁棒性,且较条件随机场模型在准确率上有进一步提高. 展开更多
关键词 条件随机场 依存关系树 频繁子树模式 模式精简 规则冲突 中心词
在线阅读 下载PDF
基于最大频繁项集的聚类算法 被引量:1
16
作者 张伟 张泽洪 《江南大学学报(自然科学版)》 CAS 2007年第3期288-292,共5页
鉴于高维数据的稀疏性和分类数据特点,探讨了专门针对高维分类数据的聚类方法.首先将原始数据集转换成频繁项集,再通过改造频繁模式树以及给出的剪切策略,挖掘出事务的最大频繁项集,并基于最大频繁项集(MFI)的两个属性,将具有相同MFI的... 鉴于高维数据的稀疏性和分类数据特点,探讨了专门针对高维分类数据的聚类方法.首先将原始数据集转换成频繁项集,再通过改造频繁模式树以及给出的剪切策略,挖掘出事务的最大频繁项集,并基于最大频繁项集(MFI)的两个属性,将具有相同MFI的对象归于一类,由此提出了基于最大频繁项集的聚类算法.通过对分类数据集的实验,表明该算法具有相当的稳定性、健壮性和有效性. 展开更多
关键词 高维分类数据 最大频繁项集 频繁模式树 投影聚类算法
在线阅读 下载PDF
基于关联规则挖掘的车辆故障码分析 被引量:1
17
作者 胡杰 耿號 +2 位作者 李源洁 耿黄政 童敏敏 《汽车工程》 EI CSCD 北大核心 2023年第4期699-707,共9页
本文中基于车载诊断原理,将车载自诊断过程产生和保存的故障码(diagnostic trouble codes,DTC)分析与关联规则挖掘相结合,提出适用于挖掘故障码数据关联的改进FP-Tree算法,并根据得到的关联规则建立整车故障码关联图,将其应用于历史数... 本文中基于车载诊断原理,将车载自诊断过程产生和保存的故障码(diagnostic trouble codes,DTC)分析与关联规则挖掘相结合,提出适用于挖掘故障码数据关联的改进FP-Tree算法,并根据得到的关联规则建立整车故障码关联图,将其应用于历史数据分析流程与车辆维修流程。挖掘数据中有趣关联规则,提供关联可视化结果;对维修过程读取的驳杂故障码进行分析,减小故障码复杂性,分析主要故障码,缩短基于故障码的检修时间,协助维修人员定位故障。 展开更多
关键词 故障码 关联规则 频繁模式树 主要故障码分析
在线阅读 下载PDF
半结构化文档数据流的快速频繁模式挖掘
18
作者 赵传申 孙志挥 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第3期452-456,共5页
为了提高半结构化文档数据流的挖掘效率,对原有挖掘算法StreamT进行了改进,提出了一种半结构化文档数据流的快速频繁模式挖掘算法———FStreamT.该算法针对利用集合存储候选频繁模式效率较低的缺点,采用枚举树存储候选频繁模式,可以有... 为了提高半结构化文档数据流的挖掘效率,对原有挖掘算法StreamT进行了改进,提出了一种半结构化文档数据流的快速频繁模式挖掘算法———FStreamT.该算法针对利用集合存储候选频繁模式效率较低的缺点,采用枚举树存储候选频繁模式,可以有效地提高对候选频繁模式集合进行查找和更新的效率,同时利用频繁模式的单调性和枚举树的特点减小了维护负边界的搜索空间,从而提高了整个算法的效率.理论分析和实验结果表明,算法FStreamT与算法StreamT相比具有较高的效率,是有效可行的. 展开更多
关键词 数据挖掘 频繁模式 数据流 枚举树
在线阅读 下载PDF
一种基于哈夫曼树的最大频繁序列挖掘算法
19
作者 胡枫 金远平 《微电子学与计算机》 CSCD 北大核心 2008年第8期13-16,21,共5页
最大频繁序列挖掘是数据挖掘的重要内容之一.在深入分析频繁序列特点以及已有序列挖掘算法的基础上,提出一种新的最大序列挖掘算法Huffman-MaxSeq.与传统的"候选最大频繁序列集生成——测试"思路不同,该算法采用"边生成... 最大频繁序列挖掘是数据挖掘的重要内容之一.在深入分析频繁序列特点以及已有序列挖掘算法的基础上,提出一种新的最大序列挖掘算法Huffman-MaxSeq.与传统的"候选最大频繁序列集生成——测试"思路不同,该算法采用"边生成候选序列边测试"的思想,从而有效地减少了候选序列的生成.该算法基于构造哈夫曼树(最优树)的方法,对每个序列赋予权值,按权值的大小选取序列,连接生成新的候选频繁序列,再产生最大频繁序列. 展开更多
关键词 数据挖掘 序列模式 最大频繁序列 哈夫曼树
在线阅读 下载PDF
基于单次扫描无构造调节的频繁模式挖掘算法
20
作者 刘芝怡 《科技通报》 北大核心 2014年第6期119-121,共3页
研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利... 研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利用编码模式树存储事务数据库中的频繁项集信息,构建FP数组,加快产生频繁项集,引入CPT-Mine算法,快速地挖掘数据库中所包含的频繁项集,无需递归构造条件模式树,只需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法能缩短挖掘时间3~10 s,空间效率提高43%。 展开更多
关键词 频繁项集 编码模式树 素数编码
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部