期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于FP-tree和约束概念格的关联规则挖掘算法及应用研究 被引量:27
1
作者 付冬梅 王志强 《计算机应用研究》 CSCD 北大核心 2014年第4期1013-1015,1019,共4页
现有的基于频繁模式树FP-tree和概念格的规则挖掘算法在构造概念格时存在重复遍历FP-tree问题,在挖掘后件约束的规则时算法构造的概念格包含冗余结点。针对这两个问题,提出了通过遍历FP-tree生成候选概念格节点的策略,并根据候选概念格... 现有的基于频繁模式树FP-tree和概念格的规则挖掘算法在构造概念格时存在重复遍历FP-tree问题,在挖掘后件约束的规则时算法构造的概念格包含冗余结点。针对这两个问题,提出了通过遍历FP-tree生成候选概念格节点的策略,并根据候选概念格节点进一步构造规则约束条件下无冗余概念格。通过实际项目中大气腐蚀数据进行算法的应用,结果表明该算法比现有算法具有更高的挖掘效率且腐蚀规则结果对材料腐蚀现状研究具有重要指导价值。 展开更多
关键词 规则挖掘 频繁模式树 约束概念格 材料腐蚀
在线阅读 下载PDF
基于FP-tree的最大频繁模式挖掘算法 被引量:18
2
作者 冯志新 钟诚 《计算机工程》 CAS CSCD 北大核心 2004年第11期123-124,共2页
在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明,算法FP-Max在挖掘密集型数据集方面是高效的。
关键词 数据挖掘 关联规则 频繁模式树 最大频繁模式
在线阅读 下载PDF
基于FP-Tree的快速选择性集成算法 被引量:6
3
作者 赵强利 蒋艳凰 徐明 《软件学报》 EI CSCD 北大核心 2011年第4期709-721,共13页
选择性集成通过选择部分基分类器参与集成,从而提高集成分类器的泛化能力,降低预测开销.但已有的选择性集成算法普遍耗时较长,将数据挖掘的技术应用于选择性集成,提出一种基于FP-Tree(frequent pattern tree)的快速选择性集成算法:CPM-E... 选择性集成通过选择部分基分类器参与集成,从而提高集成分类器的泛化能力,降低预测开销.但已有的选择性集成算法普遍耗时较长,将数据挖掘的技术应用于选择性集成,提出一种基于FP-Tree(frequent pattern tree)的快速选择性集成算法:CPM-EP(coverage based pattern mining for ensemble pruning).该算法将基分类器对校验样本集的分类结果组织成一个事务数据库,从而使选择性集成问题可转化为对事务数据集的处理问题.针对所有可能的集成分类器大小,CPM-EP算法首先得到一个精简的事务数据库,并创建一棵FP-Tree树保存其内容;然后,基于该FP-Tree获得相应大小的集成分类器.在获得的所有集成分类器中,对校验样本集预测精度最高的集成分类器即为算法的输出.实验结果表明,CPM-EP算法以很低的计算开销获得优越的泛化能力,其分类器选择时间约为GASEN的1/19以及Forward-Selection的1/8,其泛化能力显著优于参与比较的其他方法,而且产生的集成分类器具有较少的基分类器. 展开更多
关键词 集成学习 选择性集成 频繁模式树 BAGGING 误差反向传播神经网络
在线阅读 下载PDF
关联规则中FP-tree的最大频繁模式非检验挖掘算法 被引量:5
4
作者 惠亮 钱雪忠 《计算机应用》 CSCD 北大核心 2010年第7期1922-1925,共4页
基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使... 基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使挖掘过程中不需要生成条件频繁模式树也不需要超集检验。算法采用的预测剪枝策略减少了挖掘的次数,采用的求取公共交集的方式保证了挖掘结果的完整性。实验结果表明在支持度相对较小情况下,NCMFP的效率是同类算法的2~5倍。 展开更多
关键词 关联规则 数据挖掘 频繁模式树 最大频繁项集 超集检验
在线阅读 下载PDF
基于FP-tree的多层关联规则快速挖掘算法 被引量:2
5
作者 曹洪其 姜志峰 孙志挥 《计算机工程》 CAS CSCD 北大核心 2007年第19期66-68,71,共4页
研究了多层关联规则挖掘的理论和方法,提出了一种基于FP-tree的快速挖掘算法FAMML_FPT。该算法不仅实现了同层次关联规则的挖掘,也能实现跨层次关联规则的挖掘,其中引入了修补项、跨层修补项的概念,以便从低到高逐层建立FP-tree,有效减... 研究了多层关联规则挖掘的理论和方法,提出了一种基于FP-tree的快速挖掘算法FAMML_FPT。该算法不仅实现了同层次关联规则的挖掘,也能实现跨层次关联规则的挖掘,其中引入了修补项、跨层修补项的概念,以便从低到高逐层建立FP-tree,有效减少了扫描数据库的次数,且不用产生大量的候选项集,提高了数据挖掘的效率。 展开更多
关键词 数据挖掘 多层关联规则 频繁模式树 修补项
在线阅读 下载PDF
基于OWSFP-Tree的最大频繁项目集挖掘算法 被引量:5
6
作者 赵志刚 王芳 万军 《计算机工程与设计》 CSCD 北大核心 2013年第5期1687-1690,1807,共5页
为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前... 为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前都需要超集检验,利用项目表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 fp-tree 条件模式树
在线阅读 下载PDF
基于FP-Tree的QAR数据故障检测研究
7
作者 杨慧 赵兰草 《计算机应用与软件》 CSCD 北大核心 2014年第10期41-44,共4页
QAR(Quick Access Recorder)数据具有高维、复杂及数据量大的特性,严重影响数据处理效率。为降低其数据量与数据复杂性,高效检索并确定当前QAR数据是否是故障数据及其故障类型,首先通过PAA表示方法对QAR数据初步压缩,然后采用FP-Growth... QAR(Quick Access Recorder)数据具有高维、复杂及数据量大的特性,严重影响数据处理效率。为降低其数据量与数据复杂性,高效检索并确定当前QAR数据是否是故障数据及其故障类型,首先通过PAA表示方法对QAR数据初步压缩,然后采用FP-Growth算法思想对压缩后的数据创建FP-Tree并只保留其频繁前缀子树,最后通过子树匹配确定测试数据与故障模型数据之间的匹配度。采用真实的飞机飞行QAR数据验证了算法的有效性和准确度。 展开更多
关键词 频繁模式树 子树匹配 异常检测
在线阅读 下载PDF
快速挖掘全局频繁项目集 被引量:35
8
作者 杨明 孙志挥 吉根林 《计算机研究与发展》 EI CSCD 北大核心 2003年第4期620-626,共7页
分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为... 分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率 展开更多
关键词 数据挖掘 全局频繁项目集 频繁模式树 快速挖掘算法 布尔型关联规则 数据库 APRIORI算法
在线阅读 下载PDF
改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA 被引量:16
9
作者 杨鹏坤 彭慧 +1 位作者 周晓锋 孙玉庆 《计算机应用》 CSCD 北大核心 2015年第3期775-778,共4页
针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头... 针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头表,采用自底向上的搜索策略逐层挖掘最大频繁项目集,从而加速每次对候选集计数的操作。在挖掘时根据每层的条件模式基产生维数较低的非频繁项目集,尽早对候选项目集进行剪枝和降维,可大量减少候选项目集的数量。同时在挖掘时充分利用最大频繁项集的性质,减少搜索空间。通过算法在不同支持度下挖掘时间的对比可知,算法FP-MFIA在最小支持度较低的情况下时间效率是DMFIA以及基于降维的最大频繁模式挖掘算法(BDRFI)的2倍以上,说明FP-MFIA在候选集维数较高的时候优势明显。 展开更多
关键词 最大频繁项集 频繁模式树 数据挖掘 关联规则 非频繁项集
在线阅读 下载PDF
基于频繁模式树的约束最大频繁项集挖掘算法 被引量:15
10
作者 花红娟 张健 陈少华 《计算机工程》 CAS CSCD 北大核心 2011年第9期78-80,共3页
多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖... 多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖掘效率。实验结果证明,该算法的效率优于同类算法。 展开更多
关键词 数据挖掘 最大频繁项集 约束最大频繁项集 频繁模式树 项约束
在线阅读 下载PDF
一种基于前缀广义表的关联规则增量式更新算法 被引量:23
11
作者 杨明 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1318-1325,共8页
关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG ... 关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG List,并提出了基于PG List的关联规则挖掘 (MARBPGL)与增量式更新算法(IUABPGL) .算法MARBPGL仅须扫描数据库两遍 ,算法IUABPGL在最坏的情况下仅须扫描原数据库一遍 ,扫描新增数据库两遍 ,且两个算法均无须生成候选项目集 ,避免了产生“知识的组合爆炸” ,提高了挖掘和维护的效率 .理论分析和实验结果表明该文提出的算法是有效可行的 . 展开更多
关键词 关联规则 增量式更新算法 前缀广义表 数据挖掘 频繁模式树 数据库 APRIORI算法
在线阅读 下载PDF
一种基于前缀树的频繁模式挖掘算法 被引量:4
12
作者 朱光喜 吴伟民 +1 位作者 阮幼林 刘干 《计算机科学》 CSCD 北大核心 2005年第4期34-36,共3页
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出... 挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。 展开更多
关键词 频繁模式 挖掘算法 前缀 关键步骤 数据挖掘 候选项集 动态维护 挖掘过程 时空效率 相关信息 深度优先 数据结构 新算法 中节点 递归
在线阅读 下载PDF
关联规则中基于降维的最大频繁模式挖掘算法 被引量:13
13
作者 钱雪忠 惠亮 《计算机应用》 CSCD 北大核心 2011年第5期1339-1343,共5页
基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、产生大量候选最大频繁项集等问题,在分析FPM ax、DMFIA算法的基础上,提出基于降维的最大频繁模式挖掘算法(BDRFI)。该算... 基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、产生大量候选最大频繁项集等问题,在分析FPM ax、DMFIA算法的基础上,提出基于降维的最大频繁模式挖掘算法(BDRFI)。该算法改传统的FP-tree为数字频繁模式树DFP-tree,提高了超集检验的效率;采用的预测剪枝策略减少了挖掘的次数;基于降低项集维度的挖掘方式,减少了候选项的数目,避免了递归地产生条件频繁模式树,提高了算法的效率。实验结果表明,BDRFI的效率是同类算法的2~8倍。 展开更多
关键词 关联规则 数据挖掘 最大频繁项集 频繁模式树 降维
在线阅读 下载PDF
特定数据最大频繁集挖掘算法 被引量:3
14
作者 王华 胡学钢 田卫东 《计算机工程》 CAS CSCD 北大核心 2008年第14期63-65,共3页
针对在某些限定项目数与交易长度数据的关联规则挖掘中FP-growth算法执行效率很低的问题,提出一种最大频繁模式挖掘算法,该算法引入与FP-tree结构类似的All-subsettree存储所有的最大频繁项目集,无需在扫描数据库前指定最小支持度,可以... 针对在某些限定项目数与交易长度数据的关联规则挖掘中FP-growth算法执行效率很低的问题,提出一种最大频繁模式挖掘算法,该算法引入与FP-tree结构类似的All-subsettree存储所有的最大频繁项目集,无需在扫描数据库前指定最小支持度,可以动态给定最小支持度而不用重新扫描数据库。实验结果表明,该算法在这些特定数据的挖掘中,与FP-growth相比明显提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式树 最大频繁项目集
在线阅读 下载PDF
最大目标频繁模式挖掘算法研究 被引量:2
15
作者 李清勇 秦亮曦 +1 位作者 施智平 史忠植 《计算机工程与应用》 CSCD 北大核心 2004年第33期184-188,共5页
传统的频繁模式挖掘算法往往会得到成百上千的结果模式,面对繁多的频繁模式用户通常要经过“二次挖掘”才能得到有用的目标模式。怎样根据用户需求直接挖掘用户感兴趣的目标模式是该文的研究目标。文章在FP-树的基础上设计了紧缩的、非... 传统的频繁模式挖掘算法往往会得到成百上千的结果模式,面对繁多的频繁模式用户通常要经过“二次挖掘”才能得到有用的目标模式。怎样根据用户需求直接挖掘用户感兴趣的目标模式是该文的研究目标。文章在FP-树的基础上设计了紧缩的、非冗余的TFP-树,它能有效过滤与目标模式无关的项和事务,而仅保留与目标模式相关的信息,缩小TFP-树的大小规模。同时根据TFP-树的规律和特点,笔者设计了最大目标频繁模式挖掘算法,算法的结果模式具有以下两个特点:(1)满足用户需求的目标模式;(2)最大模式。该实验结果验证了TFP-树算法是有效的,而且显著改善了FP-树算法的性能。 展开更多
关键词 数据挖掘 频繁模式 最大目标频繁模式 TFP-树 FP-树
在线阅读 下载PDF
最大频繁模式的快速挖掘与更新算法 被引量:3
16
作者 阮幼林 李庆华 刘干 《计算机工程与应用》 CSCD 北大核心 2005年第24期23-26,143,共5页
挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文... 挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文章提出了一种最大频繁模式的快速挖掘算法DMFP及更新算法IUMFP。DMFP算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。算法IUMFP充分利用以前的挖掘结果减少发现更新数据中新的最大频繁模式的代价。 展开更多
关键词 最大频繁模式 fp-tree 前缀树 数据挖掘
在线阅读 下载PDF
一种最大频繁模式的快速挖掘算法 被引量:3
17
作者 王运鹏 胡修林 阮幼林 《计算机应用研究》 CSCD 北大核心 2006年第10期86-88,共3页
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大... 挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。 展开更多
关键词 最大频繁模式 fp-tree 前缀树 数据挖掘
在线阅读 下载PDF
基于频繁模式树的一种关联规则挖掘算法及其在铁路隧道安全管理中的应用 被引量:9
18
作者 徐维祥 苏晓军 《中国安全科学学报》 CAS CSCD 2007年第3期25-32,共8页
关联规则的FP-growth算法是数据挖掘中性能较好的一种算法,笔者在分析该算法的基础上进行改造探讨,并提出了一种基于FP-tree的高性能关联规则挖掘算法FP-growthN,该新算法特别适合对那些数据量很大但数据项很稀疏的数据进行挖掘。将新... 关联规则的FP-growth算法是数据挖掘中性能较好的一种算法,笔者在分析该算法的基础上进行改造探讨,并提出了一种基于FP-tree的高性能关联规则挖掘算法FP-growthN,该新算法特别适合对那些数据量很大但数据项很稀疏的数据进行挖掘。将新算法用于挖掘铁路隧道各病害的关联中,通过对成都铁路局管辖的2005年的2787条隧道病害数据的343条重点隧道有效病害数据的关联分析,得出了各隧道病害之间隐藏着的关系。新法的提出及其应用结果对铁路部门制定检测标准和防治隧道病害有一定的指导作用。 展开更多
关键词 数据挖掘 关联规则 频繁项集 频繁模式树 频繁模式增长 隧道病害
在线阅读 下载PDF
基于IS~±树模型的频繁模式挖掘 被引量:3
19
作者 马海兵 张成洪 +1 位作者 张锦 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2005年第4期588-593,共6页
IS-树是一种新型的全文存储索引模型.提出一种基于扩展I-S树模型的频繁模式挖掘算法.和FPgrowth方法一样,算法直接构造频繁项集,不进行Apriori算法所采用的代价很高的候选集产生与测试操作.然而它比FP-树模型具有更多的优点:只需扫描一... IS-树是一种新型的全文存储索引模型.提出一种基于扩展I-S树模型的频繁模式挖掘算法.和FPgrowth方法一样,算法直接构造频繁项集,不进行Apriori算法所采用的代价很高的候选集产生与测试操作.然而它比FP-树模型具有更多的优点:只需扫描一遍事务库;挖掘任务只局部关联于一棵根树;动态更新性好,仅做增量变化.实验表明,其具有与FP-growth算法相当甚至更高的效率.更重要的是,IS+树模型同时是一种事务库的良好索引形式,具有高效支持事务查询的能力. 展开更多
关键词 频繁模式 APRIORI算法 FP—growth算法 IS-树 IS^+-树
在线阅读 下载PDF
分布式数据库多层关联规则挖掘算法研究 被引量:1
20
作者 曹洪其 姜志峰 孙志挥 《计算机应用》 CSCD 北大核心 2005年第12期2858-2861,共4页
对分布式数据库多层关联规则挖掘的理论和方法进行了研究,提出了一种基于频繁模式树FP-tree(FreguentPatterntree)的快速挖掘算法DMAML_FPT(DistributedMiningAlgorithmofMultipleLevelbasedonFP-tree)。与类Apriori算法相比较,该算法... 对分布式数据库多层关联规则挖掘的理论和方法进行了研究,提出了一种基于频繁模式树FP-tree(FreguentPatterntree)的快速挖掘算法DMAML_FPT(DistributedMiningAlgorithmofMultipleLevelbasedonFP-tree)。与类Apriori算法相比较,该算法最多只需扫描数据库三遍,不需产生和传输大量的候选项集,减少了数据通信量,从而提高了数据挖掘的效率。实验结果表明算法DMAML_FPT是可行和有效的。 展开更多
关键词 数据挖掘 分布式数据库 多层关联规则 频繁模式树
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部