期刊文献+
共找到153篇文章
< 1 2 8 >
每页显示 20 50 100
基于改进FP-tree的最大频繁项目集挖掘算法 被引量:9
1
作者 马丽生 姚光顺 杨传健 《计算机应用》 CSCD 北大核心 2012年第2期326-329,共4页
针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存... 针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存条件模式基的存储空间开销。在分析最大频繁项目集挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率。最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性。实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍。 展开更多
关键词 频繁项目集 最大频繁项目集 条件模式基 项头表 剪枝策略 压缩策略
在线阅读 下载PDF
一种基于频繁模式树的最大频繁项目集挖掘算法 被引量:6
2
作者 任永功 张亮 付玉 《小型微型计算机系统》 CSCD 北大核心 2010年第2期317-321,共5页
目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位... 目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位图建树的方法有效的减少了扫描数据库的次数,从而节省了CPU的执行时间.另外,此算法运用独特的最大频繁项目集判断策略,同时运用投影技术进行超集检测,提高了遍历的效率,实验结果表明该算法是快速有效的. 展开更多
关键词 频繁项目集 最大频繁项目集 频繁模式树 深度优先搜索
在线阅读 下载PDF
基于FPMAX的最大频繁项目集挖掘改进算法 被引量:9
3
作者 牛新征 佘堃 《计算机科学》 CSCD 北大核心 2013年第12期223-228,共6页
挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree... 挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree构造开销。而且在支持度较低时,FPMAX则会因用于超集检测的全局MFItree较为庞大而导致超集检测的性能下降。为此提出FPMAX的改进算法FPMAX-reduce,其通过采用基于事务共同后缀的前瞻剪枝策略来减少挖掘过程中的冗余递归过程。当递归过程中产生的新条件FP-tree规模较小时,FPMAX-reduce通过构造条件MFI-tree来减小后续超集检测遍历的开销。性能试验表明,FPMAX-reduce算法通过有效的前瞻剪枝,在稠密事务数据库以及低支持度的情况下至多可将递归过程减少至原算法的一半以下,进而有效地提高了FPMAX算法的效率。 展开更多
关键词 频繁项目集 最大频繁项目集 FP-TREE FPMAX FP-GROWTH
在线阅读 下载PDF
基于FP-tree的最大频繁项目集挖掘算法 被引量:4
4
作者 马丽生 邓辉文 齐逸 《计算机工程与设计》 CSCD 北大核心 2008年第2期385-388,共4页
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使... 最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使用投影的方法对超集检测进行了优化,减少了项目匹配的次数。最后实验结果表明,该算法在性能上优于已有的同类算法。 展开更多
关键词 数据挖掘 关联规则 频繁项目集 最大频繁项目集 频繁模式树
在线阅读 下载PDF
一种改进的基于FP-Tree的高效挖掘最大频繁项目集算法 被引量:8
5
作者 尹治华 张大鹏 +1 位作者 谭明 王新生 《济南大学学报(自然科学版)》 北大核心 2017年第2期111-117,共7页
为了解决最大频繁项目集算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集维数较大而最大频繁项目集维数较小的情况下产生大量候选项目集的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大频繁... 为了解决最大频繁项目集算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集维数较大而最大频繁项目集维数较小的情况下产生大量候选项目集的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大频繁项目集挖掘的FP-EMFIA算法;该算法在挖掘过程中根据项目头表,采用自上而下和自下而上的双向搜索策略,并通过条件模式基中的频繁项目和较小维数的非频繁项目集对候选项目集进行降维和剪枝,以减少候选项目集的数量,加速对候选集计数的操作。在经典数据集mushroom、chess和connect上的实验结果表明,FP-EMFIA算法在支持度较小时的时间效率优于DMFIA、IDMFIA(improved algorithm of DMFIA)和BDRFI(algorithm for mining frequent itemsets based on decreasing dimensionality reduction of frequent itemsets)算法的,说明FP-EMFIA算法在候选项目集维数较大时有相对优势。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 频繁模式树 频繁项目集
在线阅读 下载PDF
快速挖掘频繁项目集算法 被引量:6
6
作者 马丽生 《计算机工程与设计》 CSCD 北大核心 2009年第8期1903-1906,共4页
频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上,提出了一种能够快速挖掘频繁项目集的算法,对频繁项目集挖掘的搜索空间以及数据表示进行了优化,缩小搜索空间和数据表示的规模,减少计算项目集支持数的时间,... 频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上,提出了一种能够快速挖掘频繁项目集的算法,对频繁项目集挖掘的搜索空间以及数据表示进行了优化,缩小搜索空间和数据表示的规模,减少计算项目集支持数的时间,提高算法的执行效率,实验结果表明,该算法在性能上优于FP-Growth算法。 展开更多
关键词 数据挖掘 频繁项目集 关联规则 频繁项目集 频繁模式树
在线阅读 下载PDF
快速开采最大频繁项目集 被引量:5
7
作者 宋海声 《计算机应用研究》 CSCD 北大核心 2004年第3期45-46,共2页
对Pincer Search进行了改进,提出了一种新的发现最大频繁项目集的WDMFS算法。由于WDMFS算法采用了位阵存储技术和自底向上、自顶向下双向搜索策略,从而进一步提高了算法的效率,显著降低了系统的I/O成本和CPU时间。
关键词 数据挖掘 关联规则 频繁项目集 最大频繁项目集 位阵 合枚举树
在线阅读 下载PDF
一种基于F-矩阵的最大频繁项目集快速挖掘算法 被引量:1
8
作者 杨萍 《计算机工程与应用》 CSCD 北大核心 2003年第34期197-200,共4页
最大频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,最大频繁项目集的快速挖掘算法研究是当前研究的热点。传统的最大频繁项目集挖掘算法要多遍扫描数据库并产生大量的候选项目集。为此,该文提出了基于F-矩阵的最大频繁项目集快... 最大频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,最大频繁项目集的快速挖掘算法研究是当前研究的热点。传统的最大频繁项目集挖掘算法要多遍扫描数据库并产生大量的候选项目集。为此,该文提出了基于F-矩阵的最大频繁项目集快速挖掘算法FMMFIBFM,FMMFIBFM采用FP-tree的存储结构,仅须扫描数据库两遍且不产生候选频繁项目集,有效地提高了频繁项目集的挖掘效率。实验结果表明,FMMFIBFM算法是有效可行的。 展开更多
关键词 数据挖掘 频繁模式树 频繁项目集 关联规则 最大频繁项目集
在线阅读 下载PDF
基于准频繁项目集的关联规则挖掘
9
作者 赵旭俊 闫宏印 +1 位作者 吴广平 董晓丽 《太原理工大学学报》 CAS 北大核心 2005年第4期412-415,共4页
为减少关联规则挖掘中数据库扫描次数,提出了一种基于准频繁项目集的关联规则挖掘算法———SupposedFrequent,同时给出了候选频繁项目集的产生函数———BGen.最后通过实验证明:在给定最好的准频繁项目集的条件下,只需扫描数据库两次... 为减少关联规则挖掘中数据库扫描次数,提出了一种基于准频繁项目集的关联规则挖掘算法———SupposedFrequent,同时给出了候选频繁项目集的产生函数———BGen.最后通过实验证明:在给定最好的准频繁项目集的条件下,只需扫描数据库两次就能产生全部的频繁项目集。 展开更多
关键词 关联规则 频繁项目集 覆盖率 频繁项目集
在线阅读 下载PDF
建立频繁项目集向量的极大频繁项目集挖掘
10
作者 周海岩 《系统工程与电子技术》 EI CSCD 北大核心 2009年第10期2497-2500,共4页
在分析和研究诸多经典关联规则挖掘算法或最大频繁项目集挖掘算法的基础上,提出了一种新的极大频繁项目集挖掘算法BOFPV_MMFIA算法。该算法引入频繁项目集向量FP-V,将极大频繁项目集的挖掘过程转化为频繁项目集向量FP-V的与运算过程。... 在分析和研究诸多经典关联规则挖掘算法或最大频繁项目集挖掘算法的基础上,提出了一种新的极大频繁项目集挖掘算法BOFPV_MMFIA算法。该算法引入频繁项目集向量FP-V,将极大频繁项目集的挖掘过程转化为频繁项目集向量FP-V的与运算过程。算法只需扫描数据库一次,克服了Apriori及其相关算法产生大量候选集和需多次扫描数据库的缺点。又不同于BOM算法,挖掘频繁k_项目集时,需要进行km次k个向量的与运算。因此,BOFPV_MMFIA算法的效率明显高于Apriori、DMFIA及BOM算法。 展开更多
关键词 数据挖掘 关联规则 极大频繁项目集 频繁项目集向量
在线阅读 下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
11
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
在线阅读 下载PDF
最大频繁项目集的快速更新 被引量:47
12
作者 吉根林 杨明 +1 位作者 宋余庆 孙志挥 《计算机学报》 EI CSCD 北大核心 2005年第1期128-135,共8页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题 .为克服基于Apriori的最大频繁项目集挖掘算法存在的不足 ,DMFIA采用FP tree存储结构及自顶向下的搜索策略 ,有效地提高了最大频繁项目集的挖掘效率 .但对于频繁项目多而最大频繁项... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题 .为克服基于Apriori的最大频繁项目集挖掘算法存在的不足 ,DMFIA采用FP tree存储结构及自顶向下的搜索策略 ,有效地提高了最大频繁项目集的挖掘效率 .但对于频繁项目多而最大频繁项目集维数相对较小的情况 ,DMFIA要经过多层搜索且在每一层产生大量的候选项目集 ,因而影响算法的执行效率 .为此 ,该文提出了DMFIA的改进算法IDMFIA(theImprovedalgorithmofDMFIA) .IDMFI A采用自顶向下和自底向上双向搜索策略 ,可尽早修剪掉较短最大频繁项目集的超集和较长最大频繁项目集的子集 .另外 ,该文还提出最大频繁项目集更新算法FUMFIA(FastUpdatingMaximumFrequentItemsetsAlgorithm) ,该算法充分利用已建立的FP tree和已挖掘的最大频繁项目集 ,可对已挖掘的最大频繁项目集进行高效维护 .实验结果表明 ,IDMFIA和FUMFIA可有效提高最大频繁项目集的挖掘和更新效率 . 展开更多
关键词 数据挖掘 频繁模式树 最大频繁项目集 更新
在线阅读 下载PDF
快速挖掘全局最大频繁项目集 被引量:27
13
作者 陆介平 杨明 +1 位作者 孙志挥 鞠时光 《软件学报》 EI CSCD 北大核心 2005年第4期553-560,共8页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.现行可用的最大频繁项目集挖掘算法大多基于单机环境,针对分布式环境下的全局最大频繁项目集挖掘尚不多见.若将基于单机环境的最大频繁项目集挖掘算法运用于分布式环境,或运用分布式... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.现行可用的最大频繁项目集挖掘算法大多基于单机环境,针对分布式环境下的全局最大频繁项目集挖掘尚不多见.若将基于单机环境的最大频繁项目集挖掘算法运用于分布式环境,或运用分布式环境下的全局频繁项目集挖掘算法来挖掘全局最大频繁项目集,均会产生大量的候选频繁项目集,且网络通信代价高.为此,提出了快速挖掘全局最大频繁项目集算法FMGMFI(fast mining globalmaximum frequent itemsets),该算法采用FP-tree存储结构,可方便地从各局部FP-tree的相关路径中得到项目集的频度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通信代价.实验结果表明,FMGMF算法是有效、可行的. 展开更多
关键词 分布式数据库 数据挖掘 频繁模式树 全局最大频繁项目集
在线阅读 下载PDF
一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法 被引量:21
14
作者 宋余庆 朱玉全 +1 位作者 孙志挥 杨鹤标 《计算机研究与发展》 EI CSCD 北大核心 2005年第5期777-783,共7页
目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些... 目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些项目的布尔表达式约束条件,提出了一种快速的基于FPtree的约束最大频繁项目集挖掘算法CMFIMA,并对其更新问题进行了研究,提出了一种增量式更新约束最大频繁项目集挖掘算法CMFIUA. 展开更多
关键词 关联规则 项约束 最大频繁项目集 频繁模式树 增量式更新
在线阅读 下载PDF
快速挖掘全局频繁项目集 被引量:35
15
作者 杨明 孙志挥 吉根林 《计算机研究与发展》 EI CSCD 北大核心 2003年第4期620-626,共7页
分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为... 分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率 展开更多
关键词 数据挖掘 全局频繁项目集 频繁模式树 快速挖掘算法 布尔型关联规则 数据库 APRIORI算法
在线阅读 下载PDF
基于DDMINER分布式数据库系统中频繁项目集的更新 被引量:15
16
作者 吉根林 杨明 +1 位作者 赵斌 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1387-1392,共6页
给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项... 给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项目集的更新算法UGF .该算法能够产生较少数量的候选频繁项目集 ,在求解全局频繁项目集过程中 ,传送候选局部频繁项目集支持数的通信量为O(n) ;将文章提出的算法用Java语言加以实现 ,并对算法性能进行了研究 ;实验结果表明这些算法是正确、可行的 ,并且具有较高的效率. 展开更多
关键词 分布式数据库系统 频繁项目集 分布式数据挖掘系统 体系结构 DDMINER
在线阅读 下载PDF
快速开采最大频繁项目集 被引量:113
17
作者 路松峰 卢正鼎 《软件学报》 EI CSCD 北大核心 2001年第2期293-297,共5页
发现最大频繁项目集是多种数据开采应用中的关键问题 .提出一种快速开采最大频繁项目集的算法 DM-FI( discovery maximum frequent itemsets) .该算法把自底向上和自顶向下的搜索策略进行了合并 .通过其独特的排序方法和有效的剪枝策略 ... 发现最大频繁项目集是多种数据开采应用中的关键问题 .提出一种快速开采最大频繁项目集的算法 DM-FI( discovery maximum frequent itemsets) .该算法把自底向上和自顶向下的搜索策略进行了合并 .通过其独特的排序方法和有效的剪枝策略 ,大大减少了候选项目集的生成 ,从而显著地降低了 CPU时间 . 展开更多
关键词 数据开采 知识发现 关联规则 最大频繁项目集 数据库
在线阅读 下载PDF
快速更新全局频繁项目集 被引量:18
18
作者 杨明 孙志挥 宋余庆 《软件学报》 EI CSCD 北大核心 2004年第8期1189-1197,共9页
数据挖掘中的频繁项目集更新算法研究是重要的研究课题之一.目前已有的频繁项目集更新算法主要针对单机环境,有关分布式环境下的全局频繁项目集的更新算法的研究尚不多见.为此,提出了快速更新全局频繁项目集算法(fast updating algorith... 数据挖掘中的频繁项目集更新算法研究是重要的研究课题之一.目前已有的频繁项目集更新算法主要针对单机环境,有关分布式环境下的全局频繁项目集的更新算法的研究尚不多见.为此,提出了快速更新全局频繁项目集算法(fast updating algorithm for globally frequent itemsets,简称FUAGFI).该算法主要考虑数据库记录增加时全局频繁项目集的更新情况.FUAGFI利用已建立的各局部频繁模式树(frequent pattern tree,简称FP-tree)及已挖掘的全局频繁项目集,可有效地降低网络通信量,提高全局频繁项目集的更新效率.实验结果表明,所提出的更新算法是行之有效的. 展开更多
关键词 数据挖掘 分布式数据库 全局频繁项目集 频繁模式树(FP—tree) 更新
在线阅读 下载PDF
一种基于FP-Growth的频繁项目集并行挖掘算法 被引量:44
19
作者 章志刚 吉根林 《计算机工程与应用》 CSCD 2014年第2期103-106,共4页
FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式... FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式树,并对之进行挖掘得到局部频繁项目集,然后合并局部频繁项目集以得到全局频繁项集,由于此时得到的结果并不完备,所以对合并后未达到最小支持度阈值的项目集,重新计算其支持数。介绍了FPPM算法的设计思想,测试了其性能。实验结果表明FPPM算法具有较好的可扩展性。 展开更多
关键词 频繁项目集 并行挖掘 FP Growth MAP REDUCE
在线阅读 下载PDF
关联规则最大频繁项目集的快速发现算法 被引量:10
20
作者 刘大有 刘亚波 尹治东 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2004年第2期212-215,共4页
提出一种快速发现最大频繁项目集的算法,该算法对集合枚举树进行改进,结合自底向上与自顶向下的搜索策略,利用非频繁项目集对候选最大频繁项目集进行剪枝和降维,减少了不必要候选最大频繁项目集的数量,显著提高了发现的效率.
关键词 关联规则 最大频繁项目集 快速发现算法 合枚举树 自底向上 自顶向下 数据挖掘
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部