期刊文献+
共找到1,527篇文章
< 1 2 77 >
每页显示 20 50 100
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响 被引量:25
1
作者 陆楠 王喆 周春光 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2003年第2期180-185,共6页
通过对两个有代表性的算法Apriori和FP-Growth的剖析,说明频集模式挖掘的过程,比较有候选项集产生和无候选项集产生算法的特点,并给出FP-tree结构的构造方法以及对挖掘关联规则的影响,提出了对算法的改进方法.
关键词 数据挖掘 关联规则 频繁项集 无候选项集 fp-tree频集模式 FP-GROWTH算法
在线阅读 下载PDF
基于磁盘表存储FP-TREE的关联规则挖掘算法 被引量:14
2
作者 申彦 宋顺林 朱玉全 《计算机研究与发展》 EI CSCD 北大核心 2012年第6期1313-1322,共10页
随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据... 随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据结构,提出了一种新颖的基于磁盘表的DTRFP-GROWTH(disk table resident FP-TREE growth)算法.该算法利用磁盘表存储FP-TREE,降低内存使用,在传统FP-GROWTH算法占用过多内存、挖掘工作无法进行时,以独特的磁盘表存储FP-TREE技术,减少内存使用,能够继续完成挖掘工作,适合空间性能优先的场合.不仅如此,该算法还将关联规则挖掘和关系型数据库整合,克服了基于文件系统相关算法效率较低、开发难度较大等问题.在真实数据集上进行了验证实验以及性能分析.实验结果表明,在内存空间有限的情况下,DTRFP-GROWTH算法是一种有效的基于磁盘的关联规则挖掘算法. 展开更多
关键词 fp-tree 关联规则 磁盘存储 频繁项目集 DTRFP-GROWTH算法 FP-GROWTH算法 数据挖掘
在线阅读 下载PDF
基于有序FP-tree的最大频繁项集挖掘算法 被引量:5
3
作者 李少华 吕志旺 +1 位作者 车德勇 周宁 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期65-69,共5页
通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析... 通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析和实验数据发现MMFI算法比传统算法快速、合理. 展开更多
关键词 数据挖掘 fp-tree 最大频繁项集 关联规则
在线阅读 下载PDF
基于OWSFP-Tree的最大频繁项目集挖掘算法 被引量:5
4
作者 赵志刚 王芳 万军 《计算机工程与设计》 CSCD 北大核心 2013年第5期1687-1690,1807,共5页
为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前... 为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前都需要超集检验,利用项目表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 fp-tree 条件模式树
在线阅读 下载PDF
对FP-Tree头表节点数据结构的改进 被引量:3
5
作者 邓砚谷 王丽珍 《计算机工程与应用》 CSCD 北大核心 2004年第25期176-178,共3页
关联数据挖掘中的FP-growth算法是不产生候选集的代表,可是当在FP-tree中找到与头表(HeaderTable)有相同的项(Item)时,必须回到头表中,一个一个找出最后一个Node_link所指的项,再将其加入。这样就降低了算法的效率。该文通过在频繁模式... 关联数据挖掘中的FP-growth算法是不产生候选集的代表,可是当在FP-tree中找到与头表(HeaderTable)有相同的项(Item)时,必须回到头表中,一个一个找出最后一个Node_link所指的项,再将其加入。这样就降低了算法的效率。该文通过在频繁模式树(FP-Tree)头表的数据结构中增加一个tail链域,这样就不需要每次都从头查找,而只须直接找tail域即可。实验证明改进后的算法比FP-growth算法的性能有很大提高。 展开更多
关键词 数据挖掘 关联规则 fp-tree
在线阅读 下载PDF
Mining association rule efficiently based on data warehouse 被引量:3
6
作者 陈晓红 赖邦传 罗铤 《Journal of Central South University of Technology》 2003年第4期375-380,共6页
The conventional complete association rule set was replaced by the least association rule set in data warehouse association rule mining process. The least association rule set should comply with two requirements: 1) i... The conventional complete association rule set was replaced by the least association rule set in data warehouse association rule mining process. The least association rule set should comply with two requirements: 1) it should be the minimal and the simplest association rule set; 2) its predictive power should in no way be weaker than that of the complete association rule set so that the precision of the association rule set analysis can be guaranteed. By adopting the least association rule set, the pruning of weak rules can be effectively carried out so as to greatly reduce the number of frequent itemset, and therefore improve the mining efficiency. Finally, based on the classical Apriori algorithm, the upward closure property of weak rules is utilized to develop a corresponding efficient algorithm. 展开更多
关键词 data mining association rule mining COMPLETE association rule SET least association rule SET
在线阅读 下载PDF
转换时间数据流的加权FP-Tree挖掘算法 被引量:4
7
作者 宋军 陈潇君 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第3期330-335,共6页
数据流中的数据分布随着时间动态变化.为了解决传统基于事务的挖掘算法较难建立时间特征和关系特征的相关性,事务和时间作为不同维度的基本单元耗费较高数据存储量的问题,基于事务的FP-Tree挖掘算法,提出了时间间断度的概念.引入了FP-T... 数据流中的数据分布随着时间动态变化.为了解决传统基于事务的挖掘算法较难建立时间特征和关系特征的相关性,事务和时间作为不同维度的基本单元耗费较高数据存储量的问题,基于事务的FP-Tree挖掘算法,提出了时间间断度的概念.引入了FP-Tree结点权重的概念,将时间数据进行动态转换,设计了基于加权FP-Tree的挖掘算法,对时间数据流关联规则挖掘.在实际数据集上完成了挖掘试验.结果表明,该算法相对传统FP-Growth算法能在计算效率降低约20%的情况下,提高10%以上的平均查全率和5%以上的平均查准率. 展开更多
关键词 时间数据流 数据挖掘 加权fp-tree 加权FP-Growth 关联规则
在线阅读 下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
8
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
在线阅读 下载PDF
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
9
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 FP—growth算法 FP—tree
在线阅读 下载PDF
FP-Tree算法规则挖掘的研究与应用 被引量:2
10
作者 王大勇 李丽 +1 位作者 张蕾 孙时光 《东北师大学报(自然科学版)》 CAS 北大核心 2021年第2期67-72,共6页
对FP-Tree算法的规则挖掘以及阈值设定与规则获取的关系进行了研究.选取高校医疗系统中存储的大学生体检数据,并对这些原始数据进行过滤、转换等加工处理,得到便于进行规则挖掘的事务数据库.将事务数据库中的数据用FP-Tree算法进行处理... 对FP-Tree算法的规则挖掘以及阈值设定与规则获取的关系进行了研究.选取高校医疗系统中存储的大学生体检数据,并对这些原始数据进行过滤、转换等加工处理,得到便于进行规则挖掘的事务数据库.将事务数据库中的数据用FP-Tree算法进行处理,得到数据之间的关联关系,从而对应获取大学生群体中常见慢性病之间的关联关系.在FP-Tree算法应用过程中设定相关参数的不同阈值,并反复实验调整最小支持度阈值和最小置信度阈值以满足医学标准.所获得的关联关系可以在患某种慢性病的早期就敦促大学生改掉不良嗜好、养成良好的生活习惯,降低严重慢性疾病发生的概率. 展开更多
关键词 fp-tree算法 关联规则 数据挖掘 事务数据库 慢性病
在线阅读 下载PDF
一种基于FP-tree的最大频繁项目集挖掘算法 被引量:8
11
作者 刘乃丽 李玉忱 马磊 《计算机应用》 CSCD 北大核心 2005年第5期998-1000,共3页
挖掘关联规则是数据挖掘领域中的重要研究内容,其中挖掘最大频繁项目集是挖掘关联规则中的关键问题之一,以前的许多挖掘最大频繁项目集算法是先生成候选,再进行检验,然而候选项目集产生的代价是很高的,尤其是存在大量长模式的时候。文... 挖掘关联规则是数据挖掘领域中的重要研究内容,其中挖掘最大频繁项目集是挖掘关联规则中的关键问题之一,以前的许多挖掘最大频繁项目集算法是先生成候选,再进行检验,然而候选项目集产生的代价是很高的,尤其是存在大量长模式的时候。文中改进了FP 树结构,提出了一种基于FP tree的快速挖掘最大频繁项目集的算法DMFIA 1,该算法不需要生成最大频繁候选项目集,比DMFIA算法挖掘最大频繁项目集的效率更高。改进的FP 树是单向的,每个结点只保留指向父结点的指针,这大约节省了三分之一的树空间。 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树
在线阅读 下载PDF
FP-tree上频繁概念格的无冗余关联规则提取 被引量:12
12
作者 王慧 王京 《计算机工程与应用》 CSCD 2012年第15期12-15,62,共5页
为解决经典关联规则生成算法挖掘效率低及形成规则冗余性大的问题,提出在FP-tree基础上直接生成频繁概念格并提取无冗余关联规则的算法。其建格过程根据FP-tree频繁项目头表中各项的索引可分别独立进行,由支持度计数约束进行结点的筛选... 为解决经典关联规则生成算法挖掘效率低及形成规则冗余性大的问题,提出在FP-tree基础上直接生成频繁概念格并提取无冗余关联规则的算法。其建格过程根据FP-tree频繁项目头表中各项的索引可分别独立进行,由支持度计数约束进行结点的筛选,形成频繁概念格的Hasse图,图中结点包含频繁项集及其支持度计数信息,通过对全部叶子结点的扫描可生成无冗余关联规则。通过实例验证该算法行之有效。 展开更多
关键词 数据挖掘 关联规则 频繁项集 概念格
在线阅读 下载PDF
基于FP-tree的最大频繁模式挖掘算法 被引量:18
13
作者 冯志新 钟诚 《计算机工程》 CAS CSCD 北大核心 2004年第11期123-124,共2页
在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明,算法FP-Max在挖掘密集型数据集方面是高效的。
关键词 数据挖掘 关联规则 频繁模式树 最大频繁模式
在线阅读 下载PDF
改进的基于FP-tree的频繁项集挖掘算法 被引量:8
14
作者 郭伟 叶德谦 《计算机工程与应用》 CSCD 北大核心 2007年第19期174-176,共3页
对于频繁项集挖掘,采用一种FP-数组技术来减少FP-tree的遍历时间,减少数据集的扫描次数,在此基础上提出了一种基于FP-tree进行频繁项集挖掘的FP-growth+算法,提高了算法的效率。最后的实验证明了该算法的有效性。
关键词 数据挖掘 关联规则 频繁项集 FP—tree
在线阅读 下载PDF
基于改进FP-tree的最大频繁项集挖掘算法 被引量:14
15
作者 陈晨 鞠时光 《计算机工程与设计》 CSCD 北大核心 2008年第24期6236-6239,共4页
现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖... 现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖掘过程中既不需要进行超集检测也不需要递归的建立条件频繁模式树。算法分析和实验结果表明,该算法是一种有效、快速的算法。 展开更多
关键词 数据挖掘 关联规则 最大频繁项集 超集检测 频繁模式树
在线阅读 下载PDF
基于FP-tree的最大频繁项目集挖掘算法 被引量:4
16
作者 马丽生 邓辉文 齐逸 《计算机工程与设计》 CSCD 北大核心 2008年第2期385-388,共4页
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使... 最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使用投影的方法对超集检测进行了优化,减少了项目匹配的次数。最后实验结果表明,该算法在性能上优于已有的同类算法。 展开更多
关键词 数据挖掘 关联规则 频繁项目集 最大频繁项目集 频繁模式树
在线阅读 下载PDF
高效FP-TREE创建算法 被引量:4
17
作者 邱勇 兰永杰 《计算机科学》 CSCD 北大核心 2004年第10期98-100,共3页
如何从大型数据库中挖掘关联规则是数据挖掘的一个重要的问题。FP-growth是一个著名的不产生候选集的高效频繁模式挖掘算法,它使用专门的数据结构FP-tree。为了进一步提高FP-grown算法效率,提出一个新的并行算法PFPTC,可以并发地创建子F... 如何从大型数据库中挖掘关联规则是数据挖掘的一个重要的问题。FP-growth是一个著名的不产生候选集的高效频繁模式挖掘算法,它使用专门的数据结构FP-tree。为了进一步提高FP-grown算法效率,提出一个新的并行算法PFPTC,可以并发地创建子FP-tree,以及一个FP-tree合并算法称作FP-merge,可以将两个FP-tree合并为一个。 展开更多
关键词 挖掘算法 候选集 频繁模式 关联规则 合并算法 大型数据库 算法效率 FP 创建 并发
在线阅读 下载PDF
一种新的基于FP-Tree的关联规则增量式更新算法 被引量:5
18
作者 徐文拴 辛运帏 《计算机工程与设计》 CSCD 北大核心 2006年第18期3430-3432,共3页
挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的。针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问... 挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的。针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问题进行了研究,提出了一种新的基于频繁模式树的关联规则增量式更新算法,并对该算法进行了分析和讨论。 展开更多
关键词 数据挖掘 关联规则 增量式更新 频繁模式树
在线阅读 下载PDF
一种改进的基于FP-Tree的高效挖掘最大频繁项目集算法 被引量:8
19
作者 尹治华 张大鹏 +1 位作者 谭明 王新生 《济南大学学报(自然科学版)》 北大核心 2017年第2期111-117,共7页
为了解决最大频繁项目集算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集维数较大而最大频繁项目集维数较小的情况下产生大量候选项目集的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大频繁... 为了解决最大频繁项目集算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集维数较大而最大频繁项目集维数较小的情况下产生大量候选项目集的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大频繁项目集挖掘的FP-EMFIA算法;该算法在挖掘过程中根据项目头表,采用自上而下和自下而上的双向搜索策略,并通过条件模式基中的频繁项目和较小维数的非频繁项目集对候选项目集进行降维和剪枝,以减少候选项目集的数量,加速对候选集计数的操作。在经典数据集mushroom、chess和connect上的实验结果表明,FP-EMFIA算法在支持度较小时的时间效率优于DMFIA、IDMFIA(improved algorithm of DMFIA)和BDRFI(algorithm for mining frequent itemsets based on decreasing dimensionality reduction of frequent itemsets)算法的,说明FP-EMFIA算法在候选项目集维数较大时有相对优势。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 频繁模式树 非频繁项目集
在线阅读 下载PDF
基于FP-Tree的敏感性关联规则隐藏的研究 被引量:1
20
作者 谢志强 朱孟杰 杨静 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2009年第10期1134-1140,共7页
敏感性关联规则的隐藏是最大程度地保持原始数据集的其他特征,保证敏感规则不被挖掘出来.针对已有的基于对原始数据集中事务修改的方法产生大量I/O操作的问题,提出了基于频繁模式树(FP-tree)的敏感性关联规则隐藏的方法.该方法首先利用F... 敏感性关联规则的隐藏是最大程度地保持原始数据集的其他特征,保证敏感规则不被挖掘出来.针对已有的基于对原始数据集中事务修改的方法产生大量I/O操作的问题,提出了基于频繁模式树(FP-tree)的敏感性关联规则隐藏的方法.该方法首先利用FP-tree存储了与事务数据库相关的全部信息,减少了产生和测试候选集耗费的大量时间;再利用改进的频繁模式树(IFP-tree)是单向的,快速挖掘出最大频繁项目集,确定敏感性关联规则;然后删除敏感关联规则对应的频繁项目集,更新IFP-tree项目集节点和相应的项目头表的计数,对更新的IFP-tree反向挖掘生成新的不包含敏感关联规则的事务数据库.实例和理论分析表明,该方法是正确和高效的. 展开更多
关键词 数据挖掘 敏感关联规则 关联规则隐藏 频繁模式树
在线阅读 下载PDF
上一页 1 2 77 下一页 到第
使用帮助 返回顶部