期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
1
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 fp—growth算法 fptree
在线阅读 下载PDF
基于磁盘表存储FP-TREE的关联规则挖掘算法 被引量:14
2
作者 申彦 宋顺林 朱玉全 《计算机研究与发展》 EI CSCD 北大核心 2012年第6期1313-1322,共10页
随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据... 随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据结构,提出了一种新颖的基于磁盘表的DTRFP-GROWTH(disk table resident FP-TREE growth)算法.该算法利用磁盘表存储FP-TREE,降低内存使用,在传统FP-GROWTH算法占用过多内存、挖掘工作无法进行时,以独特的磁盘表存储FP-TREE技术,减少内存使用,能够继续完成挖掘工作,适合空间性能优先的场合.不仅如此,该算法还将关联规则挖掘和关系型数据库整合,克服了基于文件系统相关算法效率较低、开发难度较大等问题.在真实数据集上进行了验证实验以及性能分析.实验结果表明,在内存空间有限的情况下,DTRFP-GROWTH算法是一种有效的基于磁盘的关联规则挖掘算法. 展开更多
关键词 fp-tree 关联规则 磁盘存储 频繁项目集 DTRfp-GROWTH算法 fp-GROWTH算法 数据挖掘
在线阅读 下载PDF
基于邻接矩阵的FP-tree构造算法 被引量:8
3
作者 刘应东 冷明伟 陈晓云 《计算机工程与应用》 CSCD 北大核心 2011年第7期153-155,共3页
提出了一种基于邻接矩阵的FP-tree构造方法。首先通过扫描数据库建立2-项集支持数的邻接矩阵,通过邻接矩阵对项进行过滤和新方式排序,然后再利用邻接矩阵构造FP-tree,使得FP-tree的分支、节点数和深度大幅度地减少,从而使存储空间减少... 提出了一种基于邻接矩阵的FP-tree构造方法。首先通过扫描数据库建立2-项集支持数的邻接矩阵,通过邻接矩阵对项进行过滤和新方式排序,然后再利用邻接矩阵构造FP-tree,使得FP-tree的分支、节点数和深度大幅度地减少,从而使存储空间减少、遍历时间缩短。最后使用标准数据集进行验证测试并和其他算法的比较,实验结果表明,该算法在保证结果的同时有效地提高频繁项集挖掘的效率。 展开更多
关键词 数据挖掘 频繁项集 fp-tree算法 邻接矩阵
在线阅读 下载PDF
一种基于FP-tree的最大频繁项目集挖掘算法 被引量:8
4
作者 刘乃丽 李玉忱 马磊 《计算机应用》 CSCD 北大核心 2005年第5期998-1000,共3页
挖掘关联规则是数据挖掘领域中的重要研究内容,其中挖掘最大频繁项目集是挖掘关联规则中的关键问题之一,以前的许多挖掘最大频繁项目集算法是先生成候选,再进行检验,然而候选项目集产生的代价是很高的,尤其是存在大量长模式的时候。文... 挖掘关联规则是数据挖掘领域中的重要研究内容,其中挖掘最大频繁项目集是挖掘关联规则中的关键问题之一,以前的许多挖掘最大频繁项目集算法是先生成候选,再进行检验,然而候选项目集产生的代价是很高的,尤其是存在大量长模式的时候。文中改进了FP 树结构,提出了一种基于FP tree的快速挖掘最大频繁项目集的算法DMFIA 1,该算法不需要生成最大频繁候选项目集,比DMFIA算法挖掘最大频繁项目集的效率更高。改进的FP 树是单向的,每个结点只保留指向父结点的指针,这大约节省了三分之一的树空间。 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树
在线阅读 下载PDF
基于FP-tree的最大频繁模式挖掘算法 被引量:18
5
作者 冯志新 钟诚 《计算机工程》 CAS CSCD 北大核心 2004年第11期123-124,共2页
在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明,算法FP-Max在挖掘密集型数据集方面是高效的。
关键词 数据挖掘 关联规则 频繁模式树 最大频繁模式
在线阅读 下载PDF
基于OWSFP-Tree的最大频繁项目集挖掘算法 被引量:5
6
作者 赵志刚 王芳 万军 《计算机工程与设计》 CSCD 北大核心 2013年第5期1687-1690,1807,共5页
为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前... 为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前都需要超集检验,利用项目表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 fp-tree 条件模式树
在线阅读 下载PDF
基于有序FP-tree的最大频繁项集挖掘算法 被引量:5
7
作者 李少华 吕志旺 +1 位作者 车德勇 周宁 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期65-69,共5页
通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析... 通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析和实验数据发现MMFI算法比传统算法快速、合理. 展开更多
关键词 数据挖掘 fp-tree 最大频繁项集 关联规则
在线阅读 下载PDF
在单向FP-tree上挖掘频繁闭项集 被引量:4
8
作者 王现君 宋晶晶 姜保庆 《计算机工程与应用》 CSCD 北大核心 2008年第10期150-153,237,共5页
频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数... 频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算频繁闭项集的弊端,极大地降低了内存空间和时间开销,提高了挖掘效率。 展开更多
关键词 数据挖掘 频繁项集 频繁闭项集 单向fp-tree 被约束子树
在线阅读 下载PDF
改进的基于FP-tree的频繁项集挖掘算法 被引量:8
9
作者 郭伟 叶德谦 《计算机工程与应用》 CSCD 北大核心 2007年第19期174-176,共3页
对于频繁项集挖掘,采用一种FP-数组技术来减少FP-tree的遍历时间,减少数据集的扫描次数,在此基础上提出了一种基于FP-tree进行频繁项集挖掘的FP-growth+算法,提高了算法的效率。最后的实验证明了该算法的有效性。
关键词 数据挖掘 关联规则 频繁项集 fptree
在线阅读 下载PDF
基于FP-tree和支持度数组的最大频繁项集挖掘算法 被引量:2
10
作者 陈慧萍 王建东 +1 位作者 叶飞跃 王煜 《系统工程与电子技术》 EI CSCD 北大核心 2005年第9期1631-1635,共5页
提出了一个基于频繁模式树即FP-tree和支持度数组相结合的最大频繁项集挖掘算法,首先建立FP-tree,同时建立支持度数组,然后在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效... 提出了一个基于频繁模式树即FP-tree和支持度数组相结合的最大频繁项集挖掘算法,首先建立FP-tree,同时建立支持度数组,然后在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效率。算法分析和实验表明,该算法对稠密型数据集和稀疏型数据集均适用,并且特别适于挖掘具有长频繁项集的数据集。 展开更多
关键词 数据挖掘 fp-tree MAXfp-tree 支持度数组 最大频繁项集
在线阅读 下载PDF
关联规则中FP-tree的最大频繁模式非检验挖掘算法 被引量:5
11
作者 惠亮 钱雪忠 《计算机应用》 CSCD 北大核心 2010年第7期1922-1925,共4页
基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使... 基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使挖掘过程中不需要生成条件频繁模式树也不需要超集检验。算法采用的预测剪枝策略减少了挖掘的次数,采用的求取公共交集的方式保证了挖掘结果的完整性。实验结果表明在支持度相对较小情况下,NCMFP的效率是同类算法的2~5倍。 展开更多
关键词 关联规则 数据挖掘 频繁模式树 最大频繁项集 超集检验
在线阅读 下载PDF
基于FP-tree的多层关联规则快速挖掘算法 被引量:2
12
作者 曹洪其 姜志峰 孙志挥 《计算机工程》 CAS CSCD 北大核心 2007年第19期66-68,71,共4页
研究了多层关联规则挖掘的理论和方法,提出了一种基于FP-tree的快速挖掘算法FAMML_FPT。该算法不仅实现了同层次关联规则的挖掘,也能实现跨层次关联规则的挖掘,其中引入了修补项、跨层修补项的概念,以便从低到高逐层建立FP-tree,有效减... 研究了多层关联规则挖掘的理论和方法,提出了一种基于FP-tree的快速挖掘算法FAMML_FPT。该算法不仅实现了同层次关联规则的挖掘,也能实现跨层次关联规则的挖掘,其中引入了修补项、跨层修补项的概念,以便从低到高逐层建立FP-tree,有效减少了扫描数据库的次数,且不用产生大量的候选项集,提高了数据挖掘的效率。 展开更多
关键词 数据挖掘 多层关联规则 频繁模式树 修补项
在线阅读 下载PDF
一种基于FP-tree的最小预测集获取新算法 被引量:1
13
作者 谢翠华 沈洁 +2 位作者 李云 程伟 林颖 《计算机工程》 EI CAS CSCD 北大核心 2006年第6期82-85,共4页
生成用于预测的关联规则,现有算法生成的关联规则中许多是不必要的。利用分治策略和基于频繁闭子集的FP-TREE生成一种特殊的关联规则集(最小预测集),它比现有规则集小,但是具有同样的预测功能,并且具有发现关键属性的能力。给出了它的算... 生成用于预测的关联规则,现有算法生成的关联规则中许多是不必要的。利用分治策略和基于频繁闭子集的FP-TREE生成一种特殊的关联规则集(最小预测集),它比现有规则集小,但是具有同样的预测功能,并且具有发现关键属性的能力。给出了它的算法,并从理论上证明了该算法的正确有效性。 展开更多
关键词 数据挖掘 关联规则 频繁闭项集 最小预测集 fptree
在线阅读 下载PDF
关联规则中改进FP-tree的最大频繁模式挖掘算法 被引量:3
14
作者 钱雪忠 惠亮 《计算机工程与设计》 CSCD 北大核心 2010年第21期4635-4638,共4页
关联规则挖掘是数据挖掘领域中重要的研究内容,最大频繁模式挖掘又是关联规则挖掘中的关键问题之一。针对已有的最大频繁模式挖掘算法存在的问题,通过对FP—Growth、FP—Max算法的分析,提出了基于改进FP—tree的最大频繁模式挖掘算法... 关联规则挖掘是数据挖掘领域中重要的研究内容,最大频繁模式挖掘又是关联规则挖掘中的关键问题之一。针对已有的最大频繁模式挖掘算法存在的问题,通过对FP—Growth、FP—Max算法的分析,提出了基于改进FP—tree的最大频繁模式挖掘算法DFP—Max。该算法使用预测、剪枝的策略减少条件FP—tree个数,采用数字集匹配代替项集匹配的方式,减少超集检验的次数,并且避免了中间结果的组合连接,从而使算法达到较高的效率。实验结果表明,在支持度相对较小情况下,DFP—Max的效率是同类算法的2-5倍。 展开更多
关键词 关联规则 数据挖掘 fptree 最大频繁项集 超集检验
在线阅读 下载PDF
基于FP-tree最大频繁模式超集挖掘算法 被引量:3
15
作者 王君 任永功 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期33-36,41,共5页
数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无... 数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无需产生大量的候选集,同时减少数据集扫描次数,降低数据库遍历时间,提高算法效率.实验证明,此算法在降低候选项目集冗余度的同时有效减少了算法运行时间. 展开更多
关键词 数据挖掘 最大频繁项目集 条件频繁模式树 超集检测
在线阅读 下载PDF
基于FP-tree的快速数据挖掘算法 被引量:3
16
作者 曾庆森 黄贤英 《重庆工学院学报(自然科学版)》 2009年第10期72-76,共5页
针对挖掘全局频繁项集的算法大多采用的类Apriori算法存在通信量大、同步次数和数据库扫描次数较多等问题,提出了一种基于频繁模式树的快速挖掘全局频繁项集算法(FAMGFI).该算法让各计算机结点采用FP-growth算法独立地计算局部频繁项集... 针对挖掘全局频繁项集的算法大多采用的类Apriori算法存在通信量大、同步次数和数据库扫描次数较多等问题,提出了一种基于频繁模式树的快速挖掘全局频繁项集算法(FAMGFI).该算法让各计算机结点采用FP-growth算法独立地计算局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.FAMGFI算法采用自顶向下和自底向上策略,能大大降低通信量.理论分析和实验结果表明FAMGFI算法是快速而有效的. 展开更多
关键词 数据挖掘 频繁模式树 全局频繁项集
在线阅读 下载PDF
基于FP-tree增长算法的影响愤怒郁怒人群睡眠质量的强关联因素挖掘
17
作者 张玲 郝志 +2 位作者 魏盛 孙鹏 乔明琦 《世界科学技术-中医药现代化》 2015年第8期1595-1601,共7页
目的:基于频繁模式树(Frequent Pattern-tree,FP-tree)增长算法挖掘影响愤怒郁怒人群睡眠质量的强关联因素。方法:设计了构造FP-tree的算法和挖掘频繁项集的算法,采用FP-Tree增长算法,通过状态树记录扫描的数据库信息,通过减少项目集的... 目的:基于频繁模式树(Frequent Pattern-tree,FP-tree)增长算法挖掘影响愤怒郁怒人群睡眠质量的强关联因素。方法:设计了构造FP-tree的算法和挖掘频繁项集的算法,采用FP-Tree增长算法,通过状态树记录扫描的数据库信息,通过减少项目集的搜索空间,一次扫描数据库生成满足最小支持度要求的频繁项目集,实现了情志病证数据库对愤怒郁怒人群影响睡眠质量各种强关联因素的挖掘。结果:影响愤怒郁怒人群睡眠质量最频繁的关联因素是呼吸不畅、咳嗽或鼾声高、感觉冷、感觉热或做噩梦,程序分析总的时间是2 s。结论:基于FP-tree的频繁项集挖掘算法能有效实现对情志病证数据库海量数据中有用信息的针对性挖掘。 展开更多
关键词 频繁项集 fp-tree 关联因素 愤怒/郁怒 数据挖掘
在线阅读 下载PDF
逆向索引FP-tree挖掘频繁项集
18
作者 周涛 《现代电子技术》 2007年第4期143-145,共3页
在对逆向FP-tree的研究基础上提出了逆向索引FP-tree挖掘频繁项集的算法。该算法构造了逆向索引FP-tree,通过寻找扩展频繁项集与合并第一棵子树的方法挖掘频繁项集,给出了逆向索引FP-tree的性质和挖掘算法。
关键词 数据挖掘 fptree 扩展频繁项集 逆向
在线阅读 下载PDF
压缩FP-Tree的改进搜索算法 被引量:8
19
作者 吴倩 罗健旭 《计算机工程与设计》 北大核心 2015年第7期1771-1777,共7页
为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁... 为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁模式树紧凑的数据结构,采用自底向上的搜索策略,快速挖掘压缩频繁模式树及其子树,更快得到候选项集的支持数。实验结果表明,该算法可以高效计算出候选频繁项集出现的频次,挖掘效率明显优于Apriori和FPGrowth算法。 展开更多
关键词 数据挖掘 关联规则 压缩频繁模式树 APRIORI算法 频繁模式增长算法
在线阅读 下载PDF
基于有序FP-tree的最大长度频繁项集挖掘算法 被引量:4
20
作者 廖福蓉 王成良 《计算机工程与应用》 CSCD 2012年第30期147-150,共4页
频繁项集的挖掘受到大量候选频繁项集和较高计算花费的限制,只挖掘最大长度频繁项集已满足很多应用。提出一种基于有序FP-tree结构挖掘最大长度频繁项集的算法。即对有序FP-tree的头表进行改造,增加一个max-level域,记录该项在有序FP-t... 频繁项集的挖掘受到大量候选频繁项集和较高计算花费的限制,只挖掘最大长度频繁项集已满足很多应用。提出一种基于有序FP-tree结构挖掘最大长度频繁项集的算法。即对有序FP-tree的头表进行改造,增加一个max-level域,记录该项在有序FP-tree中的最大高度。挖掘时仅对max-level大于等于已有最大长度频繁项集长度的项进行遍历,不产生条件模式基,无需递归构造条件FP-tree,且计算出最大长度频繁项集的支持度。实验结果表明该算法挖掘效率高、速度快。 展开更多
关键词 最大长度频繁项集 数据挖掘 频繁项集 有序频繁模式树(fp)-tree
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部