期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
不产生候选的快速投影频繁模式树挖掘算法 被引量:11
1
作者 何炎祥 向剑文 +1 位作者 朱骁峰 孔维强 《计算机科学》 CSCD 北大核心 2002年第11期71-75,共5页
Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especia... Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns.In this study, we introduce a novel frequent pattern growth (FP-growth)method, which is efficient and scalable for mining both long and short frequent patterns without candidate generation. And build a new project frequent pattern growth (PFP-tree)algorithm on this study, which not only heirs all the advantages in the FP-growth method, but also avoids it's bottleneck in database size dependence. So increase algorithm's scalability efficiently. 展开更多
关键词 事务数据库 快速投影频繁模式树挖掘算法 数据挖掘 频繁项集
在线阅读 下载PDF
基于排序FP-树的频繁模式高效挖掘算法 被引量:13
2
作者 秦亮曦 李谦 史忠植 《计算机科学》 CSCD 北大核心 2005年第4期31-33,共3页
FP-growth算法是目前较高效的频繁模式挖掘算法之一。在FP-growth算法中,FP-树及条件FP-树的构造和遍历占了算法绝大部分的时间,如果能减少这方面的时间,则有望进一步改善算法的效率。本文给出了一个频繁模式挖掘算法SFP-growth。算法... FP-growth算法是目前较高效的频繁模式挖掘算法之一。在FP-growth算法中,FP-树及条件FP-树的构造和遍历占了算法绝大部分的时间,如果能减少这方面的时间,则有望进一步改善算法的效率。本文给出了一个频繁模式挖掘算法SFP-growth。算法通过将FP-树有序化及采用高效排序算法等措施来提高FP-树构造的效率,从而使算法达到较高的效率。实验结果表明,SFP-growth是一个高效的频繁模式挖掘算法,其性能优于Apriori、Eclat和FP-growtn算法。 展开更多
关键词 FP- 挖掘算法 频繁模式 FP-GROWTH算法 高效 APRIORI 排序算法 有序化 时间 构造 遍历
在线阅读 下载PDF
一种直接在Trans-树中挖掘频繁模式的新算法 被引量:10
3
作者 范明 王秉政 《计算机科学》 CSCD 北大核心 2003年第8期117-120,123,共5页
Frequent pattern mining plays an essential role in many important data mining tasks. FP-growth is a veryefficient algorithm for frequent pattern mining. However, it still suffers from creating conditional FP-tree sepa... Frequent pattern mining plays an essential role in many important data mining tasks. FP-growth is a veryefficient algorithm for frequent pattern mining. However, it still suffers from creating conditional FP-tree separatelyand recursively during the mining process. In this paper, we propose a new algorithm, called Least-Item-First Pat-tern Growth (LIFPG), for mining frequent patterns. LIFPG mines frequent patterns directly in Trans-tree withoutusing any additional data structures. The key idea is that least items are always considered first when the current pat-tern growth. By this way, conditional sub-tree can be created directly in Trans-tree by adjusting node-links and re-counting counts of some nodes. Experiments show that, in comparison with FP-Growth, our algorithm is about fourtimes faster and saves half of memory; it also has good time and space scalability with the number of transactions,and has an excellent performance in dense dataset mining as well. 展开更多
关键词 频繁模式 关联规则 数据库 Trans- 数据挖掘 算法
在线阅读 下载PDF
一种新的基于投影的频繁模式树构造算法
4
作者 李陶深 李新仕 《计算机科学》 CSCD 北大核心 2006年第B12期136-138,177,共4页
本文分析FP-growth算法存在的主要问题,提出了一种新的基于投影的频繁模式树构造算法。该算法充分利用大型数据库的投影运算能力,按层来构造频繁模式树(FP-tree),有效地解决了传统的FP-tree构造中存在的问题。实验结果表明,本文... 本文分析FP-growth算法存在的主要问题,提出了一种新的基于投影的频繁模式树构造算法。该算法充分利用大型数据库的投影运算能力,按层来构造频繁模式树(FP-tree),有效地解决了传统的FP-tree构造中存在的问题。实验结果表明,本文的算法与传统的频繁模式树的构造算法相比,具有比较好的时间和空间的可伸缩性。 展开更多
关键词 数据挖掘 关联规则 频繁模式 投影后插式频繁模式
在线阅读 下载PDF
基于逆向FP-树的频繁模式挖掘算法 被引量:8
5
作者 赵艳铎 宋斌恒 《计算机应用》 CSCD 北大核心 2005年第6期1385-1387,共3页
提出了一种称为逆向FP 合并的算法,该算法逆向构造FP 树并通过在其中寻找频繁扩展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP 增长算法,其中时间效率提高了2倍以上。此外,新算法还具有良好的伸缩性。
关键词 数据挖掘 频繁模式 逆向FP- 逆向FP-合并算法 频繁扩展项
在线阅读 下载PDF
基于频繁模式树的关联规则增量式更新算法 被引量:81
6
作者 朱玉全 孙志挥 季小俊 《计算机学报》 EI CSCD 北大核心 2003年第1期91-96,共6页
研究了大型事务数据库中关联规则的增量式更新问题 ,提出了一种基于频繁模式树的关联规则增量式更新算法 ,以处理最小支持度或事务数据库发生变化后相应关联规则的更新问题 。
关键词 频繁模式 关联规则 增量式更新算法 数据挖掘 数据库
在线阅读 下载PDF
基于数据流的大图中频繁模式挖掘算法研究 被引量:7
7
作者 汤小春 樊雪枫 +1 位作者 周佳文 李战怀 《计算机学报》 EI CSCD 北大核心 2020年第7期1293-1311,共19页
随着单个图数据规模的扩大以及应用领域的扩展,大规模单图的频繁模式挖掘的需求越来越强烈.传统的单机环境已经无法满足大规模图数据挖掘的要求,而现有的并行或者分布式环境下的挖掘方法,普遍受到并行性以及数据倾斜等问题的限制,论文... 随着单个图数据规模的扩大以及应用领域的扩展,大规模单图的频繁模式挖掘的需求越来越强烈.传统的单机环境已经无法满足大规模图数据挖掘的要求,而现有的并行或者分布式环境下的挖掘方法,普遍受到并行性以及数据倾斜等问题的限制,论文在分析了现有的频繁模式挖掘算法后,提出了一种基于数据流的单个大图频繁模式挖掘方法.首先,建立基于数据流的频繁模式挖掘模型,将MapReduce模型中的“批”数据变成“微批”数据,提高了数据处理的并行度,并且其迭代方式也满足频繁子图挖掘的反单调性;其二,设计了数据流模型中的频繁模式检查、子图实例扩展以及正规编码计算等操作,实现了基于数据流模型的频繁模式挖掘算法;其三,为解决正规编码计算中的复杂性问题,提出了基于不变关系的正规编码计算策略以及基于编码树的优化策略,优化正规编码比未优化编码的计算性能提升了30%,基于编码树的优化策略比原始编码计算策略在性能上提升了10%;最后,对涉及的相关算法进行了实验测试,实验证明,算法提高了频繁模式挖掘的并行性,大幅度减少了大图的搜索空间,降低了正规编码的计算时间,相比于传统算法大规模单图中频繁模式挖掘的效率提升了30%. 展开更多
关键词 挖掘 频繁模式 数据流模型 并行算法 编码
在线阅读 下载PDF
基于FP-tree的快速挖掘全局最大频繁项集算法 被引量:2
8
作者 何波 《计算机集成制造系统》 EI CSCD 北大核心 2011年第7期1547-1552,共6页
挖掘最大频繁项集的算法多基于局部数据库,为此提出了一种基于频繁模式树的快速挖掘全局最大频繁项集算法。该算法首先挖掘出所有全局频繁项目组成集合,然后各个节点根据该集合构建局部频繁模式树,最后将该集合作为全局最大频繁候选项集... 挖掘最大频繁项集的算法多基于局部数据库,为此提出了一种基于频繁模式树的快速挖掘全局最大频繁项集算法。该算法首先挖掘出所有全局频繁项目组成集合,然后各个节点根据该集合构建局部频繁模式树,最后将该集合作为全局最大频繁候选项集,采用自顶向下策略挖掘出所有的全局最大频繁项集。与类Apriori算法相比,该算法采用的频繁模式树结构能大幅度降低数据库扫描次数和运行时间;自顶向下的策略能大幅度减少候选项集数和通信量。实验结果表明,该算法是快速和高效的。 展开更多
关键词 数据挖掘 频繁模式 全局最大频繁项集 算法
在线阅读 下载PDF
一种基于投影树的并行序列挖掘算法
9
作者 佘春东 范植华 +2 位作者 孙世新 胡四泉 车著明 《计算机工程与应用》 CSCD 北大核心 2004年第14期4-5,56,共3页
在许多科学和商业领域,序列模式的发现技术发挥着越来越重要的作用,然而人们对于高效的基于投影树算法的并行模式关注较少。该文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,提出了分布式存储并行序列挖掘算法,并对算法... 在许多科学和商业领域,序列模式的发现技术发挥着越来越重要的作用,然而人们对于高效的基于投影树算法的并行模式关注较少。该文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,提出了分布式存储并行序列挖掘算法,并对算法的性能进行了详细的分析。 展开更多
关键词 数据挖掘 投影算法 并行处理 频繁序列模式
在线阅读 下载PDF
一种基于投影FP-growth的co-location模式挖掘算法 被引量:5
10
作者 余翠兰 《科学技术与工程》 北大核心 2014年第23期234-240,共7页
空间co-location模式代表了一组空间属性的子集,它们的实例在地理空间中频繁地关联。针对如何利用关联规则挖掘算法来快速地挖掘co-location模式的问题,通过采用FP-CM算法与投影频繁模式树(PFP_tree)及其他技术相结合的方法,提出了一种... 空间co-location模式代表了一组空间属性的子集,它们的实例在地理空间中频繁地关联。针对如何利用关联规则挖掘算法来快速地挖掘co-location模式的问题,通过采用FP-CM算法与投影频繁模式树(PFP_tree)及其他技术相结合的方法,提出了一种基于投影FP-growth的co-location挖掘算法,简称PFP_CM算法。这个新算法主要对产生最大频繁模式的方法、模式过滤的方法、访问数据库的次数、避免大量的表实例连接操作的方法进行改进。最后通过大量的实验,验证了该算法的高效性和正确性,同时,将其用于对三江并流地区珍稀植物的共生物种进行挖掘。 展开更多
关键词 空间数据挖掘 同位模式 关联规则 最大频繁模式 投影频繁模式
在线阅读 下载PDF
快速挖掘全局频繁项目集 被引量:35
11
作者 杨明 孙志挥 吉根林 《计算机研究与发展》 EI CSCD 北大核心 2003年第4期620-626,共7页
分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为... 分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率 展开更多
关键词 数据挖掘 全局频繁项目集 频繁模式 快速挖掘算法 布尔型关联规则 数据库 APRIORI算法
在线阅读 下载PDF
频繁项目集的快速增量式更新算法 被引量:6
12
作者 杨明 孙志挥 +1 位作者 宋余庆 陈耿 《应用科学学报》 CAS CSCD 2003年第4期367-372,共6页
提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.
关键词 频繁项目集 快速增量式更新算法 频繁模式 数据挖掘 数据库
在线阅读 下载PDF
关联规则最大频繁项目集的快速发现算法 被引量:10
13
作者 刘大有 刘亚波 尹治东 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2004年第2期212-215,共4页
提出一种快速发现最大频繁项目集的算法,该算法对集合枚举树进行改进,结合自底向上与自顶向下的搜索策略,利用非频繁项目集对候选最大频繁项目集进行剪枝和降维,减少了不必要候选最大频繁项目集的数量,显著提高了发现的效率.
关键词 关联规则 最大频繁项目集 快速发现算法 集合枚举 自底向上 自顶向下 数据挖掘
在线阅读 下载PDF
基于FP-Tree的共享前缀频繁项集挖掘算法 被引量:4
14
作者 胡中栋 罗会兰 曾珽 《计算机工程与应用》 CSCD 北大核心 2009年第27期137-139,共3页
在数据挖掘中发现关联规则是一个基本问题,而发现频繁项集是关联规则挖掘中最基本、最重要的问题。提出了基于FP-Tree的共享前缀频繁项集挖掘算法-FP-SPMA算法。构造FP-Tree来压缩事务数据库,通过共享前缀和前瞻剪枝快速减小候选项集,... 在数据挖掘中发现关联规则是一个基本问题,而发现频繁项集是关联规则挖掘中最基本、最重要的问题。提出了基于FP-Tree的共享前缀频繁项集挖掘算法-FP-SPMA算法。构造FP-Tree来压缩事务数据库,通过共享前缀和前瞻剪枝快速减小候选项集,无需递归构造条件模式树,算法性能有明显的提高。 展开更多
关键词 频繁项集 频繁模式(FP-Tree) 共享前缀 基于FP-tree的共享前缀频繁项集挖掘算法(FP-SPMA)
在线阅读 下载PDF
缩减投影数据库规模的增量式序列模式算法 被引量:2
15
作者 刘佳新 严书亭 任家东 《计算机工程》 CAS CSCD 2012年第3期28-30,共3页
在增量式序列模式挖掘算法中,数据库更新只有插入和扩展2种操作,未考虑序列删除的情况。为此,提出一种基于频繁序列树的增量式序列模式更新算法(IUFST)。在数据库和支持度发生变化时,IUFST算法分不同情况对频繁序列树进行更新操作,缩减... 在增量式序列模式挖掘算法中,数据库更新只有插入和扩展2种操作,未考虑序列删除的情况。为此,提出一种基于频繁序列树的增量式序列模式更新算法(IUFST)。在数据库和支持度发生变化时,IUFST算法分不同情况对频繁序列树进行更新操作,缩减投影数据库的规模,提高算法效率。实验结果表明,该算法在时间性能上优于PrefixSpan算法和IncSpan算法。 展开更多
关键词 数据挖掘 增量式挖掘 序列模式 投影数据库 频繁序列 深度优先
在线阅读 下载PDF
频繁闭合项目集的并行挖掘算法研究 被引量:5
16
作者 缪裕青 《计算机科学》 CSCD 北大核心 2004年第5期166-168,共3页
频繁项目集挖掘因其在数据挖掘领域中的基础地位和广泛应用备受学术界和产业界的关注,用挖掘频繁闭合项目集代替挖掘频繁项目集是近年来提出的一个重要策略。不同于以往提出的挖掘所有频繁项目集的并行算法,本文针对频繁闭合项目集的特... 频繁项目集挖掘因其在数据挖掘领域中的基础地位和广泛应用备受学术界和产业界的关注,用挖掘频繁闭合项目集代替挖掘频繁项目集是近年来提出的一个重要策略。不同于以往提出的挖掘所有频繁项目集的并行算法,本文针对频繁闭合项目集的特性及并行挖掘的特点,给出了共享存储器模型上(Shared Memory)基于频繁模式树(FP-tree)的挖掘频繁闭合项目集的并行算法(FCIPM)思想,提出了频繁闭合项目集直接判断法,性能分析表明所提技术对算法的性能提高起到了关键作用。 展开更多
关键词 频繁项目集 数据挖掘 并行算法 频繁模式 频繁闭合项目集
在线阅读 下载PDF
一种高效的增量式序列模式挖掘算法 被引量:3
17
作者 刘佳新 《计算机工程》 CAS CSCD 2012年第12期39-41,共3页
现有的增量式挖掘算法在支持度发生变化时,需要对序列数据库进行重复挖掘,为减少由此产生的时空消耗,提出一种高效的增量式序列模式挖掘算法。算法采用频繁序列树作为序列存储结构,当序列数据库和最小支持度发生变化时,通过执行更新操作... 现有的增量式挖掘算法在支持度发生变化时,需要对序列数据库进行重复挖掘,为减少由此产生的时空消耗,提出一种高效的增量式序列模式挖掘算法。算法采用频繁序列树作为序列存储结构,当序列数据库和最小支持度发生变化时,通过执行更新操作,实现频繁序列树的更新,利用深度优先遍历频繁序列树找到序列数据库中所有的序列模式。实验结果表明,与IncSpan算法和PrefixSpan算法相比,该算法的挖掘效率较高。 展开更多
关键词 数据挖掘 增量式挖掘 序列模式 投影数据库 频繁序列
在线阅读 下载PDF
基于概念格的频繁闭项集增量挖掘算法研究 被引量:2
18
作者 战立强 刘大昕 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2007年第2期194-197,227,共5页
近年的研究表明,概念格可以应用于解决频繁闭项集的挖掘问题.针对已有渐进式概念格构造算法中存在的问题,提出了一种基于概念格的频繁闭项集增量挖掘新算法——FIPT-I算法.新算法利用模式树对概念格进行组织,并利用模式树压缩数据库中... 近年的研究表明,概念格可以应用于解决频繁闭项集的挖掘问题.针对已有渐进式概念格构造算法中存在的问题,提出了一种基于概念格的频繁闭项集增量挖掘新算法——FIPT-I算法.新算法利用模式树对概念格进行组织,并利用模式树压缩数据库中的事务,在渐进式构造概念格的同时实现了事务的批处理,减少了概念格的调整操作时间.实验结果表明,与其他同类算法相比,FIPT-I算法对于增量挖掘频繁闭项集来说具有更高的效率. 展开更多
关键词 频繁闭项集 增量挖掘算法 模式 概念格
在线阅读 下载PDF
基于FP-Tree的模式分解算法 被引量:6
19
作者 丛丹 王俊普 +1 位作者 杨文 张劭一 《计算机工程》 CAS CSCD 北大核心 2005年第16期77-79,88,共4页
提出了基于FP-Tree的PD算法。该算法将模式分解焦点从原始数据集转移到数据相对集中的FP-Tree上,从而进一步提高了PD算法挖掘频繁模式集的效率。文中以实例说明了该算法的工作过程。
关键词 数据挖掘 频繁模式 模式分解算法
在线阅读 下载PDF
一种新的关联规则挖掘算法研究 被引量:3
20
作者 韦玉科 汪仁煌 +1 位作者 李江平 陈群 《计算机应用研究》 CSCD 北大核心 2008年第10期2962-2964,2969,共4页
通过分析数据关联的特点和已有的关联规则挖掘算法,在定量描述的准确性和算法高效性方面作了进一步研究,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时,改进了FP-growth挖掘算法,并应用于中医舌诊临床... 通过分析数据关联的特点和已有的关联规则挖掘算法,在定量描述的准确性和算法高效性方面作了进一步研究,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时,改进了FP-growth挖掘算法,并应用于中医舌诊临床病例数据库挖掘实验中,可成功准确地提取中医舌诊诊断规则。测试结果表明该算法速度快、准确度高。 展开更多
关键词 数据挖掘 关联规则 频繁模式增长算法 频繁模式 中医诊断
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部