期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
1
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 fp—growth算法 fptree
在线阅读 下载PDF
基于邻接矩阵的FP-tree构造算法 被引量:8
2
作者 刘应东 冷明伟 陈晓云 《计算机工程与应用》 CSCD 北大核心 2011年第7期153-155,共3页
提出了一种基于邻接矩阵的FP-tree构造方法。首先通过扫描数据库建立2-项集支持数的邻接矩阵,通过邻接矩阵对项进行过滤和新方式排序,然后再利用邻接矩阵构造FP-tree,使得FP-tree的分支、节点数和深度大幅度地减少,从而使存储空间减少... 提出了一种基于邻接矩阵的FP-tree构造方法。首先通过扫描数据库建立2-项集支持数的邻接矩阵,通过邻接矩阵对项进行过滤和新方式排序,然后再利用邻接矩阵构造FP-tree,使得FP-tree的分支、节点数和深度大幅度地减少,从而使存储空间减少、遍历时间缩短。最后使用标准数据集进行验证测试并和其他算法的比较,实验结果表明,该算法在保证结果的同时有效地提高频繁项集挖掘的效率。 展开更多
关键词 数据挖掘 频繁项集 fp-tree算法 邻接矩阵
在线阅读 下载PDF
基于FP-Tree的模式分解算法 被引量:6
3
作者 丛丹 王俊普 +1 位作者 杨文 张劭一 《计算机工程》 CAS CSCD 北大核心 2005年第16期77-79,88,共4页
提出了基于FP-Tree的PD算法。该算法将模式分解焦点从原始数据集转移到数据相对集中的FP-Tree上,从而进一步提高了PD算法挖掘频繁模式集的效率。文中以实例说明了该算法的工作过程。
关键词 数据挖掘 频繁模式树 模式分解算法
在线阅读 下载PDF
高效FP-TREE创建算法 被引量:4
4
作者 邱勇 兰永杰 《计算机科学》 CSCD 北大核心 2004年第10期98-100,共3页
如何从大型数据库中挖掘关联规则是数据挖掘的一个重要的问题。FP-growth是一个著名的不产生候选集的高效频繁模式挖掘算法,它使用专门的数据结构FP-tree。为了进一步提高FP-grown算法效率,提出一个新的并行算法PFPTC,可以并发地创建子F... 如何从大型数据库中挖掘关联规则是数据挖掘的一个重要的问题。FP-growth是一个著名的不产生候选集的高效频繁模式挖掘算法,它使用专门的数据结构FP-tree。为了进一步提高FP-grown算法效率,提出一个新的并行算法PFPTC,可以并发地创建子FP-tree,以及一个FP-tree合并算法称作FP-merge,可以将两个FP-tree合并为一个。 展开更多
关键词 挖掘算法 候选集 频繁模式 关联规则 合并算法 大型数据库 算法效率 fp 创建 并发
在线阅读 下载PDF
一种基于FP_Tree算法的决策树构造方法 被引量:3
5
作者 徐林章 赵强 张艳宁 《计算机工程》 CAS CSCD 北大核心 2009年第8期53-55,共3页
针对大规模训练元组决策树构造效率较低的问题,提出一种改进的决策树构造方法。该方法利用FP_Tree算法,比采用经典Apriori算法节省了更多内存开销。使用FP_Tree路径替代经典算法中训练元组的分裂计算,得到与原算法相同的决策树模型。实... 针对大规模训练元组决策树构造效率较低的问题,提出一种改进的决策树构造方法。该方法利用FP_Tree算法,比采用经典Apriori算法节省了更多内存开销。使用FP_Tree路径替代经典算法中训练元组的分裂计算,得到与原算法相同的决策树模型。实验结果证明,改进后的方法具有良好性能。 展开更多
关键词 决策树 fp_tree算法 分类
在线阅读 下载PDF
FP-Tree算法规则挖掘的研究与应用 被引量:2
6
作者 王大勇 李丽 +1 位作者 张蕾 孙时光 《东北师大学报(自然科学版)》 CAS 北大核心 2021年第2期67-72,共6页
对FP-Tree算法的规则挖掘以及阈值设定与规则获取的关系进行了研究.选取高校医疗系统中存储的大学生体检数据,并对这些原始数据进行过滤、转换等加工处理,得到便于进行规则挖掘的事务数据库.将事务数据库中的数据用FP-Tree算法进行处理... 对FP-Tree算法的规则挖掘以及阈值设定与规则获取的关系进行了研究.选取高校医疗系统中存储的大学生体检数据,并对这些原始数据进行过滤、转换等加工处理,得到便于进行规则挖掘的事务数据库.将事务数据库中的数据用FP-Tree算法进行处理,得到数据之间的关联关系,从而对应获取大学生群体中常见慢性病之间的关联关系.在FP-Tree算法应用过程中设定相关参数的不同阈值,并反复实验调整最小支持度阈值和最小置信度阈值以满足医学标准.所获得的关联关系可以在患某种慢性病的早期就敦促大学生改掉不良嗜好、养成良好的生活习惯,降低严重慢性疾病发生的概率. 展开更多
关键词 fp-tree算法 关联规则 数据挖掘 事务数据库 慢性病
在线阅读 下载PDF
压缩FP-Tree的改进搜索算法 被引量:8
7
作者 吴倩 罗健旭 《计算机工程与设计》 北大核心 2015年第7期1771-1777,共7页
为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁... 为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁模式树紧凑的数据结构,采用自底向上的搜索策略,快速挖掘压缩频繁模式树及其子树,更快得到候选项集的支持数。实验结果表明,该算法可以高效计算出候选频繁项集出现的频次,挖掘效率明显优于Apriori和FPGrowth算法。 展开更多
关键词 数据挖掘 关联规则 压缩频繁模式树 APRIORI算法 频繁模式增长算法
在线阅读 下载PDF
基于FP-network关联规则挖掘算法的配电网薄弱点分析研究 被引量:16
8
作者 程江洲 聂玮瑶 +3 位作者 张赟宁 谌桥 陈秋航 余子容 《电测与仪表》 北大核心 2021年第3期47-53,共7页
针对配电网运行时经常发生故障的情况,如何快速高效地寻找出配电网中的薄弱点成为了当下配电网安全运行的一大难题。文中采用频繁模式网络(FP-network)模型,建立事务-项目的关联矩阵,并且将所需要进行关联规则挖掘的数据储存在关联矩阵... 针对配电网运行时经常发生故障的情况,如何快速高效地寻找出配电网中的薄弱点成为了当下配电网安全运行的一大难题。文中采用频繁模式网络(FP-network)模型,建立事务-项目的关联矩阵,并且将所需要进行关联规则挖掘的数据储存在关联矩阵中,从而进行关联规则的数据挖掘。通过算例分析证实了FP-network关联规则挖掘算法可用于配电网薄弱点分析中,并通过配电网实际运行情况验证了该算法的可行性。该算法对配电网数据库中的故障数据仅仅需要进行一次扫描,从而提高了配电网故障数据关联规则挖掘的效率,更有利于配电网实时更新数据库,为分析检测配电网运行中的薄弱点提供了技术支持。 展开更多
关键词 薄弱点分析 数据挖掘 fp-tree算法 fp-network算法 关联规则
在线阅读 下载PDF
一种基于聚合链的改进FP-Growth算法 被引量:4
9
作者 焦明海 姜慧研 唐加福 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第2期153-156,共4页
提出了一种基于聚合链挖掘频繁模式的改进FP-growth算法.该算法引入聚合链的单链表结构,改进了FP树结构.改进后的FP树是单向的,每个结点只保留指向父结点的指针,节省了树空间;相同项的不同节点的路径信息压缩进聚合链中,避免了生成节点... 提出了一种基于聚合链挖掘频繁模式的改进FP-growth算法.该算法引入聚合链的单链表结构,改进了FP树结构.改进后的FP树是单向的,每个结点只保留指向父结点的指针,节省了树空间;相同项的不同节点的路径信息压缩进聚合链中,避免了生成节点链和条件模式库.用Agrawa方法生成实验数据进行分析,实验结果验证了该算法在时间上的优势. 展开更多
关键词 数据挖掘 频繁模式 fp 聚合链 fp-GROWTH算法
在线阅读 下载PDF
一种基于FP阵列技术的频繁模式挖掘算法 被引量:2
10
作者 谭军 卜英勇 杨勃 《计算机科学》 CSCD 北大核心 2009年第7期208-210,共3页
在FP-growth算法中,为了产生条件FP树,必须扫描FP树两次。提出一种新颖的FP阵列技术,将FP-tree数据结构与FP阵列有效地结合起来,直接从FP阵列得到频繁项的计数,从而省略了第一次扫描,节省了时间。尤其对于稀疏数据库,该算法在执行时间... 在FP-growth算法中,为了产生条件FP树,必须扫描FP树两次。提出一种新颖的FP阵列技术,将FP-tree数据结构与FP阵列有效地结合起来,直接从FP阵列得到频繁项的计数,从而省略了第一次扫描,节省了时间。尤其对于稀疏数据库,该算法在执行时间上比原FP-growth算法具有更优的性能。 展开更多
关键词 频繁模式增长算法 频繁模式树 稀疏数据库 fp阵列
在线阅读 下载PDF
基于逆向FP-树的频繁模式挖掘算法 被引量:8
11
作者 赵艳铎 宋斌恒 《计算机应用》 CSCD 北大核心 2005年第6期1385-1387,共3页
提出了一种称为逆向FP 合并的算法,该算法逆向构造FP 树并通过在其中寻找频繁扩展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP 增长算法,其中时间效率提高了2倍以上。此外,新算法还具有良好的伸缩性。
关键词 数据挖掘 频繁模式 逆向fp-树 逆向fp-合并算法 频繁扩展项
在线阅读 下载PDF
基于FP-增长算法的复合项关联规则挖掘 被引量:4
12
作者 刘川 方思行 《计算机工程与应用》 CSCD 北大核心 2005年第5期182-183,189,共3页
文章基于FP-增长算法提出了一种新的挖掘复合项关联规则的算法。实验证明,该算法具有良好的可伸缩性和很高的运行效率,解决了复合项关联规则挖掘在实际应用中的效率瓶颈问题,适用于实际的大型数据库。
关键词 数据挖掘 关联规则fp-增长算法 复合项fp-树
在线阅读 下载PDF
基于FP-参考树/表的频繁模式挖掘算法 被引量:2
13
作者 石巍 傅彦 《计算机科学》 CSCD 北大核心 2006年第6期206-209,共4页
通分析FP-growth算法中包含的冗余操作,引入数据结构FP参考树/表,改变FP-growth算法中条件模式基的存储和生成方式,提出了新的FPRSG算法,高效地解决了频繁模式挖掘问题。理论分析与实验结果表明,FPRSG算法优于FP-growth算法。
关键词 关联规则 频繁模式 fp参考树/表 fp参考收缩/增长算法 条件模式基
在线阅读 下载PDF
改进的关联规则挖掘算法——MIFP-Apriori算法 被引量:33
14
作者 曾子贤 巩青歌 张俊 《科学技术与工程》 北大核心 2019年第16期216-220,共5页
Apriori算法是关联规则挖掘的经典算法,具有原理简洁、易编程实现等优点,得到广泛应用。针对该算法扫描数据库次数过多,产生大量冗余候选集的缺陷,在现有Apriori算法改进优化思想的基础上,结合矩阵、改进频繁模式树和计算候选集频数优... Apriori算法是关联规则挖掘的经典算法,具有原理简洁、易编程实现等优点,得到广泛应用。针对该算法扫描数据库次数过多,产生大量冗余候选集的缺陷,在现有Apriori算法改进优化思想的基础上,结合矩阵、改进频繁模式树和计算候选集频数优化策略提出了一种改进的关联规则挖掘算法——MIFP-Apriori算法。实验表明,该算法能够将扫描数据库次数降低到一次,有效解决产生大量冗余候选集的缺陷,提高算法效率。 展开更多
关键词 数据挖掘 关联规则挖掘 APRIORI算法 频繁模式树(fp-tree) 改进的频繁模式树 MIfp-Apriori算法
在线阅读 下载PDF
高效的关联规则快速更新算法 被引量:3
15
作者 谭军 卜英勇 杨勃 《计算机工程与应用》 CSCD 北大核心 2009年第4期146-148,共3页
挖掘关联规则的两大经典算法Apriori和FP-tree算法都是以批处理方式处理所有事务。但在实际应用中,新事务频繁地出现,这就需要不断更新关联规则。为了提高更新效率,有效减少扫描原数据库的次数,基于次频繁项的概念,在快速更新频繁模式树... 挖掘关联规则的两大经典算法Apriori和FP-tree算法都是以批处理方式处理所有事务。但在实际应用中,新事务频繁地出现,这就需要不断更新关联规则。为了提高更新效率,有效减少扫描原数据库的次数,基于次频繁项的概念,在快速更新频繁模式树(FUFP-tree)算法的基础上,提出了一种改进的算法。实验结果表明新算法具有良好的性能。 展开更多
关键词 关联规则 APRIORI算法 fp-tree算法 快速更新频繁模式树 次频繁项
在线阅读 下载PDF
一种新的关联规则挖掘算法研究 被引量:3
16
作者 韦玉科 汪仁煌 +1 位作者 李江平 陈群 《计算机应用研究》 CSCD 北大核心 2008年第10期2962-2964,2969,共4页
通过分析数据关联的特点和已有的关联规则挖掘算法,在定量描述的准确性和算法高效性方面作了进一步研究,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时,改进了FP-growth挖掘算法,并应用于中医舌诊临床... 通过分析数据关联的特点和已有的关联规则挖掘算法,在定量描述的准确性和算法高效性方面作了进一步研究,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时,改进了FP-growth挖掘算法,并应用于中医舌诊临床病例数据库挖掘实验中,可成功准确地提取中医舌诊诊断规则。测试结果表明该算法速度快、准确度高。 展开更多
关键词 数据挖掘 关联规则 频繁模式增长算法 频繁模式树 中医诊断
在线阅读 下载PDF
入侵检测规则动态生成研究 被引量:4
17
作者 廖年冬 田盛丰 《北京交通大学学报》 EI CAS CSCD 北大核心 2008年第5期116-120,共5页
在入侵检测研究领域中,提高检测模型的检测率并降低误报率是一个重要的研究课题.本文提出了一种针对网络入侵检测事务流的实时动态规则生成方法.该方法解决了当前主流关联规则生成算法应用到入侵检测过程中存在的多遍扫描、大量无效规... 在入侵检测研究领域中,提高检测模型的检测率并降低误报率是一个重要的研究课题.本文提出了一种针对网络入侵检测事务流的实时动态规则生成方法.该方法解决了当前主流关联规则生成算法应用到入侵检测过程中存在的多遍扫描、大量无效规则和频繁集产生等问题.实验结果表明,文中所提出的方法在规则动态生成和对网络异常情况的检测方面都显示出比较好的性能,相对Snort入侵检测系统,平均提高10%左右的检测精度,克服了Snort系统在异常检测方面的局部缺陷. 展开更多
关键词 规则生成 入侵检测 关联规则 fp-tree算法
在线阅读 下载PDF
基于IS~±树模型的频繁模式挖掘 被引量:3
18
作者 马海兵 张成洪 +1 位作者 张锦 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2005年第4期588-593,共6页
IS-树是一种新型的全文存储索引模型.提出一种基于扩展I-S树模型的频繁模式挖掘算法.和FPgrowth方法一样,算法直接构造频繁项集,不进行Apriori算法所采用的代价很高的候选集产生与测试操作.然而它比FP-树模型具有更多的优点:只需扫描一... IS-树是一种新型的全文存储索引模型.提出一种基于扩展I-S树模型的频繁模式挖掘算法.和FPgrowth方法一样,算法直接构造频繁项集,不进行Apriori算法所采用的代价很高的候选集产生与测试操作.然而它比FP-树模型具有更多的优点:只需扫描一遍事务库;挖掘任务只局部关联于一棵根树;动态更新性好,仅做增量变化.实验表明,其具有与FP-growth算法相当甚至更高的效率.更重要的是,IS+树模型同时是一种事务库的良好索引形式,具有高效支持事务查询的能力. 展开更多
关键词 频繁模式 APRIORI算法 fp—growth算法 IS-树 IS^+-树
在线阅读 下载PDF
一种高效挖掘生物网络闭合频繁子图的算法 被引量:1
19
作者 彭佳扬 杨路明 +2 位作者 王建新 刘振 李敏 《高技术通讯》 CAS CSCD 北大核心 2009年第2期188-193,共6页
针对生物网络中频繁子图的挖掘问题,提出了一种基于FP-树结构的MaxFP算法。此算法以代谢路径作为研究对象,在适合于生物网络图简化模型的基础上,采用一种不产生候选集的改进FP-growth算法挖掘生物网络中的闭合频繁子图。此算法考虑了基... 针对生物网络中频繁子图的挖掘问题,提出了一种基于FP-树结构的MaxFP算法。此算法以代谢路径作为研究对象,在适合于生物网络图简化模型的基础上,采用一种不产生候选集的改进FP-growth算法挖掘生物网络中的闭合频繁子图。此算法考虑了基于频繁项目集的算法应用于网络的缺陷,根据生物网络的特点对FP-growth算法进行了改进。实验证明,提出的MaxFP算法比基于Apriori的频繁模式挖掘算法运行速度快,不仅能挖掘出最大的频繁子图,且能找到更多具有生物意义的频繁子图。 展开更多
关键词 生物网络 图挖掘 闭合频繁子图 fp-树 fp-GROWTH算法
在线阅读 下载PDF
网络数据包安全指标关联规则挖掘应用与研究 被引量:7
20
作者 范开元 米西峰 《科学技术与工程》 北大核心 2014年第7期216-218,222,共4页
对网络通信中,安全指标间关联规则的挖掘速度缓慢问题进行研究。网络通信数据的高容量、多样性和复杂性,使网络安全指标间关联规则挖掘的信息处理难度较高、时间效率低,为此提出一种基于并行FP-树频集算法的关联规则数据挖掘方法并... 对网络通信中,安全指标间关联规则的挖掘速度缓慢问题进行研究。网络通信数据的高容量、多样性和复杂性,使网络安全指标间关联规则挖掘的信息处理难度较高、时间效率低,为此提出一种基于并行FP-树频集算法的关联规则数据挖掘方法并成功应用于网络通信的安全指标挖掘中。首先对网络通信数据进行Netflow流量数据采集,对其进行预处理以信息熵的形式存储。然后将频集压缩到频繁模式树上,再引入并行算法在多个处理器上为频繁模式树的节点创建条件模式库和条件模式树,在不同的并行处理器上进行同时处理,最后生成反映网络安全信息的关联规则。该方法提高了网络信息安全指标间关联规则挖掘的效率,在同样的支持度阈值和置信度阈值的条件下,可减少处理时间4~7s。 展开更多
关键词 网络安全挖掘 fp-树频集 关联规则 并行算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部