期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
云制造环境下并行频繁模式增长算法优化 被引量:5
1
作者 王洁 戴清灏 +1 位作者 曾宇 杨东日 《计算机集成制造系统》 EI CSCD 北大核心 2012年第9期2124-2129,共6页
针对云制造环境下的海量数据挖掘,分析了现有并行频繁模式增长算法的实现和不足。研究了利用键值存储系统对其中的计数和分组部分进行优化。利用键值型数据库存储简单、自动增长且有序的方式,将计数和分组的信息存储在了键值型数据库上... 针对云制造环境下的海量数据挖掘,分析了现有并行频繁模式增长算法的实现和不足。研究了利用键值存储系统对其中的计数和分组部分进行优化。利用键值型数据库存储简单、自动增长且有序的方式,将计数和分组的信息存储在了键值型数据库上。通过减少对分布式文件系统的读写,并将计数过程和排序过程并行化执行,优化后的算法减小了存储节点的网络及内存开销。在真实数据集上,通过实验对比了优化前后算法的性能以及对于文件系统I/O的开销。 展开更多
关键词 云制造 并行频繁模式增长算法 键值存储系统 数据挖掘 算法优化
在线阅读 下载PDF
基于分布式协调系统的并行频繁模式增长算法的优化 被引量:1
2
作者 王洁 戴清灏 李环 《计算机科学》 CSCD 北大核心 2012年第3期170-173,共4页
频繁模式挖掘可以发现数据中频繁出现的模式,是关联规则挖掘的重要步骤。并行频繁模式算法将其应用到并行环境中,以对海量数据进行挖掘。在Apache软件基金会的Mahout项目实现的基础上,对计数和排序阶段以及算法的执行顺序提出了新的优... 频繁模式挖掘可以发现数据中频繁出现的模式,是关联规则挖掘的重要步骤。并行频繁模式算法将其应用到并行环境中,以对海量数据进行挖掘。在Apache软件基金会的Mahout项目实现的基础上,对计数和排序阶段以及算法的执行顺序提出了新的优化策略。优化后的设计将计数信息存储在分布式协调系统上,充分地利用了分布式协调系统的高可用性、适宜存储元数据信息的特点。该设计减小了小文件在分布式文件系统(HDFS)上的开销,同时保留了其优点,还能使计数过程和排序过程并行执行,减小了计算节点的内存开销。对比了文件系统I/O的开销,并分析了实现设计中的难点,为未来的工作打下了基础。 展开更多
关键词 频繁模式增长算法 并行数据挖掘 分布式协调系统 性能优化
在线阅读 下载PDF
动车组故障诊断知识挖掘中改进的并行频繁模式增长算法 被引量:4
3
作者 周斌 徐文胜 《计算机集成制造系统》 EI CSCD 北大核心 2016年第10期2450-2457,共8页
针对动车组历史运维数据的知识挖掘问题,从有效利用动车组历史运维数据来指导动车组故障诊断的角度出发,分析了现有并行频繁模式增长算法的实现形式和不足。结合动车组故障诊断的要求,提出利用局部频繁模式树代替全局频繁模式树的数据... 针对动车组历史运维数据的知识挖掘问题,从有效利用动车组历史运维数据来指导动车组故障诊断的角度出发,分析了现有并行频繁模式增长算法的实现形式和不足。结合动车组故障诊断的要求,提出利用局部频繁模式树代替全局频繁模式树的数据挖掘算法。该算法在各主要步骤上均实现了并行处理,优化了局部频繁模式树生成规则,对频繁模式的搜索策略进行了改进。改进后的算法大大提高了关联规则挖掘的效率,挖掘结果很好地保留了故障信息与状态信息之间的关联关系,并合理去除了无效规则。通过对该算法的具体分析与实际测试,表明该算法在动车组故障诊断知识获取过程中具有快速、高效、准确的特点。 展开更多
关键词 故障诊断 动车组 关联规则 并行频繁模式增长算法 局部频繁模式 MAPREDUCE
在线阅读 下载PDF
一种高效的闭频繁模式挖掘算法 被引量:4
4
作者 谭军 卜英勇 杨勃 《计算机工程与应用》 CSCD 北大核心 2010年第6期130-132,共3页
为了构造条件FP树,必须两次遍历FP树。提出一种FP阵列技术,直接从FP阵列得到频繁项的计数,从而省略了第一次遍历。为了检查闭频繁项集,采用FP树的一种变形结构,并将它与FP阵列结合起来,提出了一种高效的闭频繁模式挖掘算法。实验表明,... 为了构造条件FP树,必须两次遍历FP树。提出一种FP阵列技术,直接从FP阵列得到频繁项的计数,从而省略了第一次遍历。为了检查闭频繁项集,采用FP树的一种变形结构,并将它与FP阵列结合起来,提出了一种高效的闭频繁模式挖掘算法。实验表明,该算法具有很好的性能。 展开更多
关键词 频繁模式增长算法 频繁模式 FP阵列
在线阅读 下载PDF
一种基于FP阵列技术的频繁模式挖掘算法 被引量:2
5
作者 谭军 卜英勇 杨勃 《计算机科学》 CSCD 北大核心 2009年第7期208-210,共3页
在FP-growth算法中,为了产生条件FP树,必须扫描FP树两次。提出一种新颖的FP阵列技术,将FP-tree数据结构与FP阵列有效地结合起来,直接从FP阵列得到频繁项的计数,从而省略了第一次扫描,节省了时间。尤其对于稀疏数据库,该算法在执行时间... 在FP-growth算法中,为了产生条件FP树,必须扫描FP树两次。提出一种新颖的FP阵列技术,将FP-tree数据结构与FP阵列有效地结合起来,直接从FP阵列得到频繁项的计数,从而省略了第一次扫描,节省了时间。尤其对于稀疏数据库,该算法在执行时间上比原FP-growth算法具有更优的性能。 展开更多
关键词 频繁模式增长算法 频繁模式 稀疏数据库 FP阵列
在线阅读 下载PDF
一种单遍扫描频繁模式树结构 被引量:4
6
作者 谭军 卜英勇 杨勃 《计算机工程》 CAS CSCD 北大核心 2010年第14期32-33,共2页
针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构-SP-tree,只需单遍扫描便能容纳全部数据库信息。为使SP-tree具有与FP-tree一样良好的压缩性能,给出一种有效的动态重构树的方法,称为宽度... 针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构-SP-tree,只需单遍扫描便能容纳全部数据库信息。为使SP-tree具有与FP-tree一样良好的压缩性能,给出一种有效的动态重构树的方法,称为宽度排序方法,该方法能够在挖掘过程中动态地逐条分支地重构树,最终产生一棵频繁递减的前缀树。实验结果表明,SP-tree的压缩性能优于其他单遍扫描的前缀树结构。 展开更多
关键词 数据流 频繁模式增长算法 单遍扫描模式 宽度排序方法
在线阅读 下载PDF
基于Spark的并行频繁项集挖掘算法 被引量:7
7
作者 毛伊敏 吴斌 +1 位作者 许春冬 张茂省 《计算机集成制造系统》 EI CSCD 北大核心 2023年第4期1267-1283,共17页
针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(... 针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(SNMF),通过提供支持度计数查询和分解储存支持度计数的矩阵,解决了创建条件FP-tree的时空效率低的问题;其次,提出基于遗传算法的分组策略(GS-GA),均衡分配频繁1项集至各节点,解决了节点间的通信开销大的问题;最后,提出高效缩减树结构策略(ERTSS),缩减FP-tree树结构,解决了冗余搜索的问题。实验结果验证了PAFMFI-Spark算法的可行性以及相较于其他挖掘算法的性能优势,所提算法能有效适应各种数据的频繁项集挖掘。 展开更多
关键词 大数据 Spark框架 并行频繁项集挖掘 频繁模式增长算法 非负矩阵分解
在线阅读 下载PDF
数据流上一种单遍扫描频繁模式树结构 被引量:1
8
作者 谭军 卜英勇 陈爱斌 《计算机工程与应用》 CSCD 2013年第2期152-154,共3页
针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构——FPS-tree,只需单遍扫描便能获取当前窗口的全部数据库信息。为了在滑动窗口时有效地删除过期窗格和插入新窗格,提出一个新颖的概念——&... 针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构——FPS-tree,只需单遍扫描便能获取当前窗口的全部数据库信息。为了在滑动窗口时有效地删除过期窗格和插入新窗格,提出一个新颖的概念——"尾结点",FPS-tree中每条路径上的窗格信息只保持在尾结点里。实验结果表明FPS-tree的压缩性能要优于其他单遍扫描的前缀树结构。 展开更多
关键词 数据流 频繁模式增长算法 单遍扫描模式 尾结点
在线阅读 下载PDF
一种新的关联规则挖掘算法研究 被引量:3
9
作者 韦玉科 汪仁煌 +1 位作者 李江平 陈群 《计算机应用研究》 CSCD 北大核心 2008年第10期2962-2964,2969,共4页
通过分析数据关联的特点和已有的关联规则挖掘算法,在定量描述的准确性和算法高效性方面作了进一步研究,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时,改进了FP-growth挖掘算法,并应用于中医舌诊临床... 通过分析数据关联的特点和已有的关联规则挖掘算法,在定量描述的准确性和算法高效性方面作了进一步研究,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时,改进了FP-growth挖掘算法,并应用于中医舌诊临床病例数据库挖掘实验中,可成功准确地提取中医舌诊诊断规则。测试结果表明该算法速度快、准确度高。 展开更多
关键词 数据挖掘 关联规则 频繁模式增长算法 频繁模式 中医诊断
在线阅读 下载PDF
基于FP-Growth的目标编队规律挖掘模型
10
作者 徐秋坪 孙耀宗 《系统工程与电子技术》 北大核心 2025年第5期1620-1626,共7页
面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增... 面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增长算法挖掘目标编组规律知识,从编组运用样式、作战运用样式等维度分析典型编队规律运用特征。该模型易于工程实现,能够基于积累的编队样本数据,挖掘形成典型目标协同作战运用规律知识,通过案例分析介绍该模型的可行性和有效性,可为实时战场编队识别研判、目标态势变化趋势预测、临机动态规划等作战应用提供高价值情报支撑。 展开更多
关键词 编队规律 作战运用特征 频繁模式增长算法
在线阅读 下载PDF
基于Spark的并行FP-Growth算法优化及实现 被引量:10
11
作者 顾军华 武君艳 +2 位作者 许馨匀 谢志坚 张素琪 《计算机应用》 CSCD 北大核心 2018年第11期3069-3074,共6页
为了进一步提高在Spark平台上的频繁模式增长(FP-Growth)算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树(FP-Tree)规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然... 为了进一步提高在Spark平台上的频繁模式增长(FP-Growth)算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树(FP-Tree)规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然后,通过创建列表P-List对数据集划分策略进行优化,减少遍历次数,降低时间复杂度。实验结果表明,BFPG算法提高了并行FP-Growth算法挖掘效率,且算法具有良好的扩展性。 展开更多
关键词 大数据平台 关联规则 频繁项集 频繁模式增长算法 SPARK
在线阅读 下载PDF
压缩FP-Tree的改进搜索算法 被引量:8
12
作者 吴倩 罗健旭 《计算机工程与设计》 北大核心 2015年第7期1771-1777,共7页
为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁... 为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁模式树紧凑的数据结构,采用自底向上的搜索策略,快速挖掘压缩频繁模式树及其子树,更快得到候选项集的支持数。实验结果表明,该算法可以高效计算出候选频繁项集出现的频次,挖掘效率明显优于Apriori和FPGrowth算法。 展开更多
关键词 数据挖掘 关联规则 压缩频繁模式 APRIORI算法 频繁模式增长算法
在线阅读 下载PDF
改进的FP-growth算法及其在TE过程故障诊断中的应用 被引量:6
13
作者 李宏光 夏丽君 《北京工业大学学报》 CAS CSCD 北大核心 2016年第5期697-706,共10页
为了解决频繁模式增长(frequent pattern growth,FP-growth)算法因多次遍历频繁集列表而产生庞大频繁模式树需占用大量内存降低了运行效率的问题,提出一种改进的FP-growth(upgraded FP-growth,UFP)算法.首先,构造支持度函数实现各项与... 为了解决频繁模式增长(frequent pattern growth,FP-growth)算法因多次遍历频繁集列表而产生庞大频繁模式树需占用大量内存降低了运行效率的问题,提出一种改进的FP-growth(upgraded FP-growth,UFP)算法.首先,构造支持度函数实现各项与其支持度的映射,使算法的运行效率得到提高;其次,利用关键字筛选技术,把频繁项分成关键项表、非关键项表两部分,保证了最终获取的每条关联规则都是人们关注的有效信息;最后,根据频繁1-项集划分数据库子集并直接构造每一项的条件模式树,节省了内存空间.将UFP算法应用于Tenessee Eastman(TE)过程的故障诊断,通过与主成分分析(principal component analysis,PCA)、核主成分分析(kernel principal component analysis,KPCA)算法在多种故障下的诊断结果对比实验验证了算法的优越性. 展开更多
关键词 频繁模式增长(FP-growth)算法 关联规则 Tenessee Eastman(TE)过程 故障诊断
在线阅读 下载PDF
基于FP-Growth算法的毕业生管理系统应用
14
作者 张红荣 《郑州轻工业学院学报(自然科学版)》 CAS 2013年第5期59-61,共3页
将频繁项集挖掘算法中的FP-Growth算法应用到毕业生信息管理系统中,算法采用FP树对事务数据集进行压缩存储,然后再利用FP树得到所有的频繁项集.该系统可从大量的毕业生信息出发,找出就业信息与教育信息之间的关系,从而为决策者提供指导... 将频繁项集挖掘算法中的FP-Growth算法应用到毕业生信息管理系统中,算法采用FP树对事务数据集进行压缩存储,然后再利用FP树得到所有的频繁项集.该系统可从大量的毕业生信息出发,找出就业信息与教育信息之间的关系,从而为决策者提供指导或数据支持. 展开更多
关键词 频繁模式增长算法 关联规则 毕业生管理系统
在线阅读 下载PDF
关联规则技术在电力市场营销分析中的应用 被引量:23
15
作者 侯雪波 田斌 +1 位作者 葛少云 路志英 《电力系统及其自动化学报》 CSCD 北大核心 2005年第2期67-72,共6页
关联规则是一种重要的数据挖掘技术。结合电力行业的特殊性,将关联规则应用于对电力市场营销分析中。采取K-Means聚类技术实现对历史数据的离散化处理,以便进行知识归纳,运用关联规则的FP-Growth算法搜索所有的强关联规则,这些强关联规... 关联规则是一种重要的数据挖掘技术。结合电力行业的特殊性,将关联规则应用于对电力市场营销分析中。采取K-Means聚类技术实现对历史数据的离散化处理,以便进行知识归纳,运用关联规则的FP-Growth算法搜索所有的强关联规则,这些强关联规则中蕴含着电量销售与电价、气温、降水等影响因素之间的关联关系。以某市的实际电力营销数据为例,说明了关联规则的分析方法对电力市场营销具有一定的辅助决策意义。 展开更多
关键词 电力市场营销 数据挖掘 关联规则 频繁模式增长算法
在线阅读 下载PDF
基于关联规则的船员不安全行为发展路径分析 被引量:2
16
作者 胡甚平 谢莹 +2 位作者 张欣欣 江帅 席永涛 《上海海事大学学报》 北大核心 2022年第3期62-68,共7页
为研究船员不安全行为间的不确定性关联特征,运用关联规则对船员的不安全行为进行支持度和关联度评估。考虑到船员不安全行为表现的复杂性和不确定性,对船舶航行事故中船员的不安全行为进行辨识,并提出船员不安全行为的基本组成和关联... 为研究船员不安全行为间的不确定性关联特征,运用关联规则对船员的不安全行为进行支持度和关联度评估。考虑到船员不安全行为表现的复杂性和不确定性,对船舶航行事故中船员的不安全行为进行辨识,并提出船员不安全行为的基本组成和关联因素。引入频繁模式增长(frequent pattern growth,FP-growth)算法,分析船员的不安全行为关联规则。结合某港口水域安全事故数据,通过置信度和支持度分析,揭示船员不安全行为致因事故路径。应用结果表明,船员不安全行为导致事故发生的主要路径为:瞭望疏忽→安全航速失误→危险判断过失→避让行动过失→应急操作不当。自然环境和交通密度对船员不安全行为的产生具有较强的关联性。 展开更多
关键词 水路运输 船员不安全行为 关联规则 不确定性 频繁模式增长(FP-growth)算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部