期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
云制造环境下并行频繁模式增长算法优化 被引量:5
1
作者 王洁 戴清灏 +1 位作者 曾宇 杨东日 《计算机集成制造系统》 EI CSCD 北大核心 2012年第9期2124-2129,共6页
针对云制造环境下的海量数据挖掘,分析了现有并行频繁模式增长算法的实现和不足。研究了利用键值存储系统对其中的计数和分组部分进行优化。利用键值型数据库存储简单、自动增长且有序的方式,将计数和分组的信息存储在了键值型数据库上... 针对云制造环境下的海量数据挖掘,分析了现有并行频繁模式增长算法的实现和不足。研究了利用键值存储系统对其中的计数和分组部分进行优化。利用键值型数据库存储简单、自动增长且有序的方式,将计数和分组的信息存储在了键值型数据库上。通过减少对分布式文件系统的读写,并将计数过程和排序过程并行化执行,优化后的算法减小了存储节点的网络及内存开销。在真实数据集上,通过实验对比了优化前后算法的性能以及对于文件系统I/O的开销。 展开更多
关键词 云制造 并行频繁模式增长算法 键值存储系统 数据挖掘 算法优化
在线阅读 下载PDF
基于分布式协调系统的并行频繁模式增长算法的优化 被引量:1
2
作者 王洁 戴清灏 李环 《计算机科学》 CSCD 北大核心 2012年第3期170-173,共4页
频繁模式挖掘可以发现数据中频繁出现的模式,是关联规则挖掘的重要步骤。并行频繁模式算法将其应用到并行环境中,以对海量数据进行挖掘。在Apache软件基金会的Mahout项目实现的基础上,对计数和排序阶段以及算法的执行顺序提出了新的优... 频繁模式挖掘可以发现数据中频繁出现的模式,是关联规则挖掘的重要步骤。并行频繁模式算法将其应用到并行环境中,以对海量数据进行挖掘。在Apache软件基金会的Mahout项目实现的基础上,对计数和排序阶段以及算法的执行顺序提出了新的优化策略。优化后的设计将计数信息存储在分布式协调系统上,充分地利用了分布式协调系统的高可用性、适宜存储元数据信息的特点。该设计减小了小文件在分布式文件系统(HDFS)上的开销,同时保留了其优点,还能使计数过程和排序过程并行执行,减小了计算节点的内存开销。对比了文件系统I/O的开销,并分析了实现设计中的难点,为未来的工作打下了基础。 展开更多
关键词 频繁模式增长算法 并行数据挖掘 分布式协调系统 性能优化
在线阅读 下载PDF
动车组故障诊断知识挖掘中改进的并行频繁模式增长算法 被引量:4
3
作者 周斌 徐文胜 《计算机集成制造系统》 EI CSCD 北大核心 2016年第10期2450-2457,共8页
针对动车组历史运维数据的知识挖掘问题,从有效利用动车组历史运维数据来指导动车组故障诊断的角度出发,分析了现有并行频繁模式增长算法的实现形式和不足。结合动车组故障诊断的要求,提出利用局部频繁模式树代替全局频繁模式树的数据... 针对动车组历史运维数据的知识挖掘问题,从有效利用动车组历史运维数据来指导动车组故障诊断的角度出发,分析了现有并行频繁模式增长算法的实现形式和不足。结合动车组故障诊断的要求,提出利用局部频繁模式树代替全局频繁模式树的数据挖掘算法。该算法在各主要步骤上均实现了并行处理,优化了局部频繁模式树生成规则,对频繁模式的搜索策略进行了改进。改进后的算法大大提高了关联规则挖掘的效率,挖掘结果很好地保留了故障信息与状态信息之间的关联关系,并合理去除了无效规则。通过对该算法的具体分析与实际测试,表明该算法在动车组故障诊断知识获取过程中具有快速、高效、准确的特点。 展开更多
关键词 故障诊断 动车组 关联规则 并行频繁模式增长算法 局部频繁模式 MAPREDUCE
在线阅读 下载PDF
基于频繁模式树的一种关联规则挖掘算法及其在铁路隧道安全管理中的应用 被引量:9
4
作者 徐维祥 苏晓军 《中国安全科学学报》 CAS CSCD 2007年第3期25-32,共8页
关联规则的FP-growth算法是数据挖掘中性能较好的一种算法,笔者在分析该算法的基础上进行改造探讨,并提出了一种基于FP-tree的高性能关联规则挖掘算法FP-growthN,该新算法特别适合对那些数据量很大但数据项很稀疏的数据进行挖掘。将新... 关联规则的FP-growth算法是数据挖掘中性能较好的一种算法,笔者在分析该算法的基础上进行改造探讨,并提出了一种基于FP-tree的高性能关联规则挖掘算法FP-growthN,该新算法特别适合对那些数据量很大但数据项很稀疏的数据进行挖掘。将新算法用于挖掘铁路隧道各病害的关联中,通过对成都铁路局管辖的2005年的2787条隧道病害数据的343条重点隧道有效病害数据的关联分析,得出了各隧道病害之间隐藏着的关系。新法的提出及其应用结果对铁路部门制定检测标准和防治隧道病害有一定的指导作用。 展开更多
关键词 数据挖掘 关联规则 频繁项集 频繁模式 频繁模式增长 隧道病害
在线阅读 下载PDF
一种单遍扫描频繁模式树结构 被引量:4
5
作者 谭军 卜英勇 杨勃 《计算机工程》 CAS CSCD 北大核心 2010年第14期32-33,共2页
针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构-SP-tree,只需单遍扫描便能容纳全部数据库信息。为使SP-tree具有与FP-tree一样良好的压缩性能,给出一种有效的动态重构树的方法,称为宽度... 针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构-SP-tree,只需单遍扫描便能容纳全部数据库信息。为使SP-tree具有与FP-tree一样良好的压缩性能,给出一种有效的动态重构树的方法,称为宽度排序方法,该方法能够在挖掘过程中动态地逐条分支地重构树,最终产生一棵频繁递减的前缀树。实验结果表明,SP-tree的压缩性能优于其他单遍扫描的前缀树结构。 展开更多
关键词 数据流 频繁模式增长算法 单遍扫描模式 宽度排序方法
在线阅读 下载PDF
一种高效的闭频繁模式挖掘算法 被引量:4
6
作者 谭军 卜英勇 杨勃 《计算机工程与应用》 CSCD 北大核心 2010年第6期130-132,共3页
为了构造条件FP树,必须两次遍历FP树。提出一种FP阵列技术,直接从FP阵列得到频繁项的计数,从而省略了第一次遍历。为了检查闭频繁项集,采用FP树的一种变形结构,并将它与FP阵列结合起来,提出了一种高效的闭频繁模式挖掘算法。实验表明,... 为了构造条件FP树,必须两次遍历FP树。提出一种FP阵列技术,直接从FP阵列得到频繁项的计数,从而省略了第一次遍历。为了检查闭频繁项集,采用FP树的一种变形结构,并将它与FP阵列结合起来,提出了一种高效的闭频繁模式挖掘算法。实验表明,该算法具有很好的性能。 展开更多
关键词 频繁模式增长算法 频繁模式 FP阵列
在线阅读 下载PDF
一种基于FP阵列技术的频繁模式挖掘算法 被引量:2
7
作者 谭军 卜英勇 杨勃 《计算机科学》 CSCD 北大核心 2009年第7期208-210,共3页
在FP-growth算法中,为了产生条件FP树,必须扫描FP树两次。提出一种新颖的FP阵列技术,将FP-tree数据结构与FP阵列有效地结合起来,直接从FP阵列得到频繁项的计数,从而省略了第一次扫描,节省了时间。尤其对于稀疏数据库,该算法在执行时间... 在FP-growth算法中,为了产生条件FP树,必须扫描FP树两次。提出一种新颖的FP阵列技术,将FP-tree数据结构与FP阵列有效地结合起来,直接从FP阵列得到频繁项的计数,从而省略了第一次扫描,节省了时间。尤其对于稀疏数据库,该算法在执行时间上比原FP-growth算法具有更优的性能。 展开更多
关键词 频繁模式增长算法 频繁模式 稀疏数据库 FP阵列
在线阅读 下载PDF
更优的快速频繁模式树生成算法 被引量:3
8
作者 喻斌 武友新 《计算机工程与设计》 CSCD 北大核心 2007年第20期4853-4855,共3页
频繁模式增长算法是一种不产生候选频繁项集的关联规则挖掘算法。利用哈希表来存储数据库中事务信息,可以减少对数据库的扫描次数,从而得到一种更优的快速频繁模式树生成算法,即OFP-tree算法。举例说明了该算法的执行过程并对该算法进... 频繁模式增长算法是一种不产生候选频繁项集的关联规则挖掘算法。利用哈希表来存储数据库中事务信息,可以减少对数据库的扫描次数,从而得到一种更优的快速频繁模式树生成算法,即OFP-tree算法。举例说明了该算法的执行过程并对该算法进行了分析和改进,最后阐述了该算法相对于传统频繁模式树生成算法的优越性。 展开更多
关键词 关联规则 关联挖掘 频繁模式增长 频繁模式 哈希表
在线阅读 下载PDF
数据流上一种单遍扫描频繁模式树结构 被引量:1
9
作者 谭军 卜英勇 陈爱斌 《计算机工程与应用》 CSCD 2013年第2期152-154,共3页
针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构——FPS-tree,只需单遍扫描便能获取当前窗口的全部数据库信息。为了在滑动窗口时有效地删除过期窗格和插入新窗格,提出一个新颖的概念——&... 针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构——FPS-tree,只需单遍扫描便能获取当前窗口的全部数据库信息。为了在滑动窗口时有效地删除过期窗格和插入新窗格,提出一个新颖的概念——"尾结点",FPS-tree中每条路径上的窗格信息只保持在尾结点里。实验结果表明FPS-tree的压缩性能要优于其他单遍扫描的前缀树结构。 展开更多
关键词 数据流 频繁模式增长算法 单遍扫描模式 尾结点
在线阅读 下载PDF
采用映射哈希表的频繁模式挖掘方法 被引量:1
10
作者 陈茵 闪四清 《计算机工程与应用》 CSCD 北大核心 2008年第36期164-167,共4页
大多数对频繁模式挖掘算法的研究都着眼于逻辑层面算法过程的改进,而对数据在计算机内存中的物理存储方式的探索相对较少。以FP-Tree存储结构和FP-Growth算法为基础,提出了FP-Tree头表的顺序存储方式,并在此基础上,利用基于频繁项ID映... 大多数对频繁模式挖掘算法的研究都着眼于逻辑层面算法过程的改进,而对数据在计算机内存中的物理存储方式的探索相对较少。以FP-Tree存储结构和FP-Growth算法为基础,提出了FP-Tree头表的顺序存储方式,并在此基础上,利用基于频繁项ID映射的哈希表对FP-Tree的存储方式进行了改进,提出了与之相对应的频繁模式挖掘算法。实验结果表明该算法是快速和有效的。 展开更多
关键词 关联规则 频繁模式 频繁模式 频繁模式增长 哈希表 映射
在线阅读 下载PDF
基于SQL的频繁模式挖掘的研究与实现
11
作者 李桂杰 张集祥 姜庆月 《计算机应用与软件》 CSCD 北大核心 2006年第7期46-48,62,共4页
频繁模式挖掘是多种数据挖掘应用中的关键问题。以一种高效的频繁模式挖掘算法FP-growth算法为例,利用关系数据库中的表来存储频繁模式树FP-tree,通过标准SQL语言及O rac le数据库PL/SQL编程技术实现了这种基于SQL的频繁模式挖掘方法,... 频繁模式挖掘是多种数据挖掘应用中的关键问题。以一种高效的频繁模式挖掘算法FP-growth算法为例,利用关系数据库中的表来存储频繁模式树FP-tree,通过标准SQL语言及O rac le数据库PL/SQL编程技术实现了这种基于SQL的频繁模式挖掘方法,并给出了该方法较为详细的实现步骤。 展开更多
关键词 频繁模式挖掘 结构化查询语言 频繁模式 频繁模式增长
在线阅读 下载PDF
序列模式挖掘在电力系统警报信息处理中的应用 被引量:9
12
作者 范习辉 张焰 《电力系统自动化》 EI CSCD 北大核心 2005年第13期49-52,共4页
提出了基于时间窗的序列模式挖掘算法,并将其应用于电力系统警报信息的智能处理,由此产生的规则可以补充故障诊断专家系统的知识库,为其提供警报间的时序规则知识,从而更加有效地指导电力系统的故障定位与诊断。通过一个算例说明了所提... 提出了基于时间窗的序列模式挖掘算法,并将其应用于电力系统警报信息的智能处理,由此产生的规则可以补充故障诊断专家系统的知识库,为其提供警报间的时序规则知识,从而更加有效地指导电力系统的故障定位与诊断。通过一个算例说明了所提出的算法的可行性和有效性。 展开更多
关键词 警报处理 序列模式 频繁模式增长 时间窗
在线阅读 下载PDF
基于Spark的并行频繁项集挖掘算法 被引量:6
13
作者 毛伊敏 吴斌 +1 位作者 许春冬 张茂省 《计算机集成制造系统》 EI CSCD 北大核心 2023年第4期1267-1283,共17页
针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(... 针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(SNMF),通过提供支持度计数查询和分解储存支持度计数的矩阵,解决了创建条件FP-tree的时空效率低的问题;其次,提出基于遗传算法的分组策略(GS-GA),均衡分配频繁1项集至各节点,解决了节点间的通信开销大的问题;最后,提出高效缩减树结构策略(ERTSS),缩减FP-tree树结构,解决了冗余搜索的问题。实验结果验证了PAFMFI-Spark算法的可行性以及相较于其他挖掘算法的性能优势,所提算法能有效适应各种数据的频繁项集挖掘。 展开更多
关键词 大数据 Spark框架 并行频繁项集挖掘 频繁模式增长算法 非负矩阵分解
在线阅读 下载PDF
基于FP-Growth数据挖掘的直流串联故障电弧特征提取及检测方法
14
作者 杨晓华 费正源 +3 位作者 代盛国 刘家欣 陈思磊 李兴文 《广东电力》 北大核心 2025年第3期104-112,共9页
为解决传统时频分析方法难以有效提取多种电极材料下的故障电弧特征,导致故障电弧检测装置拒动而引发火灾的问题,提出了基于频繁模式增长(FP-Growth)数据挖掘的直流故障电弧检测算法,实现多种电极材料下的特征有效提取。基于改进粒子群... 为解决传统时频分析方法难以有效提取多种电极材料下的故障电弧特征,导致故障电弧检测装置拒动而引发火灾的问题,提出了基于频繁模式增长(FP-Growth)数据挖掘的直流故障电弧检测算法,实现多种电极材料下的特征有效提取。基于改进粒子群算法对检测算法的准确率、检测时间和内存大小进行协同优化,实现在硬件资源受限条件下故障电弧检测算法最优参数的选取。经过测试验证表明该方法能够快速、有效地检测不同电极材料下的直流串联故障电弧,为基于材料差异的故障电弧特征提取及检测方法的硬件实现提供参考。 展开更多
关键词 故障电弧 频繁模式增长 协同优化 改进粒子群 硬件实现 机器学习
在线阅读 下载PDF
基于FP-Growth的目标编队规律挖掘模型
15
作者 徐秋坪 孙耀宗 《系统工程与电子技术》 北大核心 2025年第5期1620-1626,共7页
面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增... 面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增长算法挖掘目标编组规律知识,从编组运用样式、作战运用样式等维度分析典型编队规律运用特征。该模型易于工程实现,能够基于积累的编队样本数据,挖掘形成典型目标协同作战运用规律知识,通过案例分析介绍该模型的可行性和有效性,可为实时战场编队识别研判、目标态势变化趋势预测、临机动态规划等作战应用提供高价值情报支撑。 展开更多
关键词 编队规律 作战运用特征 频繁模式增长算法
在线阅读 下载PDF
一种新的高效生成FP-Tree条件模式基的算法 被引量:7
16
作者 周钦亮 李玉忱 公爱国 《计算机应用》 CSCD 北大核心 2006年第6期1418-1421,共4页
FP-Tree模式的提出,提高了挖掘效率,是关联规则挖掘史上的一个历程碑。频繁模式增长算法在求取条件模式基时,重复遍历FP-Tree的路径,造成了性能上的浪费。针对此问题,提出一种解决方法,即在遍历FP-Tree每条由叶子到根路径过程中,依次将... FP-Tree模式的提出,提高了挖掘效率,是关联规则挖掘史上的一个历程碑。频繁模式增长算法在求取条件模式基时,重复遍历FP-Tree的路径,造成了性能上的浪费。针对此问题,提出一种解决方法,即在遍历FP-Tree每条由叶子到根路径过程中,依次将路径上的所有结点对应项的条件模式基信息求出并保存,避免了同一路径的重复遍历。理论分析和实验结果表明,修改后的算法的性能明显优于原算法。 展开更多
关键词 数据挖掘 关联规则 频繁模式增长 条件模式
在线阅读 下载PDF
关联规则技术在电力市场营销分析中的应用 被引量:23
17
作者 侯雪波 田斌 +1 位作者 葛少云 路志英 《电力系统及其自动化学报》 CSCD 北大核心 2005年第2期67-72,共6页
关联规则是一种重要的数据挖掘技术。结合电力行业的特殊性,将关联规则应用于对电力市场营销分析中。采取K-Means聚类技术实现对历史数据的离散化处理,以便进行知识归纳,运用关联规则的FP-Growth算法搜索所有的强关联规则,这些强关联规... 关联规则是一种重要的数据挖掘技术。结合电力行业的特殊性,将关联规则应用于对电力市场营销分析中。采取K-Means聚类技术实现对历史数据的离散化处理,以便进行知识归纳,运用关联规则的FP-Growth算法搜索所有的强关联规则,这些强关联规则中蕴含着电量销售与电价、气温、降水等影响因素之间的关联关系。以某市的实际电力营销数据为例,说明了关联规则的分析方法对电力市场营销具有一定的辅助决策意义。 展开更多
关键词 电力市场营销 数据挖掘 关联规则 频繁模式增长算法
在线阅读 下载PDF
考虑全过程优化的支持向量机预测方法 被引量:9
18
作者 帅勇 宋太亮 王建平 《系统工程与电子技术》 EI CSCD 北大核心 2017年第4期931-940,共10页
针对支持向量机(support vector machine,SVM)预测过程中影响因素选择、输入特征集优化、核函数选择及参数优化方面存在的问题,提出了一种全过程优化方法。首先使用频繁模式增长关联规则分析和模糊贝叶斯网络组合模型来解决影响因素选... 针对支持向量机(support vector machine,SVM)预测过程中影响因素选择、输入特征集优化、核函数选择及参数优化方面存在的问题,提出了一种全过程优化方法。首先使用频繁模式增长关联规则分析和模糊贝叶斯网络组合模型来解决影响因素选择中存在的主观性问题,然后使用在异常值处理和类内距离与类间距离方面进行改进的模糊C均值聚类算法优化输入特征集,减小支持向量机预测模型冗余度及训练样本集过修正度,通过比较各核函数的特点选择径向基核函数作为SVC的核函数,改进了粒子群优化算法中微粒速度和位置函数及惯性权重值算法,使用该方法优化SVM参数并建立预测模型。最后,通过案例运算和分析,证明该文方法具有更高的预测精度。 展开更多
关键词 支持向量机 频繁模式增长关联规则 模糊贝叶斯网络 模糊C均值聚类 粒子群优化 全过程
在线阅读 下载PDF
一种新的关联规则挖掘算法研究 被引量:3
19
作者 韦玉科 汪仁煌 +1 位作者 李江平 陈群 《计算机应用研究》 CSCD 北大核心 2008年第10期2962-2964,2969,共4页
通过分析数据关联的特点和已有的关联规则挖掘算法,在定量描述的准确性和算法高效性方面作了进一步研究,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时,改进了FP-growth挖掘算法,并应用于中医舌诊临床... 通过分析数据关联的特点和已有的关联规则挖掘算法,在定量描述的准确性和算法高效性方面作了进一步研究,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时,改进了FP-growth挖掘算法,并应用于中医舌诊临床病例数据库挖掘实验中,可成功准确地提取中医舌诊诊断规则。测试结果表明该算法速度快、准确度高。 展开更多
关键词 数据挖掘 关联规则 频繁模式增长算法 频繁模式 中医诊断
在线阅读 下载PDF
改进的FP-growth算法及其在TE过程故障诊断中的应用 被引量:6
20
作者 李宏光 夏丽君 《北京工业大学学报》 CAS CSCD 北大核心 2016年第5期697-706,共10页
为了解决频繁模式增长(frequent pattern growth,FP-growth)算法因多次遍历频繁集列表而产生庞大频繁模式树需占用大量内存降低了运行效率的问题,提出一种改进的FP-growth(upgraded FP-growth,UFP)算法.首先,构造支持度函数实现各项与... 为了解决频繁模式增长(frequent pattern growth,FP-growth)算法因多次遍历频繁集列表而产生庞大频繁模式树需占用大量内存降低了运行效率的问题,提出一种改进的FP-growth(upgraded FP-growth,UFP)算法.首先,构造支持度函数实现各项与其支持度的映射,使算法的运行效率得到提高;其次,利用关键字筛选技术,把频繁项分成关键项表、非关键项表两部分,保证了最终获取的每条关联规则都是人们关注的有效信息;最后,根据频繁1-项集划分数据库子集并直接构造每一项的条件模式树,节省了内存空间.将UFP算法应用于Tenessee Eastman(TE)过程的故障诊断,通过与主成分分析(principal component analysis,PCA)、核主成分分析(kernel principal component analysis,KPCA)算法在多种故障下的诊断结果对比实验验证了算法的优越性. 展开更多
关键词 频繁模式增长(FP-growth)算法 关联规则 Tenessee Eastman(TE)过程 故障诊断
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部