期刊文献+
共找到84篇文章
< 1 2 5 >
每页显示 20 50 100
基于FP-growth的老年行人交通事故损伤致因研究
1
作者 刘永涛 张慧臣 +3 位作者 袁诗泉 高隆鑫 王鹏 赵晨 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第6期176-182,共7页
为研究老年行人交通事故相关因素及其对损伤程度的影响,以中国交通事故深度调查数据库中2013—2023年710起机动车-老年行人事故为分析对象,利用FP-growth算法挖掘出4类影响因素28个类型变量共5594项关联规则。研究结果表明:行人年龄、... 为研究老年行人交通事故相关因素及其对损伤程度的影响,以中国交通事故深度调查数据库中2013—2023年710起机动车-老年行人事故为分析对象,利用FP-growth算法挖掘出4类影响因素28个类型变量共5594项关联规则。研究结果表明:行人年龄、碰撞速度、事故时间段及事故地点是影响老年行人事故死亡率的显著因素。特别是,行人年龄和碰撞速度对死亡率有显著影响,随着碰撞速度的增加,死亡率显著上升;60岁及以上老年行人年龄每增加1岁,其死亡率提升0.037倍。此外,事故发生在夜间、郊区或村庄的死亡率更高。研究结果可为提高老年行人交通安全,制定相关安全措施提供一定参考。 展开更多
关键词 fp-growth算法 逻辑回归模型 老年行人安全 交通事故数据分析
在线阅读 下载PDF
基于优化FP⁃Growth算法的滑坡频繁因素组合挖掘
2
作者 李佳颖 郝彬超 +4 位作者 王卫东 王智超 曹禄来 韩征 朱崇政 《防灾减灾工程学报》 北大核心 2025年第3期532-541,共10页
滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方... 滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方检验剔除与滑坡灾害弱相关的影响因素,耦合分析滑坡区域与影响因素区划,针对大数据挖掘算法仅能以历史滑坡次数等离散型变量为挖掘依据的局限性,引入特征参数优化频繁模式树(FPGrowth)算法,使其能以历史滑坡面积和历史滑坡密度等连续型变量为挖掘依据,挖掘滑坡频繁二级因素组合,利用卡方检验与频率比检验挖掘结果准确性。结果表明:基于历史滑坡密度的优化关联规则算法能更好地挖掘滑坡频繁二级因素组合,其中,“高程<1769 m、地表起伏度62~140 m”的区域滑坡最频繁,需要对滑坡灾害重点关注与防治。针对原始关联规则算法仅能以滑坡次数为挖掘依据的局限,优化算法以考虑滑坡范围的影响,深入研究多种影响因素对滑坡的综合作用,为滑坡灾害的快速判识与防灾减灾提供参考。 展开更多
关键词 大数据挖掘技术 优化关联规则算法 fp-growth算法 滑坡影响因素 频繁组合挖掘
在线阅读 下载PDF
基于改进FP-Growth算法和贝叶斯的营业线施工安全风险分析 被引量:2
3
作者 蔡近近 宋瑞 +2 位作者 何世伟 赵日鑫 姜俊平 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第8期3370-3381,共12页
铁路营业线施工事故致因因素众多且存在关联关系,挖掘事故致因之间的关联关系和因果关系对事故的预防管控具有重要意义。通过文本挖掘对2010—2022年某路局营业线事故调查报告进行处理,提取出51个事故致因因素。基于事故因果连锁理论将... 铁路营业线施工事故致因因素众多且存在关联关系,挖掘事故致因之间的关联关系和因果关系对事故的预防管控具有重要意义。通过文本挖掘对2010—2022年某路局营业线事故调查报告进行处理,提取出51个事故致因因素。基于事故因果连锁理论将致因因素分为人因层、设备层、环境层、管理层4个层级进行分层分析,构建铁路营业线施工事故致因体系。基于压缩算法和差分编码对传统FP-Growth算法进行改进,以此对铁路营业线施工事故致因进行挖掘,找到满足提升度要求的高支持度关联规则和高置信度关联规则,发现关键致因关联和事故致因规律。基于贝叶斯网络理论、致因关联关系和专家经验建立营业线施工安全风险贝叶斯网络,结合复杂网络理论分析网络节点度、聚类系数与节点介数等特征,找到关键致因因素。在此基础上,运用因果推理和故障诊断推理进一步剖析营业线施工过程中的高风险致因,并从“人防、物防、技防”3方面提出预防管控措施。案例结果表明:施工人员操作不当、施工造成接触网故障、施工导致设施设备侵限、施工作业损害电缆设备、施工造成轨道电路故障和施工、检修、清扫设备耽误列车类事故之间的关联关系较为频繁,且为红光带事故的高概率致因,在施工作业过程中应多层次重点预防管控。研究成果为铁路营业线施工安全管理提供一种新的风险分析方法。 展开更多
关键词 铁路营业线施工事故 改进fp-growth算法 关联规则挖掘 贝叶斯网络推理 致因体系
在线阅读 下载PDF
基于FP-Growth算法的新能源配电网CPS网络攻击检测方法 被引量:4
4
作者 李瑞 刘珊 闫磊 《电信科学》 北大核心 2024年第11期103-113,共11页
为有效分析识别有源配电网信息物理系统(cyberphysicalsystem,CPS)状态,提出基于FP-Growth算法的有源配电网信息物理系统网络攻击检测方法。首先分析考虑网络攻击的有源配电网控制模型及CPS网络攻击影响机理,通过实时仿真平台对有源配电... 为有效分析识别有源配电网信息物理系统(cyberphysicalsystem,CPS)状态,提出基于FP-Growth算法的有源配电网信息物理系统网络攻击检测方法。首先分析考虑网络攻击的有源配电网控制模型及CPS网络攻击影响机理,通过实时仿真平台对有源配电网CPS信息侧和物理侧进行监测来获取原始数据;然后通过额定电压、电流值制订数据离散化规则,并根据规则对原始数据进行离散量化处理来生成事件序列。在此基础上,采用FP-Growth算法挖掘历史数据异常信号的频繁项集和强关联关系,通过已有频繁序列特征对新的攻击类别和故障点进行识别,实现对有源配电网CPS网络攻击的检测。最后,仿真实验验证了所提方法的可行性和有效性。 展开更多
关键词 有源配电网 信息物理系统 网络攻击 fp-growth算法 事件序列
在线阅读 下载PDF
基于布尔矩阵和MapReduce的FP-Growth算法 被引量:23
5
作者 陈兴蜀 张帅 +1 位作者 童浩 崔晓靖 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期135-141,共7页
关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和MapReduce的FP-Growth算法(BPFP),分析了算法的时间和空间复杂度.该算法使用Hadoop框架和布尔矩阵以减少对事务数据的扫描次数,利用两次Ma... 关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和MapReduce的FP-Growth算法(BPFP),分析了算法的时间和空间复杂度.该算法使用Hadoop框架和布尔矩阵以减少对事务数据的扫描次数,利用两次MapReduce来实现频繁项集的挖掘.在多个数据集上的实验结果表明,与原FP-Growth算法相比,BPFP算法具有更高的执行效率、更好的加速比. 展开更多
关键词 数据挖掘 关联规则 布尔矩阵 MAPREDUCE fp-growth算法
在线阅读 下载PDF
基于负载均衡和冗余剪枝的并行FP-Growth算法 被引量:8
6
作者 刘祥哲 刘培玉 +2 位作者 任敏 伊静 高钊 《数据采集与处理》 CSCD 北大核心 2016年第1期223-230,共8页
针对现有的并行FP-Growth算法在数据并行分组时存在数据冗余和负载不均的问题,提出了基于负载估算和冗余剪枝的优化算法。首先,在采用高频策略分组时,引入节点任务估算方法,把每个分组中最大模式树的最长路径和支持度作为该分组的估计值... 针对现有的并行FP-Growth算法在数据并行分组时存在数据冗余和负载不均的问题,提出了基于负载估算和冗余剪枝的优化算法。首先,在采用高频策略分组时,引入节点任务估算方法,把每个分组中最大模式树的最长路径和支持度作为该分组的估计值,将估计值远大于其他节点的分组进行分割,平均到其他分组中,并且对不同分组中重复的列表元素进行截断,去除冗余数据。实验表明,本文提出的算法能够有效防止并行化的数据倾斜,减少数据冗余,在时间和空间复杂度上要低于以前的并行化FP-Growth算法。 展开更多
关键词 关联规则 MAPREDUCE 冗余剪枝 fp-growth算法
在线阅读 下载PDF
基于FP-growth算法的高校群体性突发事件关联规则分析 被引量:14
7
作者 姬浩 苏兵 吕美 《中国安全科学学报》 CAS CSCD 北大核心 2012年第12期144-151,共8页
为有效预防高校群体性突发事件,借助数据挖掘关联规则挖掘理论,在分析高校突发事件关键诱发因素基础上,构建基于FP-growth算法的高校群体性突发事件关联规则挖掘模型。并将模型应用于事务数据库数据的分析中,研究关键诱发因素间关联关系... 为有效预防高校群体性突发事件,借助数据挖掘关联规则挖掘理论,在分析高校突发事件关键诱发因素基础上,构建基于FP-growth算法的高校群体性突发事件关联规则挖掘模型。并将模型应用于事务数据库数据的分析中,研究关键诱发因素间关联关系,实现强关联规则输出。研究结果表明,多数高校群体性突发事件的发生与日期没有必然联系;内部管理因素、内外部突发事件、内部突发事件、政治因素是诱发高校群体性突发事件的主要因素,且外部因素导致的群体性突发事件影响力远远超过内部因素的影响力;当突发事件发生后,应急处置的有效性是决定突发事件影响力的重要因素。 展开更多
关键词 高校安全 群体性突发事件 数据挖掘 fp-growth算法 关联规则
在线阅读 下载PDF
基于Spark框架的FP-Growth大数据频繁项集挖掘算法 被引量:13
8
作者 邵梁 何星舟 尚俊娜 《计算机应用研究》 CSCD 北大核心 2018年第10期2932-2935,共4页
针对大数据中的频繁项集挖掘问题,提出一种基于Spark框架的FP-Growth频繁项集并行挖掘算法。首先,根据垂直布局思想将数据按照事务标志符垂直排列,以此解决扫描整个数据集的缺陷;然后,通过FPGrowth算法构建频繁模式树,并生成频繁1-项集... 针对大数据中的频繁项集挖掘问题,提出一种基于Spark框架的FP-Growth频繁项集并行挖掘算法。首先,根据垂直布局思想将数据按照事务标志符垂直排列,以此解决扫描整个数据集的缺陷;然后,通过FPGrowth算法构建频繁模式树,并生成频繁1-项集;接着,通过扫描垂直数据集来计算项集的支持度,从而识别出非频繁项,并将其从数据集中删除以降低数据尺寸;最后,通过迭代过程来生成频繁k-项集。在标准数据集上的实验结果表明,该算法能够有效挖掘出频繁项集,在执行时间方面具有很大的优越性。 展开更多
关键词 大数据 频繁项集挖掘 Spark框架 fp-growth算法 垂直布局
在线阅读 下载PDF
基于FP-Growth算法和GRNN的电力知识文本挖掘 被引量:10
9
作者 白勇 张占龙 熊隽迪 《计算机科学》 CSCD 北大核心 2021年第8期86-90,共5页
为了提高电力知识文本挖掘的性能,采用FP-Growth算法对影响电力需求的强关联因素进行挖掘,运用广义回归神经网络(General Regression Neural Network,GRNN)算法实现电力需求预测。首先,对待挖掘的电力文本进行指标提取并编码,生成电力... 为了提高电力知识文本挖掘的性能,采用FP-Growth算法对影响电力需求的强关联因素进行挖掘,运用广义回归神经网络(General Regression Neural Network,GRNN)算法实现电力需求预测。首先,对待挖掘的电力文本进行指标提取并编码,生成电力文本初始FP-Tree;接着采用FP-Growth算法遍历所有FP-Tree,生成频繁集,过滤掉小于最小支持度的项,留下频数较高的频繁项;然后根据更新后的FP-Tree统计关联项,选择与总用电量增长率关联强的变量生成训练样本;最后采用GRNN算法对电力需求文本进行训练,输入电力需求预测样本,设置平滑因子,通过模式层的输出和加权求和来获得电力需求预测结果。实验结果证明,通过合理设置最小支持度和GRNN的平滑因子,能够获得较好的电力文本挖掘性能,与常用挖掘算法相比,所提算法能够获得更高的电力需求预测准确率。 展开更多
关键词 电力文本挖掘 fp-growth算法 广义回归神经网络 平滑因子 频繁集
在线阅读 下载PDF
基于改进FP-Growth算法的CRHX型动车组牵引系统关联失效模型研究 被引量:5
10
作者 王艳辉 王淑君 +1 位作者 李曼 林帅 《铁道学报》 EI CAS CSCD 北大核心 2016年第9期72-80,共9页
基于CRHX型动车组牵引系统运营过程中的故障数据,分析故障数据的特征,研究设备之间的关联失效关系。依托课题组前期对故障信息特征词提取的研究,本文结合故障信息特征词的特点优化经典的关联规则挖掘算法,提出改进的FP-Growth算法,并进... 基于CRHX型动车组牵引系统运营过程中的故障数据,分析故障数据的特征,研究设备之间的关联失效关系。依托课题组前期对故障信息特征词提取的研究,本文结合故障信息特征词的特点优化经典的关联规则挖掘算法,提出改进的FP-Growth算法,并进行算法性能测试,结果表明该算法准确高效;基于改进的FPGrowth算法分析设备的故障信息特征词,挖掘设备关联失效规则,建立设备的关联失效模型。最后,以CRHX型动车组牵引系统为例进行研究,验证了改进FP-Growth算法的有效性和实用性。 展开更多
关键词 故障信息 改进fp-growth算法 关联规则 关联失效模型
在线阅读 下载PDF
基于Spark的并行FP-Growth算法优化与实现 被引量:8
11
作者 陆可 桂伟 +1 位作者 江雨燕 杜萍萍 《计算机应用与软件》 2017年第9期273-278,共6页
频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集... 频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集下频繁模式挖掘展开研究,基于Spark框架,通过对支持度计数和分组过程的优化改进了FP-Growth算法,并实现了算法的分布式计算和计算资源的动态分配。运算过程中产生的中间结果均保存在内存中,因此有效减少数据的I/O消耗,提高算法的运行效率。实验结果表明,经优化后的算法在面向大规模数据时要优于传统的FP-Growth算法。 展开更多
关键词 频繁模式挖掘 fp-growth算法 分布式计算 Spark框架
在线阅读 下载PDF
基于FP-Growth算法的盾构掘进参数与隧道管片渗漏关联性分析 被引量:4
12
作者 吴惠明 杨威 +1 位作者 姜芃 高新闻 《隧道建设》 北大核心 2016年第5期513-517,共5页
为研究隧道管片渗漏与盾构掘进参数之间的关联性,对关联规则中的Apriori算法与FP-Growth算法进行比较,选择FPGrowth算法作为文章研究使用的关联规则算法。选取关键掘进参数并对其数据筛选、划分及编码。采用FP-Growth算法,结合Matlab数... 为研究隧道管片渗漏与盾构掘进参数之间的关联性,对关联规则中的Apriori算法与FP-Growth算法进行比较,选择FPGrowth算法作为文章研究使用的关联规则算法。选取关键掘进参数并对其数据筛选、划分及编码。采用FP-Growth算法,结合Matlab数据分析语言编程,挖掘基于掘进参数频繁项集的管片渗漏关联规则,分析关键掘进参数渗漏原理。依据渗漏频繁项集和渗漏规则,推荐4个关键掘进参数组合的预设范围,并应用在某隧道东线的盾构掘进中。结果表明,关键掘进参数组合优化后的成环管片发生渗漏的概率降低29.36%。 展开更多
关键词 隧道管片 关联规则 fp-growth算法 渗漏水 掘进参数
在线阅读 下载PDF
一种基于FP-growth算法的变电站二次设备缺陷分析方法 被引量:28
13
作者 肖永立 刘松 +1 位作者 见伟 宋亚奇 《电测与仪表》 北大核心 2020年第12期83-90,共8页
为提高监控人员面对设备海量缺陷信息的研判能力,丰富监控人员缺陷处理的技术手段,提出了一种基于FP-growth算法的变电站二次设备缺陷分析方法。利用关联规则挖掘的思想,为智能变电站二次设备建立缺陷模型,并利用FP-growth算法进行了缺... 为提高监控人员面对设备海量缺陷信息的研判能力,丰富监控人员缺陷处理的技术手段,提出了一种基于FP-growth算法的变电站二次设备缺陷分析方法。利用关联规则挖掘的思想,为智能变电站二次设备建立缺陷模型,并利用FP-growth算法进行了缺陷数据的挖掘和分析,挖掘二次设备、缺陷和缺陷原因的关联规则。通过对国家电网公司真实缺陷数据分析,表明所提方法可以有效发现变电站、二次设备、缺陷性质、缺陷原因等因素之间的关联关系,为二次设备高效管控和运维提供有价值信息。 展开更多
关键词 二次设备 缺陷分析 关联规则 fp-growth算法
在线阅读 下载PDF
负载均衡的FP-growth并行算法研究 被引量:10
14
作者 曾志勇 杨呈智 陶冶 《计算机工程与应用》 CSCD 北大核心 2010年第4期125-126,229,共3页
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证... 针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。 展开更多
关键词 数据挖掘 并行算法 fpgrowth 频繁模式
在线阅读 下载PDF
基于FP-Growth算法的民航鸟击事件关联性分析 被引量:6
15
作者 贾萌 邵荃 张金石 《安全与环境学报》 CAS CSCD 北大核心 2016年第1期110-114,共5页
鸟击问题严重威胁航空器运行安全,给航空业造成了巨大的经济损失,为了有效预防民航鸟击事件的发生,根据数据挖掘理论,在分析民航鸟击事件关键诱发属性基础上,提出了一种基于FPGrowth算法的民航鸟击事件关联性分析方法。根据中国民航鸟... 鸟击问题严重威胁航空器运行安全,给航空业造成了巨大的经济损失,为了有效预防民航鸟击事件的发生,根据数据挖掘理论,在分析民航鸟击事件关键诱发属性基础上,提出了一种基于FPGrowth算法的民航鸟击事件关联性分析方法。根据中国民航鸟击事件统计数据,挖掘出鸟击事件各属性间潜在的、有价值的关联,通过设置最小支持度和最小置信度,得出重要的关联性规则。结果表明,该方法根据历史数据可推测出导致鸟击事件发生的相关因素,改善了以往凭借专家经验的片面性、模糊性和不确定性。通过飞机发动机设计、颜色涂装等措施切断导致鸟击事件发生的相关因素,达到有效预防鸟击事件的效果,完善防治措施,最大限度地避免鸟类撞击航空器,保障民航运输安全。 展开更多
关键词 安全工程 鸟击 数据挖掘 fp-growth算法 关联性 防治措施
在线阅读 下载PDF
基于FP-Growth算法的配电网薄弱点分析研究 被引量:7
16
作者 黄悦华 邹子豪 +1 位作者 张赟宁 杨艾竹 《电测与仪表》 北大核心 2020年第17期79-84,135,共7页
随着配电网快速发展,对配电网运行稳定性的要求也愈来愈高。但由于设备复杂度高、外界因素影响较多,造成配电网故障时有发生。针对配电网设备通常于薄弱点处发生故障的问题,文中提出薄弱度的概念来量化分析薄弱点。同时,为判断薄弱点的... 随着配电网快速发展,对配电网运行稳定性的要求也愈来愈高。但由于设备复杂度高、外界因素影响较多,造成配电网故障时有发生。针对配电网设备通常于薄弱点处发生故障的问题,文中提出薄弱度的概念来量化分析薄弱点。同时,为判断薄弱点的薄弱程度,将配电网薄弱度设置为等于FP-Growth算法中支持度的数值。随后将库尔钦斯基(Kulczynski)度量与不平衡比配合使用,验证关联规则的强关联性及是否有意义。通过算例及实际运行情况验证了该方法的有效性,为配电网运行薄弱点的分析检测提供支持。 展开更多
关键词 薄弱点分析 数据挖掘 fp-growth算法 故障诱因 薄弱度
在线阅读 下载PDF
基于Hadoop的FP-Growth关联规则并行改进算法 被引量:15
17
作者 厍向阳 张玲 《计算机应用研究》 CSCD 北大核心 2018年第1期109-112,共4页
大数据环境下,传统的串行FP-Growth算法在处理海量数据时,占用内存过大、频繁项多,适用于大数据情况的PFP(parallel FP-Growth)算法存在数据量增大无法处理的缺陷。针对这些问题,提出了基于Hadoop的负载均衡数据分割FP-Growth并行算法。... 大数据环境下,传统的串行FP-Growth算法在处理海量数据时,占用内存过大、频繁项多,适用于大数据情况的PFP(parallel FP-Growth)算法存在数据量增大无法处理的缺陷。针对这些问题,提出了基于Hadoop的负载均衡数据分割FP-Growth并行算法。在Hadoop平台下,使用负载均衡和数据分割相结合的方式对原始事务数据集分片实现并行化。实验证明,基于Hadoop的负载均衡数据分割FP-Growth并行算法在处理数据量和效率上有所提高。 展开更多
关键词 fp-growth算法 HADOOP 数据分割 负载均衡
在线阅读 下载PDF
基于FP-Growth算法的四物汤类方配伍规律及应用研究 被引量:2
18
作者 陶静 范欣生 +3 位作者 张欢 段金廒 王崇峻 刘正 《世界科学技术-中医药现代化》 2010年第6期909-914,共6页
目的:运用数据挖掘方法,挖掘单味药、药对之间的关联关系,分析类方和药对内部的组成关系,探讨四物汤的配伍规律。方法:收集四物汤类方3487首,针对四物汤药物配伍和药对特征,对单味药、药对之间的关联关系,分别采用频繁模式、FP-Growth... 目的:运用数据挖掘方法,挖掘单味药、药对之间的关联关系,分析类方和药对内部的组成关系,探讨四物汤的配伍规律。方法:收集四物汤类方3487首,针对四物汤药物配伍和药对特征,对单味药、药对之间的关联关系,分别采用频繁模式、FP-Growth算法。结果:获得置信度>0.15的四物汤配伍常用药有甘草、人参、肉桂、茯苓,常用药对有当归-甘草、川芎-甘草、地黄-甘草、芍药-甘草、人参-甘草、茯苓-甘草。结论:四物汤常用配伍主要有补益药、行气药、温里药、清热药、活血化瘀药,并由此形成常用药对,在妇科疾病的治疗中得到了广泛的应用。 展开更多
关键词 四物汤 类方 数据挖掘 fp-growth算法
在线阅读 下载PDF
基于FP-Growth改进算法的轮胎质量数据分析 被引量:9
19
作者 李敏波 丁铎 易泳 《中国机械工程》 EI CAS CSCD 北大核心 2019年第2期244-251,共8页
针对轮胎制造过程质量异常的问题分析,介绍了轮胎质量数据获取、有效整合与数据分析流程,基于Hive数据仓库构建了生产数据与产品检测数据相关联的结构化数据集。针对现有频繁模式增长(FP-Growth)算法存在FP树建树性能较低与大数据处理... 针对轮胎制造过程质量异常的问题分析,介绍了轮胎质量数据获取、有效整合与数据分析流程,基于Hive数据仓库构建了生产数据与产品检测数据相关联的结构化数据集。针对现有频繁模式增长(FP-Growth)算法存在FP树建树性能较低与大数据处理效率低的问题,提出了一种改进的FPGrowth算法,在原有的频繁项头表基础上新增一个tail属性,加速FP树构建。实验结果表明,改进后的FP-Growth并行算法能够有效提高轮胎质量异常数据的关联分析效率,能够找出影响轮胎质量的生产制造重要因素,并且适用于大数据量的数据挖掘。 展开更多
关键词 工业大数据 质量分析 fp-growth算法 数据挖掘
在线阅读 下载PDF
集群系统中的FP-Growth并行算法 被引量:8
20
作者 陈敏 李徽翡 《计算机工程》 CAS CSCD 北大核心 2009年第20期71-72,75,共3页
针对FP-Growth算法面临大规模数据库时空效率不高的问题,提出一种面向计算机集群的并行算法。采用投影方法直接寻找频繁项的条件数据库,将挖掘条件数据库的工作分化成若干独立的子任务,分配到集群中的节点上并行实现,由中央节点汇总结... 针对FP-Growth算法面临大规模数据库时空效率不高的问题,提出一种面向计算机集群的并行算法。采用投影方法直接寻找频繁项的条件数据库,将挖掘条件数据库的工作分化成若干独立的子任务,分配到集群中的节点上并行实现,由中央节点汇总结果并输出。结果证明,该算法不仅能够提高计算速度,解决数据库规模过大时内存溢出的情况,且具有良好的延展性。 展开更多
关键词 fp-growth算法 计算机集群 并行算法
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部