期刊文献+
共找到421篇文章
< 1 2 22 >
每页显示 20 50 100
利用模糊关联规则挖掘和遗传算法的工业产品设计优化方法
1
作者 张晴 李丛 高广银 《西南大学学报(自然科学版)》 北大核心 2025年第7期207-218,共12页
在工业产品开发流程的初始阶段,需要处理大量的多维度工业数据。然而,这个过程中的复杂性和不确定性容易导致模糊前端(FFE)问题,增加产品设计的难度。为解决这一问题,避免产品设计中的缺陷,提出一种多层人工智能产品设计方法,该方法结... 在工业产品开发流程的初始阶段,需要处理大量的多维度工业数据。然而,这个过程中的复杂性和不确定性容易导致模糊前端(FFE)问题,增加产品设计的难度。为解决这一问题,避免产品设计中的缺陷,提出一种多层人工智能产品设计方法,该方法结合了多层人工智能技术:大数据分析、基于递归关联规则的模糊推理系统(RAFIS)以及Mamdani模糊推理系统。所提出的方法通过将模糊关联规则挖掘(FARM)和遗传算法(GA)纳入RAFIS,以缩小客户属性和设计参数之间的差距。首先,在FFE阶段,组织数据收集和管理,然后将数据集输入FARM和GA以获取最佳模糊规则和隶属函数。随后,利用这些结果建立用于定制产品设计特征的Mamdani模糊推理系统。通过优化Mamdani推理系统中的参数(包括隶属函数的类型、分区和范围),实现产品定制设计。实验以电动滑板车为例进行应用分析,并采用模糊综合评价方法评估设计方案。结果表明两种设计方案均获得较高满意度,验证了该方法的有效性和可行性。 展开更多
关键词 人工智能 产品设计 模糊关联规则挖掘 遗传算法 大数据分析
在线阅读 下载PDF
基于Apriori算法的供电公司营销数据挖掘系统设计
2
作者 张剑 刘畅 +3 位作者 杨逸 魏昕喆 张浩 王旭 《兵工自动化》 北大核心 2025年第7期97-101,共5页
为解决供电公司营销数据量大,影响数据频繁项集处理效率的问题,设计一种基于Apriori算法的供电公司营销数据挖掘系统。硬件设计通过营销数据挖掘系统物理架构部署,搭建系统硬件环境,实现数据库信息的同步;软件方面设计电力营销数据仓库... 为解决供电公司营销数据量大,影响数据频繁项集处理效率的问题,设计一种基于Apriori算法的供电公司营销数据挖掘系统。硬件设计通过营销数据挖掘系统物理架构部署,搭建系统硬件环境,实现数据库信息的同步;软件方面设计电力营销数据仓库,采用Apriori算法通过映射剪枝处理频繁项集,挖掘关联规则,建立多维数据挖掘模型,实现系统的数据挖掘功能。经实验论证分析,结果表明:该系统在电力负荷预测应用中的预测结果与实际值相差较小,在最小支持度和事务数据量条件下,数据挖掘执行时间分别在2和10 s以下,具有较高的执行效率,说明该系统是可行的。 展开更多
关键词 APRIORI算法 供电公司 服务器 营销数据挖掘系统 关联规则 数据仓库
在线阅读 下载PDF
基于改进Apriori算法的不良驾驶行为关联分析
3
作者 韩锐 于长海 +1 位作者 丁庆国 石朋炜 《现代电子技术》 北大核心 2025年第14期50-56,共7页
不良驾驶行为的复杂化趋势会对道路交通安全构成严重威胁。为挖掘不良驾驶行为的潜在规律,文章通过车载诊断系统(OBD)采集哈尔滨乘用车早晚高峰时段的行驶数据,利用Python数据处理平台识别超速、急变速、急转弯及快速变道共4种不良驾驶... 不良驾驶行为的复杂化趋势会对道路交通安全构成严重威胁。为挖掘不良驾驶行为的潜在规律,文章通过车载诊断系统(OBD)采集哈尔滨乘用车早晚高峰时段的行驶数据,利用Python数据处理平台识别超速、急变速、急转弯及快速变道共4种不良驾驶行为。基于行为数据集,提出一种改进的Apriori关联规则挖掘算法。引入粒子群优化(PSO)算法优化Apriori算法中的支持度与置信度两个重要参数,并使用哈希映射表提高Apriori算法的运行效率。实验结果表明,改进Apriori算法在两种数据集上的运行时间较传统Apriori算法分别提高8.26%、9.27%。关联结果显示,不良驾驶行为并非单独存在,其中急转弯、快速变道、急加速关联性最强,超速行为与急变速次之。该研究能够为驾驶风格量化分析提供参考,可应用于交通事故主动预警系统。 展开更多
关键词 驾驶安全 不良驾驶行为 数据挖掘 关联分析 改进Apriori算法 粒子群优化算法
在线阅读 下载PDF
基于优化FP⁃Growth算法的滑坡频繁因素组合挖掘
4
作者 李佳颖 郝彬超 +4 位作者 王卫东 王智超 曹禄来 韩征 朱崇政 《防灾减灾工程学报》 北大核心 2025年第3期532-541,共10页
滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方... 滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方检验剔除与滑坡灾害弱相关的影响因素,耦合分析滑坡区域与影响因素区划,针对大数据挖掘算法仅能以历史滑坡次数等离散型变量为挖掘依据的局限性,引入特征参数优化频繁模式树(FPGrowth)算法,使其能以历史滑坡面积和历史滑坡密度等连续型变量为挖掘依据,挖掘滑坡频繁二级因素组合,利用卡方检验与频率比检验挖掘结果准确性。结果表明:基于历史滑坡密度的优化关联规则算法能更好地挖掘滑坡频繁二级因素组合,其中,“高程<1769 m、地表起伏度62~140 m”的区域滑坡最频繁,需要对滑坡灾害重点关注与防治。针对原始关联规则算法仅能以滑坡次数为挖掘依据的局限,优化算法以考虑滑坡范围的影响,深入研究多种影响因素对滑坡的综合作用,为滑坡灾害的快速判识与防灾减灾提供参考。 展开更多
关键词 大数据挖掘技术 优化关联规则算法 FP-GROWTH算法 滑坡影响因素 频繁组合挖掘
在线阅读 下载PDF
基于改进ECLAT算法的混凝土坝变形预测模型
5
作者 赵昕 苏怀智 方正 《中国农村水利水电》 北大核心 2025年第4期58-64,共7页
为提高大坝安全监测数据库的数据挖掘效率,引入改进的ECLAT关联规则算法。利用数据挖掘技术分析处理数量庞大的大坝安全监测数据,并建立大坝坝顶垂直位移预测模型。首先筛选出对大坝坝顶垂直位移的主要影响因素环境温度、坝前水温和坝... 为提高大坝安全监测数据库的数据挖掘效率,引入改进的ECLAT关联规则算法。利用数据挖掘技术分析处理数量庞大的大坝安全监测数据,并建立大坝坝顶垂直位移预测模型。首先筛选出对大坝坝顶垂直位移的主要影响因素环境温度、坝前水温和坝前水位,然后用Eclat算法对预处理后的基本资料进行数据挖掘,筛选出可以用于预测的强关联规则,最后利用坝顶垂直位移对温度变化反应的滞后性,建立坝顶垂直位移预测模型。将本模型应用于某混凝土拱坝中,试验表明该模型的本次预测结果具有一定的可靠性。 展开更多
关键词 大坝安全监测 坝顶垂直位移 关联规则 Eclat算法 数据挖掘
在线阅读 下载PDF
基于多级实体关联的光栅断点故障数据并行挖掘方法
6
作者 陈思 赵鹏 杨潞霞 《激光杂志》 北大核心 2025年第4期180-185,共6页
在光栅断点故障数据中,存在多种类型的实体,这些实体具有多个层级,导致关联分析变得复杂,加大了故障数据挖掘的难度。多级实体关联分析考虑了故障数据的多层次特性,通过关联相似性能够对故障数据进行更为全面的捕捉。因此,提出基于多级... 在光栅断点故障数据中,存在多种类型的实体,这些实体具有多个层级,导致关联分析变得复杂,加大了故障数据挖掘的难度。多级实体关联分析考虑了故障数据的多层次特性,通过关联相似性能够对故障数据进行更为全面的捕捉。因此,提出基于多级实体关联的光栅断点故障数据并行挖掘方法。采用多级实体关联模型,通过层次化分析计算关联相似度,有效捕捉和简化光栅断点故障数据的复杂关系和层次结构。在MapReduce框架下,结合多级实体关联的层次化相似性结果,采用区间型FCM聚类算法对大规模光栅断点故障数据进行并行挖掘。实验结果表明,所提方法在处理光栅断点故障数据时,能够显著提升并行挖掘的吞吐量,使其稳定维持在6 kbps以上,并且显著降低了计算开销。 展开更多
关键词 多级实体关联 关联相似度 光栅断点 故障数据 并行挖掘
在线阅读 下载PDF
基于轨迹数据的大规模路网交通拥挤时空关联规则挖掘 被引量:9
7
作者 周启帆 刘海旭 +1 位作者 董志鹏 徐银 《系统仿真学报》 CAS CSCD 北大核心 2024年第1期260-271,共12页
提出了K近邻RElim(K neighbor-RElim,KNR)算法和时序K近邻RElim(sequential KNbrRElim,SKNR)算法,利用大规模路网的车辆轨迹数据来挖掘路段拥挤关联规则和拥挤传播时空关联规则。其中KNR算法在RElim算法基础上拓展了空间拓扑约束,可高... 提出了K近邻RElim(K neighbor-RElim,KNR)算法和时序K近邻RElim(sequential KNbrRElim,SKNR)算法,利用大规模路网的车辆轨迹数据来挖掘路段拥挤关联规则和拥挤传播时空关联规则。其中KNR算法在RElim算法基础上拓展了空间拓扑约束,可高效从大规模车辆轨迹数据集中挖掘路网中关联性拥挤易发路段,并量化这些路段间拥挤的关联性强度。而SKNR算法进一步以滑动窗口的形式拓展时间维度,可以挖掘出大规模路网中难以直接观测的拥挤传播现象,并追溯拥挤传播路径。以成都路网和车辆轨迹数据的挖掘结果对所提出的算法进行了说明和验证,结果表明了算法的有效性和鲁棒性。 展开更多
关键词 数据挖掘 关联规则 拥挤传播 轨迹数据 RElim算法
在线阅读 下载PDF
一次性条件下的三支序列模式挖掘 被引量:1
8
作者 杨仕琦 武优西 +1 位作者 耿萌 李艳 《计算机工程与科学》 CSCD 北大核心 2024年第7期1286-1295,共10页
一次性条件下的序列模式挖掘旨在从序列数据中挖掘出带有间隙约束的重复序列模式。然而,现有方法不考虑用户的兴趣度,将序列中的每个字符视作同等重要,导致许多用户不感兴趣的冗余模式被发现。为了解决这个问题,将三支决策思想引入序列... 一次性条件下的序列模式挖掘旨在从序列数据中挖掘出带有间隙约束的重复序列模式。然而,现有方法不考虑用户的兴趣度,将序列中的每个字符视作同等重要,导致许多用户不感兴趣的冗余模式被发现。为了解决这个问题,将三支决策思想引入序列模式挖掘领域,提出了一次性条件下的三支序列模式挖掘问题及其求解算法。在支持度计算方面,该算法基于深度优先搜索和回溯的策略,结合三支模式的特点以高效求解模式支持度。在候选模式生成方面,该算法采用模式连接策略缩减候选模式数量。此外,该算法还采用了并行化方案充分利用现代处理器的多核性能,提高算法的挖掘效率。最后,实验结果验证了研究一次性条件下的三支序列模式挖掘问题的意义和算法的高效性。 展开更多
关键词 序列模式挖掘 三支决策 三支序列模式 一次性 并行化算法
在线阅读 下载PDF
基于Eclat算法的八字门滑坡变形因素关联性分析 被引量:2
9
作者 李明亮 吕梅洁 +1 位作者 侯梦媛 朱昊 《长江科学院院报》 CSCD 北大核心 2024年第6期150-155,共6页
针对滑坡监测数据库数据量大,进行关联规则分析需要多次扫描数据库导致运行时间长的问题,将Eclat关联规则算法引入滑坡监测数据挖掘中,通过K-means聚类法和Eclat算法对八字门滑坡的变形进行了分析。通过综合研究,选择了降雨量监测值和... 针对滑坡监测数据库数据量大,进行关联规则分析需要多次扫描数据库导致运行时间长的问题,将Eclat关联规则算法引入滑坡监测数据挖掘中,通过K-means聚类法和Eclat算法对八字门滑坡的变形进行了分析。通过综合研究,选择了降雨量监测值和库水位监测值中的6种因素进行数据挖掘分析。分别挖掘了3种降雨因子和3种库水位因子与八字门滑坡多测点位移的关联性,并从八字门滑坡时空监测大数据挖掘出的全部关联规则中选择8个具有较高的置信水平的关联规则进行分析,发现降雨和库水位因素影响八字门滑坡运动的有效信息。结果表明,这种数据挖掘方法及其在监测数据研究中的高精度,有望广泛应用于库区堆积滑坡的数据分析和预测。 展开更多
关键词 八字门滑坡 Eclat算法 关联规则 数据挖掘 三峡库区
在线阅读 下载PDF
采掘关联规则的高效并行算法 被引量:37
10
作者 铁治欣 陈奇 俞瑞钊 《计算机研究与发展》 EI CSCD 北大核心 1999年第8期948-953,共6页
采掘关联规则是数据采掘领域的一个重要问题.文中对采掘关联规则问题进行了简单的回顾;给出了一种提高顺序采掘关联规则效率的方法;分析了已有并行采掘关联规则算法的优缺点;设计了一个效率较高的并行采掘关联规则的算法PMAR;... 采掘关联规则是数据采掘领域的一个重要问题.文中对采掘关联规则问题进行了简单的回顾;给出了一种提高顺序采掘关联规则效率的方法;分析了已有并行采掘关联规则算法的优缺点;设计了一个效率较高的并行采掘关联规则的算法PMAR;并与其它相应算法进行了比较.实验证明,算法PMAR是有效的. 展开更多
关键词 数据采掘 关联规则 并行算法 数据库
在线阅读 下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:97
11
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁项集 候选项集
在线阅读 下载PDF
基于特征挖掘的电网故障诊断方法 被引量:46
12
作者 李再华 白晓民 +5 位作者 周子冠 许婧 李晓珺 张霖 孟珺遐 朱宁辉 《中国电机工程学报》 EI CSCD 北大核心 2010年第10期16-22,共7页
专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了... 专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了故障信息的特征,如时序和因果关联关系、故障性质、严重故障、稀有故障等因素;增加了规则的"或"逻辑;改进了FP-树的修剪技术。算例表明该算法能够大量减少无效挖掘,推理速度和准确度显著提高,适用于在线诊断。 展开更多
关键词 数据挖掘 关联规则 特征挖掘 频繁模式一算法 故障诊断 专家系统
在线阅读 下载PDF
数据库中关联规则的并行挖掘算法 被引量:11
13
作者 王运峰 张蕾 +1 位作者 韩纪富 黄勇 《计算机工程与应用》 CSCD 北大核心 2001年第16期99-100,共2页
提出了数据库中挖掘关联规则的并行算法,探讨了相关的数据结构,并对算法进行了定性分析。该算法不仅适用于布尔型属性,而且也适用于非布尔型属性。
关键词 关联规则 并行算法 数据挖掘 频繁项目集 数据库
在线阅读 下载PDF
一种基于栈变换的高效关联规则挖掘算法 被引量:15
14
作者 惠晓滨 张凤鸣 +1 位作者 虞健飞 牛世民 《计算机研究与发展》 EI CSCD 北大核心 2003年第2期330-335,共6页
在一个模式信息保全引理的基础上 ,提出了一个基于频繁模式栈变换的关联规则挖掘算法FPST ,给出了相应的栈构造和栈变换的算法描述 ,并进行了算法的性能分析和比较试验 。
关键词 栈变换 高效关联规则挖掘算法 数据库 数据挖掘算法 频繁模式 关联规则
在线阅读 下载PDF
一种挖掘压缩序列模式的有效算法 被引量:8
15
作者 童咏昕 张媛媛 +3 位作者 袁玫 马世龙 余丹 赵莉 《计算机研究与发展》 EI CSCD 北大核心 2010年第1期72-80,共9页
从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法.由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注... 从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法.由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注于如何让用户更容易地理解序列模式的结果集.受压缩频繁项集思想的启发,提出了一种CFSP(compressing frequent sequential patterns)算法,其可挖掘出少量有代表性的序列模式来表达全部频繁序列模式的信息,并且清除了大量的冗余序列模式.CFSP是一种two-steps的算法:在第1步,其获得了全部闭序列模式作为有代表性序列模式的候选集,与此同时还得到大多数的有代表性模式;在第2步,该算法只花费了少量的时间去发现剩余的有代表性序列模式.一个采用真实数据集与模拟数据集的实验研究也证明了CFSP算法具有高效性. 展开更多
关键词 挖掘序列模式 压缩 频繁模式挖掘 关联规则 数据挖掘
在线阅读 下载PDF
数据库中加权关联规则的发现 被引量:96
16
作者 欧阳为民 郑诚 蔡庆生 《软件学报》 EI CSCD 北大核心 2001年第4期612-619,共8页
关联规则发现是数据库中知识发现研究中的热点课题 ,有着广泛的应用领域 .在现有的研究中 ,数据库中的各个项目是按平等一致的方式加以处理的 .然而 ,在现实世界数据库中却并非如此 ,不同的项目往往有着不同的重要性 .为了将它们反映出... 关联规则发现是数据库中知识发现研究中的热点课题 ,有着广泛的应用领域 .在现有的研究中 ,数据库中的各个项目是按平等一致的方式加以处理的 .然而 ,在现实世界数据库中却并非如此 ,不同的项目往往有着不同的重要性 .为了将它们反映出来 ,对项目引入权值 ,从而提出了新的加权关联规则问题 .由于项目权值的引入 ,频繁项目集的子集不再一定是频繁的 .为此 ,又提出了项目的 k-支持期望概念 ,并由此提出了加权关联规则的发现算法 . 展开更多
关键词 数据发掘 知识发现 加权关联规则 数据库
在线阅读 下载PDF
多段支持度数据挖掘算法研究 被引量:23
17
作者 李雄飞 苑森淼 +1 位作者 董立岩 全勃 《计算机学报》 EI CSCD 北大核心 2001年第6期661-665,共5页
在基于相联规则的数据挖掘算法中 ,Apriori等算法最为著名 .它分为两个主要步骤 :(1)通过多趟扫描数据库求解出频繁项集 ;(2 )利用频繁项集生成规则 .随后的许多算法都沿用 Apriori中“频繁项集的子集必为频繁项集”的思想 ,在频繁项集 ... 在基于相联规则的数据挖掘算法中 ,Apriori等算法最为著名 .它分为两个主要步骤 :(1)通过多趟扫描数据库求解出频繁项集 ;(2 )利用频繁项集生成规则 .随后的许多算法都沿用 Apriori中“频繁项集的子集必为频繁项集”的思想 ,在频繁项集 Lk- 1 上进行 JOIN运算构成潜在 k项集 Ck.由于数据库和 Ck 的规模较大 ,需要相当大的计算量才能生成频繁项集 .Apriori Tid算法给每个事务增加了一个唯一标识 Tid ,其特点是只扫描一趟数据库 ,其余趟扫描 (如第 k趟扫描 )均在相应的数据集 Ck上进行 .由于数据规模改变不大 ,各算法的效率差别并不明显 .该文提出分段计算支持度的思想 ,是把一个项集的支持度分段计算 ,每一个段记录该项集在相应规模事务中出现的频度 ,从而构成一个支持度向量 .由于有了项集的多段支持度 ,可以推测出该项集能否包含在更大规模的频繁项集中 ,采用这种算法既提高了在扫描数据库过程中的信息获取率 ,又能及时剔除超集不是频繁项集的项集 ,进一步缩减了潜在项集的规模 .在数据集扫描过程中 ,按文中定理 1的思想调整数据集 。 展开更多
关键词 数据挖掘 相联规则 算法 频繁项集 多段支持度 数据库
在线阅读 下载PDF
一种基于多叉树的并行Apriori算法 被引量:12
18
作者 郭方方 梁晓 +2 位作者 王慧强 钱真 陈江涛 《小型微型计算机系统》 CSCD 北大核心 2015年第6期1176-1180,共5页
在云计算环境下,如何在大数据中进行关联规则挖掘是目前研究的重点和热点.目前已有的并行Apriori算法访问数据库频繁,时间复杂度高,且存储开销大.据此提出一种基于多叉树的并行Apriori算法.首先,依据垂直分割的思想,将原事务数据库转换... 在云计算环境下,如何在大数据中进行关联规则挖掘是目前研究的重点和热点.目前已有的并行Apriori算法访问数据库频繁,时间复杂度高,且存储开销大.据此提出一种基于多叉树的并行Apriori算法.首先,依据垂直分割的思想,将原事务数据库转换为布尔型项目数据库并用二进制形式存储.其次,将记录集分割成n个子集,由多个节点并行计算,并使用多叉树结构存储频繁项.方法用于某网络安全态势感知系统后的结果表明,该算法与现有方法相比减小了对数据存储空间的要求,降低了数据库的访问次数,缩短了算法的运行时间. 展开更多
关键词 数据挖掘 关联规则 并行Apriori算法 多叉树 二进制存储
在线阅读 下载PDF
关联规则挖掘Apriori算法的研究与改进 被引量:121
19
作者 刘华婷 郭仁祥 姜浩 《计算机应用与软件》 CSCD 2009年第1期146-149,共4页
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,... 关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法。该算法基于新的数据结构,改进了产生候选项集的连接方法。在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著。 展开更多
关键词 数据挖掘 关联规则 频繁项集 APRIORI算法
在线阅读 下载PDF
分布式并行关联规则挖掘算法研究 被引量:13
20
作者 王智钢 王池社 马青霞 《计算机应用与软件》 CSCD 北大核心 2013年第10期113-115,119,共4页
关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避... 关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避免全局FP-tree可能过大而内存无法容纳的问题,算法在各个主要步骤上都实现了并行处理。算法测试结果和分析表明,与传统的关联规则挖掘算法FP-Growth相比,该算法通过多节点分布式并行处理显著提高了执行效率和处理能力。 展开更多
关键词 数据挖掘 关联规则 频繁模式 并行算法
在线阅读 下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部