期刊文献+
共找到265篇文章
< 1 2 14 >
每页显示 20 50 100
基于优化FP⁃Growth算法的滑坡频繁因素组合挖掘
1
作者 李佳颖 郝彬超 +4 位作者 王卫东 王智超 曹禄来 韩征 朱崇政 《防灾减灾工程学报》 北大核心 2025年第3期532-541,共10页
滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方... 滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方检验剔除与滑坡灾害弱相关的影响因素,耦合分析滑坡区域与影响因素区划,针对大数据挖掘算法仅能以历史滑坡次数等离散型变量为挖掘依据的局限性,引入特征参数优化频繁模式树(FPGrowth)算法,使其能以历史滑坡面积和历史滑坡密度等连续型变量为挖掘依据,挖掘滑坡频繁二级因素组合,利用卡方检验与频率比检验挖掘结果准确性。结果表明:基于历史滑坡密度的优化关联规则算法能更好地挖掘滑坡频繁二级因素组合,其中,“高程<1769 m、地表起伏度62~140 m”的区域滑坡最频繁,需要对滑坡灾害重点关注与防治。针对原始关联规则算法仅能以滑坡次数为挖掘依据的局限,优化算法以考虑滑坡范围的影响,深入研究多种影响因素对滑坡的综合作用,为滑坡灾害的快速判识与防灾减灾提供参考。 展开更多
关键词 大数据挖掘技术 优化关联规则算法 FP-GROWTH算法 滑坡影响因素 频繁组合挖掘
在线阅读 下载PDF
基于FP-Growth的目标编队规律挖掘模型
2
作者 徐秋坪 孙耀宗 《系统工程与电子技术》 北大核心 2025年第5期1620-1626,共7页
面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增... 面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增长算法挖掘目标编组规律知识,从编组运用样式、作战运用样式等维度分析典型编队规律运用特征。该模型易于工程实现,能够基于积累的编队样本数据,挖掘形成典型目标协同作战运用规律知识,通过案例分析介绍该模型的可行性和有效性,可为实时战场编队识别研判、目标态势变化趋势预测、临机动态规划等作战应用提供高价值情报支撑。 展开更多
关键词 编队规律 作战运用特征 频繁模式增长算法
在线阅读 下载PDF
基于随机森林算法的配电网频繁停电预警技术研究 被引量:1
3
作者 张宏伟 《农村电气化》 2025年第3期1-6,47,共7页
传统的频繁停电管控模式主要是人工多系统查询、手动计算等方式进行统计分析,工作量大,数据分析不全面,严重制约对配电网管理的科学性、先进性和精益化水平。文章将基础数据和频繁停电及停电线变户数据结构化、规范化,形成大数据生态归... 传统的频繁停电管控模式主要是人工多系统查询、手动计算等方式进行统计分析,工作量大,数据分析不全面,严重制约对配电网管理的科学性、先进性和精益化水平。文章将基础数据和频繁停电及停电线变户数据结构化、规范化,形成大数据生态归集和管理,挖掘“数字价值”,使用支持向量机和逻辑回归同时进行预测,减小分类出错的概率,使用随机森林算法加以改进。从客户实际用电体验的角度,研究了新客户电力供应敏感程度的分类模型和计算方法,并采用多种机器学习相结合的方法,基于客户敏感程度以及停电事件相关特征数据来对客户投诉的概率进行预测。 展开更多
关键词 配电网 供电台区 大数据 随机森林算法 频繁停电
在线阅读 下载PDF
基于改进FP-growth算法的食品风险因素关联分析方法
4
作者 于家斌 马欣玥 +5 位作者 赵峙尧 王小艺 张新 崔晓玉 白玉廷 陈帅祥 《食品科学》 EI CAS CSCD 北大核心 2024年第23期250-258,共9页
为解决传统食品安全监督抽检“随机抽”模式存在的抽检决策主观性强、靶向性不高的问题,本研究提出一种基于改进Frequent Pattern-growth(FP-growth)算法的食品风险因素关联分析方法。首先,采用熵权法分别对食品种类的风险指标进行权重... 为解决传统食品安全监督抽检“随机抽”模式存在的抽检决策主观性强、靶向性不高的问题,本研究提出一种基于改进Frequent Pattern-growth(FP-growth)算法的食品风险因素关联分析方法。首先,采用熵权法分别对食品种类的风险指标进行权重分配,以计算出不同食品种类的风险指数。其次,以风险指数为特征,基于小批量K均值算法(MiniBatchKmeans)进行风险聚类,得到食品的风险等级。最后,采用带约束的改进FP-growth算法进行食品风险因素关联规则挖掘,挖掘食品风险等级与食品种类、时间、地域属性信息之间的关联关系,并对挖掘出的结果进行关联分析,从而为精准靶向引导抽检决策提供指导。本研究依托2019年中国某些地区的食品抽检数据进行分析,对其进行指标赋权,计算风险指数;后经过风险聚类为低风险、中风险和高风险;最后,将数据导入改进FPgrowth算法,得到食品风险因素关联规则。通过对比实验得到结果:对于17214条抽检数据,本研究提出的改进FP-growth算法相较于Apriori算法运行时间短;相较于传统FP-growth算法,删除了无效规则,提高了对食品风险因素关联规则的分析效率,从而为食品监管部门抽检工作提供了准确、高效的决策依据。 展开更多
关键词 食品安全监督抽检 关联分析 熵权法 MinibatchKmeans聚类 frequent pattern-growth算法
在线阅读 下载PDF
An Improved Apriori Algorithm
5
作者 LIU Shan LIAO Yongyi 《现代电子技术》 2007年第4期106-107,110,共3页
In this paper,We study the Apriori and FP-growth algorithm in mining association rules and give a method for computing all the frequent item-sets in a database.Its basic idea is giving a concept based on the boolean v... In this paper,We study the Apriori and FP-growth algorithm in mining association rules and give a method for computing all the frequent item-sets in a database.Its basic idea is giving a concept based on the boolean vector business product,which be computed between all the businesses,then we can get all the two frequent item-sets(minsup=2).We basis their inclusive relation to construct a set-tree of item-sets in database transaction,and then traverse path in it and get all the frequent item-sets.Therefore,we can get minimal frequent item sets between transactions and items in the database without scanning the database and iteratively computing in Apriori algorithm. 展开更多
关键词 数据挖掘 挖掘规则 先验算法 频繁项集 商业产品
在线阅读 下载PDF
基于频繁模式挖掘算法的中医问诊策略研究
6
作者 李瑞珍 夏春明 +2 位作者 王忆勤 许朝霞 熊玉洁 《世界科学技术-中医药现代化》 CSCD 北大核心 2024年第6期1608-1617,共10页
目的研究中医问诊策略,实现快速捕捉患者的关键病情信息,推进中医问诊客观化的发展。方法采用基于关联分析中频繁模式挖掘算法的症状提问模型,并使用交叉合并的方法建立中医单系统症状提问与多系统综合症状提问的中医症状问诊策略,达到... 目的研究中医问诊策略,实现快速捕捉患者的关键病情信息,推进中医问诊客观化的发展。方法采用基于关联分析中频繁模式挖掘算法的症状提问模型,并使用交叉合并的方法建立中医单系统症状提问与多系统综合症状提问的中医症状问诊策略,达到通过最短的时间、最高的效率来获取到患者关键病情信息。结果实现了从单系统问诊到五系统综合问诊的突破,通过单系统与五系统两种症状提问模式实现了高效获取患者病情信息的过程,且对比传统量表提问方式,系统减少了65%的提问次数就可获取到患者92%的症状信息,大大提高了对患者症状信息获取的效率。结论在两种不同的症状提问模式下,打破了中医基于量表来询问患者的传统问诊模式,缩短了对患者症状获取的时间,简化了问诊流程,减少了由于经验不足或人为主观造成的差异,能够用于中医临床辅助诊断中。 展开更多
关键词 中医问诊 频繁模式挖掘算法 症状关联性 问诊策略
在线阅读 下载PDF
基于隐结构模型和频繁项集的针刺治疗慢性前列腺炎辨证取穴规律 被引量:3
7
作者 胡创政 孙自学 +4 位作者 张宸铭 樊立鹏 华众 付晓君 门波 《世界中医药》 CAS 北大核心 2024年第8期1182-1187,共6页
目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢... 目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢性前列腺炎病历数据库,运用隐结构模型分析、频繁项集等方法,分析针刺治疗慢性前列腺炎的辨证取穴规律。结果:共纳入文献64篇,涉及穴位91个,症状248项。高频穴位如三阴交、中极等;高频症状包括舌体瘀点瘀斑、苔黄腻、滴白、尿急等;构建隐结构模型,得出慢性前列腺炎主要证型有湿热下注、肾阳不足等;挖掘出症状-穴位频繁项集、症状-证型-穴位频繁项集各4项。症状-穴位频繁项集如“尿急+滴白+阳痿+早泄+肾俞+足三里”,症状-证型-穴位频繁项集如“尿频+尿急+苔黄腻+滴白+舌体瘀点瘀斑+湿热瘀阻+三阴交+会阴”,提示治疗时可根据相应症状判定证型及选择对应穴位。结论:针刺治疗慢性前列腺炎多以三阴交、中极、关元等为主要穴位,穴位配伍依据临床情况辨证选穴,此可为临床治疗慢性前列腺炎提供参考。 展开更多
关键词 隐结构模型 频繁项集 慢性前列腺炎 数据挖掘 辨证取穴规律 针刺 穴位 APRIORI算法
在线阅读 下载PDF
基于隐结构模型联合频繁项集的针灸治疗弱精子症不育患者的辨证取穴规律 被引量:1
8
作者 何瑞宣 孙自学 +3 位作者 华众 张芳 张迪 胡创政 《世界中医药》 CAS 北大核心 2024年第14期2185-2190,共6页
目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针... 目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针灸治疗弱精子症的相关文献,提取症状、取穴处方信息构建医案数据库,采用隐结构模型、频繁项集的数据挖掘方法,分析针灸治疗弱精子症的辨证取穴规律。结果:纳入文献35篇,涉及症状62种,穴位49个。高频症状包括腰酸、神疲乏力等,高频腧穴包括关元、肾俞等。对症状、腧穴、证型进行频繁项集分析,挖掘出症状-腧穴频繁项集4项,包括耳鸣+头晕+腰酸+关元+肾俞等;证型-症状频繁项集4项,包括肾精亏虚证+健忘+性欲淡漠+神疲乏力+脉细等;证型-症状-腧穴频繁项集4项,包括肾精亏虚证+性欲淡漠+神疲乏力+头发易脱+关元等。结论:针灸治疗弱精子症多以关元、肾俞、足三里为主穴。 展开更多
关键词 隐结构模型 频繁项集 弱精子症 辨证取穴规律 数据挖掘 Apriori算法 穴位 针灸
在线阅读 下载PDF
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
9
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 FP—growth算法 FP—tree
在线阅读 下载PDF
改进模糊关联规则及其在电站锅炉运行优化中的应用 被引量:7
10
作者 刘延泉 刘欣 +1 位作者 宋云燕 许丹莉 《华北电力大学学报(自然科学版)》 CAS 北大核心 2011年第6期60-67,共8页
提出了一种改进的模糊关联规则挖掘算法对电厂运行优化目标值进行确定,首先利用竞争凝聚算法决定分类数、软化划分边界并构造优化的模糊数据集,再结合某300 MW机组的历史运行数据,以供电煤耗率作为优化目标,利用频繁模式树生成算法得到... 提出了一种改进的模糊关联规则挖掘算法对电厂运行优化目标值进行确定,首先利用竞争凝聚算法决定分类数、软化划分边界并构造优化的模糊数据集,再结合某300 MW机组的历史运行数据,以供电煤耗率作为优化目标,利用频繁模式树生成算法得到的频繁项集进行关联规则挖掘,最终得到运行参数最优值,实验结果和理论分析表明挖掘结果能够正确反映机组运行机理、可以作为指导机组优化运行的重要依据。 展开更多
关键词 运行优化目标值 模糊关联规则 竞争凝聚算法 频繁模式生成算法
在线阅读 下载PDF
云制造环境下并行频繁模式增长算法优化 被引量:5
11
作者 王洁 戴清灏 +1 位作者 曾宇 杨东日 《计算机集成制造系统》 EI CSCD 北大核心 2012年第9期2124-2129,共6页
针对云制造环境下的海量数据挖掘,分析了现有并行频繁模式增长算法的实现和不足。研究了利用键值存储系统对其中的计数和分组部分进行优化。利用键值型数据库存储简单、自动增长且有序的方式,将计数和分组的信息存储在了键值型数据库上... 针对云制造环境下的海量数据挖掘,分析了现有并行频繁模式增长算法的实现和不足。研究了利用键值存储系统对其中的计数和分组部分进行优化。利用键值型数据库存储简单、自动增长且有序的方式,将计数和分组的信息存储在了键值型数据库上。通过减少对分布式文件系统的读写,并将计数过程和排序过程并行化执行,优化后的算法减小了存储节点的网络及内存开销。在真实数据集上,通过实验对比了优化前后算法的性能以及对于文件系统I/O的开销。 展开更多
关键词 云制造 并行频繁模式增长算法 键值存储系统 数据挖掘 算法优化
在线阅读 下载PDF
基于Spark的并行FP-Growth算法优化与实现 被引量:8
12
作者 陆可 桂伟 +1 位作者 江雨燕 杜萍萍 《计算机应用与软件》 2017年第9期273-278,共6页
频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集... 频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集下频繁模式挖掘展开研究,基于Spark框架,通过对支持度计数和分组过程的优化改进了FP-Growth算法,并实现了算法的分布式计算和计算资源的动态分配。运算过程中产生的中间结果均保存在内存中,因此有效减少数据的I/O消耗,提高算法的运行效率。实验结果表明,经优化后的算法在面向大规模数据时要优于传统的FP-Growth算法。 展开更多
关键词 频繁模式挖掘 FP-GROWTH算法 分布式计算 Spark框架
在线阅读 下载PDF
基于Spark的并行频繁项集挖掘算法 被引量:7
13
作者 毛伊敏 吴斌 +1 位作者 许春冬 张茂省 《计算机集成制造系统》 EI CSCD 北大核心 2023年第4期1267-1283,共17页
针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(... 针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(SNMF),通过提供支持度计数查询和分解储存支持度计数的矩阵,解决了创建条件FP-tree的时空效率低的问题;其次,提出基于遗传算法的分组策略(GS-GA),均衡分配频繁1项集至各节点,解决了节点间的通信开销大的问题;最后,提出高效缩减树结构策略(ERTSS),缩减FP-tree树结构,解决了冗余搜索的问题。实验结果验证了PAFMFI-Spark算法的可行性以及相较于其他挖掘算法的性能优势,所提算法能有效适应各种数据的频繁项集挖掘。 展开更多
关键词 大数据 Spark框架 并行频繁项集挖掘 频繁模式增长算法 非负矩阵分解
在线阅读 下载PDF
负载均衡的FP-growth并行算法研究 被引量:10
14
作者 曾志勇 杨呈智 陶冶 《计算机工程与应用》 CSCD 北大核心 2010年第4期125-126,229,共3页
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证... 针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。 展开更多
关键词 数据挖掘 并行算法 FP—growth 频繁模式
在线阅读 下载PDF
基于IS~±树模型的频繁模式挖掘 被引量:3
15
作者 马海兵 张成洪 +1 位作者 张锦 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2005年第4期588-593,共6页
IS-树是一种新型的全文存储索引模型.提出一种基于扩展I-S树模型的频繁模式挖掘算法.和FPgrowth方法一样,算法直接构造频繁项集,不进行Apriori算法所采用的代价很高的候选集产生与测试操作.然而它比FP-树模型具有更多的优点:只需扫描一... IS-树是一种新型的全文存储索引模型.提出一种基于扩展I-S树模型的频繁模式挖掘算法.和FPgrowth方法一样,算法直接构造频繁项集,不进行Apriori算法所采用的代价很高的候选集产生与测试操作.然而它比FP-树模型具有更多的优点:只需扫描一遍事务库;挖掘任务只局部关联于一棵根树;动态更新性好,仅做增量变化.实验表明,其具有与FP-growth算法相当甚至更高的效率.更重要的是,IS+树模型同时是一种事务库的良好索引形式,具有高效支持事务查询的能力. 展开更多
关键词 频繁模式 APRIORI算法 FP—growth算法 IS-树 IS^+-树
在线阅读 下载PDF
基于加权频繁模式树的通信网络告警规则挖掘方法 被引量:14
16
作者 罗明 孟传伟 黄海量 《计算机工程》 CAS CSCD 北大核心 2016年第4期190-196,共7页
传统通信网络告警处理方法主要由维护专家依据经验判断形成处理规则并固化在网络告警系统中进行实现,然而该人工维护方式难以适应海量数据环境下实时通信告警规则的处理需求。为此,提出一种基于加权频繁模式树(WFP-tree)算法的告警规则... 传统通信网络告警处理方法主要由维护专家依据经验判断形成处理规则并固化在网络告警系统中进行实现,然而该人工维护方式难以适应海量数据环境下实时通信告警规则的处理需求。为此,提出一种基于加权频繁模式树(WFP-tree)算法的告警规则自动挖掘方法,将原始告警数据按时间窗口方式进行分段处理,通过BP神经网络、支持向量机、层次分析法生成告警设备的权重信息,并采用WFP-tree算法自动挖掘加权频繁项集。实验结果表明,与传统Apriori和FP-growth算法相比,WFP-tree算法在通信网络告警分析方面具有更好的频繁项压缩效果及更强的重要关联规则发现能力。 展开更多
关键词 通信网络告警 关联规则 权重因子 加权频繁项集 FP-GROWTH算法 加权频繁模式树算法 支持度
在线阅读 下载PDF
关联规则挖掘的矩阵算法 被引量:33
17
作者 曾万聃 周绪波 +2 位作者 戴勃 常桂然 李春平 《计算机工程》 CAS CSCD 北大核心 2006年第2期45-47,共3页
关联挖掘算法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显。... 关联挖掘算法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显。文章提出了一种新的关联规则挖掘算法:矩阵算法。同Apriori算法相比较,该算法能直接查找高次频繁项集,可以有效地屏蔽Apriori算法性能瓶颈。试验结果表明,当频繁项级较高时该算法比Apriori具有更高的执行效率和性能,并具有良好的可行性。 展开更多
关键词 关联挖掘 APRIORI算法 频繁项集 矩阵算法
在线阅读 下载PDF
Apriori算法的三种优化方法 被引量:71
18
作者 徐章艳 刘美玲 +2 位作者 张师超 卢景丽 区玉明 《计算机工程与应用》 CSCD 北大核心 2004年第36期190-192,202,共4页
通过对Apriori算法的思想和性能的分析,认为Apriori算法存在以下三点不足:(1)由K阶频繁集生成K+1阶候选频繁集时,在K+1阶候选频繁集中过滤掉非频繁集的策略值得进一步改进;(2)连接程序中相同的项目重复比较太多,因而其效率值得进一步改... 通过对Apriori算法的思想和性能的分析,认为Apriori算法存在以下三点不足:(1)由K阶频繁集生成K+1阶候选频繁集时,在K+1阶候选频繁集中过滤掉非频繁集的策略值得进一步改进;(2)连接程序中相同的项目重复比较太多,因而其效率值得进一步改进;(3)在回扫数据库时有许多不必比较的项目或事务重复比较。根据上述三点不足,提出了相应的三种优化策略来优化Apriori算法,得到一效率较高的改进Apriori算法。 展开更多
关键词 关联规则 APRIORI算法 频繁项集 非频繁项集
在线阅读 下载PDF
Apriori算法的一种优化方法 被引量:47
19
作者 钱光超 贾瑞玉 +1 位作者 张然 李龙澍 《计算机工程》 CAS CSCD 北大核心 2008年第23期196-198,共3页
介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出一种改进的Apriori算法——En-Apriori算法。该算法采用矩阵的方法,只须扫描一遍数据库,同时优化了连接操作,较好地提高了算法的效率。... 介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出一种改进的Apriori算法——En-Apriori算法。该算法采用矩阵的方法,只须扫描一遍数据库,同时优化了连接操作,较好地提高了算法的效率。实验结果表明,En-Apriori算法优于Apriori算法,具有较好的实用性。 展开更多
关键词 关联规则 频繁项集 APRIORI算法 En—Apriori算法
在线阅读 下载PDF
数据挖掘中关联规则的一种高效Apriori算法 被引量:29
20
作者 李清峰 杨路明 +1 位作者 张晓峰 龙艳军 《计算机应用与软件》 CSCD 北大核心 2004年第12期84-86,共3页
在数据挖掘中关联规则的频繁项集计算时 ,通过一种改进的Apriori算法 ,即用升序替代原来的按字母次序对项集进行排序 ,可大大精简候选频繁集 ,而且能保持频繁集的完整性 ,减少计算开销。
关键词 数据挖掘 关联规则 数据库 频繁项集 APRIORI算法
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部