期刊文献+
共找到547篇文章
< 1 2 28 >
每页显示 20 50 100
基于优化FP⁃Growth算法的滑坡频繁因素组合挖掘
1
作者 李佳颖 郝彬超 +4 位作者 王卫东 王智超 曹禄来 韩征 朱崇政 《防灾减灾工程学报》 北大核心 2025年第3期532-541,共10页
滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方... 滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方检验剔除与滑坡灾害弱相关的影响因素,耦合分析滑坡区域与影响因素区划,针对大数据挖掘算法仅能以历史滑坡次数等离散型变量为挖掘依据的局限性,引入特征参数优化频繁模式树(FPGrowth)算法,使其能以历史滑坡面积和历史滑坡密度等连续型变量为挖掘依据,挖掘滑坡频繁二级因素组合,利用卡方检验与频率比检验挖掘结果准确性。结果表明:基于历史滑坡密度的优化关联规则算法能更好地挖掘滑坡频繁二级因素组合,其中,“高程<1769 m、地表起伏度62~140 m”的区域滑坡最频繁,需要对滑坡灾害重点关注与防治。针对原始关联规则算法仅能以滑坡次数为挖掘依据的局限,优化算法以考虑滑坡范围的影响,深入研究多种影响因素对滑坡的综合作用,为滑坡灾害的快速判识与防灾减灾提供参考。 展开更多
关键词 大数据挖掘技术 优化关联规则算法 FP-GROWTH算法 滑坡影响因素 频繁组合挖掘
在线阅读 下载PDF
关联规则挖掘综述 被引量:139
2
作者 蔡伟杰 张晓辉 +1 位作者 朱建秋 朱扬勇 《计算机工程》 CAS CSCD 北大核心 2001年第5期31-33,49,共4页
介绍了关联规则挖掘的研究性况,提出了关联规则的分类方法,对一些典型算法进行了分析和秤价,指出传统关系规则衡量标准的不足,归纳出关联规则的价值衡量方,展望了关联规则挖掘的未来研究方向。
关键词 数据挖掘 关联规则 OLAP 数据库 知识发现
在线阅读 下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
3
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
在线阅读 下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:96
4
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁项集 候选项集
在线阅读 下载PDF
一种有效的隐私保护关联规则挖掘方法 被引量:53
5
作者 张鹏 童云海 +2 位作者 唐世渭 杨冬青 马秀莉 《软件学报》 EI CSCD 北大核心 2006年第8期1764-1774,共11页
隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据... 隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据干扰和查询限制这两种隐私保护的基本策略相结合,提出了一种新的数据随机处理方法,即部分隐藏的随机化回答(randomizedresponsewithpartialhiding,简称RRPH)方法,以对原始数据进行变换和隐藏.然后以此为基础,针对经过RRPH方法处理后的数据,给出了一种简单而又高效的频繁项集生成算法,进而实现了隐私保护的关联规则挖掘.理论分析和实验结果均表明,基于RRPH的隐私保护关联规则挖掘方法具有很好的隐私性、准确性、高效性和适用性. 展开更多
关键词 隐私保护 数据挖掘 关联规则 频繁项集 随机化回答
在线阅读 下载PDF
Apriori算法的三种优化方法 被引量:71
6
作者 徐章艳 刘美玲 +2 位作者 张师超 卢景丽 区玉明 《计算机工程与应用》 CSCD 北大核心 2004年第36期190-192,202,共4页
通过对Apriori算法的思想和性能的分析,认为Apriori算法存在以下三点不足:(1)由K阶频繁集生成K+1阶候选频繁集时,在K+1阶候选频繁集中过滤掉非频繁集的策略值得进一步改进;(2)连接程序中相同的项目重复比较太多,因而其效率值得进一步改... 通过对Apriori算法的思想和性能的分析,认为Apriori算法存在以下三点不足:(1)由K阶频繁集生成K+1阶候选频繁集时,在K+1阶候选频繁集中过滤掉非频繁集的策略值得进一步改进;(2)连接程序中相同的项目重复比较太多,因而其效率值得进一步改进;(3)在回扫数据库时有许多不必比较的项目或事务重复比较。根据上述三点不足,提出了相应的三种优化策略来优化Apriori算法,得到一效率较高的改进Apriori算法。 展开更多
关键词 关联规则 APRIORI算法 频繁项集 非频繁项集
在线阅读 下载PDF
关联规则挖掘中若干关键技术的研究 被引量:62
7
作者 陈耿 朱玉全 +3 位作者 杨鹤标 陆介平 宋余庆 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2005年第10期1785-1789,共5页
Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解... Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解决第2个问题,并已取得了很好的效果·然而,对于第1个问题,仍沿用Apriori算法中的解决方案,其运算量是较大的·为此,提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该算法与Apriori类算法相结合,可以进一步提高算法的执行效率,实验结果也表明算法是有效、快速的· 展开更多
关键词 数据挖掘 关联规则 频繁项目集
在线阅读 下载PDF
快速更新频繁项集 被引量:63
8
作者 朱玉全 孙志挥 赵传申 《计算机研究与发展》 EI CSCD 北大核心 2003年第1期94-99,共6页
发现频繁项集是数据挖掘应用中的关键问题 ,发现过程的高花费要求对增量数据挖掘算法进行深入研究 首先分析并指出了增量式更新频繁项集算法的技术难点———寻找新的有效频繁项集 ;其次提出了一种快速的增量式更新频繁项集算法FUFIA ;
关键词 快速更新频繁项集 数据挖掘 关联规则 频繁项集 事务数据库
在线阅读 下载PDF
关联规则挖掘的矩阵算法 被引量:33
9
作者 曾万聃 周绪波 +2 位作者 戴勃 常桂然 李春平 《计算机工程》 CAS CSCD 北大核心 2006年第2期45-47,共3页
关联挖掘算法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显。... 关联挖掘算法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显。文章提出了一种新的关联规则挖掘算法:矩阵算法。同Apriori算法相比较,该算法能直接查找高次频繁项集,可以有效地屏蔽Apriori算法性能瓶颈。试验结果表明,当频繁项级较高时该算法比Apriori具有更高的执行效率和性能,并具有良好的可行性。 展开更多
关键词 关联挖掘 APRIORI算法 频繁项集 矩阵算法
在线阅读 下载PDF
负关联规则的研究 被引量:33
10
作者 董祥军 王淑静 +1 位作者 宋瀚涛 陆玉昌 《北京理工大学学报》 EI CAS CSCD 北大核心 2004年第11期978-981,共4页
传统的关联规则是A B的形式,将这种形式加以扩展,讨论了A B,A B,A B三种形式,给出了一种负关联规则中支持度与置信度简单有效的计算方法。讨论了同时研究正、负关联规则后出现的矛盾规则问题,提出了用相关性解决这些问题的方法和一种挖... 传统的关联规则是A B的形式,将这种形式加以扩展,讨论了A B,A B,A B三种形式,给出了一种负关联规则中支持度与置信度简单有效的计算方法。讨论了同时研究正、负关联规则后出现的矛盾规则问题,提出了用相关性解决这些问题的方法和一种挖掘频繁项集中正、负关联规则的算法,进行了算法的验证实验。实验结果表明,该算法能检测并删除相互矛盾的规则。 展开更多
关键词 负关联规则 频繁项集 支持度 置信度
在线阅读 下载PDF
基于DDMINER分布式数据库系统中频繁项目集的更新 被引量:15
11
作者 吉根林 杨明 +1 位作者 赵斌 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1387-1392,共6页
给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项... 给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项目集的更新算法UGF .该算法能够产生较少数量的候选频繁项目集 ,在求解全局频繁项目集过程中 ,传送候选局部频繁项目集支持数的通信量为O(n) ;将文章提出的算法用Java语言加以实现 ,并对算法性能进行了研究 ;实验结果表明这些算法是正确、可行的 ,并且具有较高的效率. 展开更多
关键词 分布式数据库系统 频繁项目集 分布式数据挖掘系统 体系结构 DDMINER
在线阅读 下载PDF
利用项集有序特性改进Apriori算法 被引量:11
12
作者 刘美玲 徐章艳 +3 位作者 卢景丽 区玉明 袁鼎荣 吴信东 《广西师范大学学报(自然科学版)》 CAS 2004年第1期33-37,共5页
Apriori算法是挖掘关联规则的一个经典算法,通过分析、研究该算法的基本思想,并利用项集的有序特性对其进行改进,减少了生成的候选集数量,从而提高算法的效率.
关键词 APRIORI算法 挖掘关联规则 非频繁项集 有序特性 数据挖掘
在线阅读 下载PDF
一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法 被引量:21
13
作者 宋余庆 朱玉全 +1 位作者 孙志挥 杨鹤标 《计算机研究与发展》 EI CSCD 北大核心 2005年第5期777-783,共7页
目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些... 目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些项目的布尔表达式约束条件,提出了一种快速的基于FPtree的约束最大频繁项目集挖掘算法CMFIMA,并对其更新问题进行了研究,提出了一种增量式更新约束最大频繁项目集挖掘算法CMFIUA. 展开更多
关键词 关联规则 项约束 最大频繁项目集 频繁模式树 增量式更新
在线阅读 下载PDF
关联规则挖掘Apriori算法的研究与改进 被引量:121
14
作者 刘华婷 郭仁祥 姜浩 《计算机应用与软件》 CSCD 2009年第1期146-149,共4页
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,... 关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法。该算法基于新的数据结构,改进了产生候选项集的连接方法。在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著。 展开更多
关键词 数据挖掘 关联规则 频繁项集 APRIORI算法
在线阅读 下载PDF
Apriori算法的一种优化方法 被引量:47
15
作者 钱光超 贾瑞玉 +1 位作者 张然 李龙澍 《计算机工程》 CAS CSCD 北大核心 2008年第23期196-198,共3页
介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出一种改进的Apriori算法——En-Apriori算法。该算法采用矩阵的方法,只须扫描一遍数据库,同时优化了连接操作,较好地提高了算法的效率。... 介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出一种改进的Apriori算法——En-Apriori算法。该算法采用矩阵的方法,只须扫描一遍数据库,同时优化了连接操作,较好地提高了算法的效率。实验结果表明,En-Apriori算法优于Apriori算法,具有较好的实用性。 展开更多
关键词 关联规则 频繁项集 APRIORI算法 En—Apriori算法
在线阅读 下载PDF
数据挖掘中关联规则的一种高效Apriori算法 被引量:29
16
作者 李清峰 杨路明 +1 位作者 张晓峰 龙艳军 《计算机应用与软件》 CSCD 北大核心 2004年第12期84-86,共3页
在数据挖掘中关联规则的频繁项集计算时 ,通过一种改进的Apriori算法 ,即用升序替代原来的按字母次序对项集进行排序 ,可大大精简候选频繁集 ,而且能保持频繁集的完整性 ,减少计算开销。
关键词 数据挖掘 关联规则 数据库 频繁项集 APRIORI算法
在线阅读 下载PDF
基于布尔矩阵的关联规则算法研究 被引量:18
17
作者 方炜炜 杨炳儒 +1 位作者 宋威 侯伟 《计算机应用研究》 CSCD 北大核心 2008年第7期1964-1966,共3页
针对可快速在大型交易事务数据库中挖掘关联规则的问题,基于布尔矩阵提出一种新的挖掘算法。该算法通过仅需存储布尔位节约了内存,通过简单布尔运算提高了求解频繁项集的效率。实验证明该算法较之于Apriori算法有更好的性能。
关键词 数据挖掘 关联规则 矩阵 APRIORI算法 频繁项集
在线阅读 下载PDF
关联规则挖掘算法的改进与优化研究 被引量:9
18
作者 李小兵 吴锦林 +1 位作者 薛永生 翁伟 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第4期468-471,共4页
首先对Apriori算法过程本身进行了详细的研究,给出了三种改进措施,各种改进措施在特定的应用场合有着明显的优点,均能有效减少存储候选集所占用的空间或算法过程占用的时间,之后着重对强关联规则的生成算法进行了详细讨论,给出了优化算... 首先对Apriori算法过程本身进行了详细的研究,给出了三种改进措施,各种改进措施在特定的应用场合有着明显的优点,均能有效减少存储候选集所占用的空间或算法过程占用的时间,之后着重对强关联规则的生成算法进行了详细讨论,给出了优化算法,实例表明该算法能有效减少相关计算量,比已有算法运算效率明显提高. 展开更多
关键词 关联规则挖掘算法 优化研究 APRIORI算法 改进措施 应用场合 运算效率 优化算法 生成算法 候选集 计算量 占用
在线阅读 下载PDF
基于频繁项集特性的Apriori算法的改进 被引量:25
19
作者 高宏宾 潘谷 黄义明 《计算机工程与设计》 CSCD 北大核心 2007年第10期2273-2275,2378,共4页
Apriori算法是关联规则中一种重要算法。Apriori算法在求出频繁项集的过程中,需要扫描事务项集里的数据。由于事务项集里只是部分数据有用,所以改进算法,缩小所需扫描的事务项集大小,并提出了一种简单的数据结构——树型结构来存储事务... Apriori算法是关联规则中一种重要算法。Apriori算法在求出频繁项集的过程中,需要扫描事务项集里的数据。由于事务项集里只是部分数据有用,所以改进算法,缩小所需扫描的事务项集大小,并提出了一种简单的数据结构——树型结构来存储事务项集数据,使得算法在数据集量巨大时,性能得到有效提高,并用实例验证了这些改进能够正确、有效、快速地实现该算法。 展开更多
关键词 数据挖掘 关联规则 频繁项集 APRIORI算法 事务项集
在线阅读 下载PDF
基于特征挖掘的电网故障诊断方法 被引量:46
20
作者 李再华 白晓民 +5 位作者 周子冠 许婧 李晓珺 张霖 孟珺遐 朱宁辉 《中国电机工程学报》 EI CSCD 北大核心 2010年第10期16-22,共7页
专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了... 专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了故障信息的特征,如时序和因果关联关系、故障性质、严重故障、稀有故障等因素;增加了规则的"或"逻辑;改进了FP-树的修剪技术。算例表明该算法能够大量减少无效挖掘,推理速度和准确度显著提高,适用于在线诊断。 展开更多
关键词 数据挖掘 关联规则 特征挖掘 频繁模式一算法 故障诊断 专家系统
在线阅读 下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部