期刊文献+
共找到234篇文章
< 1 2 12 >
每页显示 20 50 100
扩展WIT-树融合Diffset策略的频繁加权项集快速挖掘算法 被引量:2
1
作者 张亚梅 张皓 +1 位作者 海本斋 廖晓飞 《计算机应用研究》 CSCD 北大核心 2015年第12期3574-3578,共5页
针对当前算法从加权项事务数据库挖掘频繁加权项集(FWI)时效率不高的问题,提出了一种基于加权项集-Tidset树结构的FWI快速挖掘算法。首先,提出了一种加权项集-Tidset树结构;然后,使用最小加权项集阈值和向下闭合性质修剪非频繁节点;最后... 针对当前算法从加权项事务数据库挖掘频繁加权项集(FWI)时效率不高的问题,提出了一种基于加权项集-Tidset树结构的FWI快速挖掘算法。首先,提出了一种加权项集-Tidset树结构;然后,使用最小加权项集阈值和向下闭合性质修剪非频繁节点;最后,利用Diffset策略允许以内存有效方式快速计算项集的加权支持度。实验结果表明,当输入数据库中FWI数较大时,提出的算法明显降低了FWI挖掘时间。相比基于先验的算法,算法平均可节省99.37%的耗时;相比基于位矩阵的加权频繁项集生成算法,提出的算法可节省99.06%的耗时,明显提升了频繁加权项集挖掘效率。 展开更多
关键词 频繁加权项集 数据挖掘 WIT-树 关联规则挖掘 Diffset策略
在线阅读 下载PDF
基于DiffNodeset结构的最大频繁项集挖掘算法 被引量:5
2
作者 尹远 张昌 +1 位作者 文凯 郑云俊 《计算机应用》 CSCD 北大核心 2018年第12期3438-3443,共6页
在数据挖掘中,通过挖掘最大频繁项集来代替挖掘频繁项集可以大大地提升系统的运行效率。针对现有的最大频繁项集挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁项集挖掘(DNMFIM)算法。首先,采用了一种... 在数据挖掘中,通过挖掘最大频繁项集来代替挖掘频繁项集可以大大地提升系统的运行效率。针对现有的最大频繁项集挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁项集挖掘(DNMFIM)算法。首先,采用了一种新的数据结构DiffNodeset来实现求交集以及支持度的快速计算;其次,引入一种新的线性复杂度的连接方法来降低两个DiffNodeset在连接过程中的复杂度,避免了多次的无效计算;然后,将集合枚举树作为搜索空间,同时采用多种优化剪枝策略来缩小搜索空间;最后,再结合最大频繁项集挖掘算法(MAFIA)中所使用的超集检测技术来有效地提高算法的准确性。实验结果表明,DNMFIM算法在时间效率方面性能优于MAFIA与基于N-list的MAFIA(NB-MAFIA),该算法在不同类型数据集中进行最大频繁项集挖掘时均有良好的效果。 展开更多
关键词 最大频繁项集挖掘 关联规则 集合枚举树 优化剪枝 超集检测
在线阅读 下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:96
3
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁项集 候选项集
在线阅读 下载PDF
关联规则挖掘综述 被引量:138
4
作者 蔡伟杰 张晓辉 +1 位作者 朱建秋 朱扬勇 《计算机工程》 CAS CSCD 北大核心 2001年第5期31-33,49,共4页
介绍了关联规则挖掘的研究性况,提出了关联规则的分类方法,对一些典型算法进行了分析和秤价,指出传统关系规则衡量标准的不足,归纳出关联规则的价值衡量方,展望了关联规则挖掘的未来研究方向。
关键词 数据挖掘 关联规则 OLAP 数据库 知识发现
在线阅读 下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
5
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
在线阅读 下载PDF
一种有效的隐私保护关联规则挖掘方法 被引量:53
6
作者 张鹏 童云海 +2 位作者 唐世渭 杨冬青 马秀莉 《软件学报》 EI CSCD 北大核心 2006年第8期1764-1774,共11页
隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据... 隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据干扰和查询限制这两种隐私保护的基本策略相结合,提出了一种新的数据随机处理方法,即部分隐藏的随机化回答(randomizedresponsewithpartialhiding,简称RRPH)方法,以对原始数据进行变换和隐藏.然后以此为基础,针对经过RRPH方法处理后的数据,给出了一种简单而又高效的频繁项集生成算法,进而实现了隐私保护的关联规则挖掘.理论分析和实验结果均表明,基于RRPH的隐私保护关联规则挖掘方法具有很好的隐私性、准确性、高效性和适用性. 展开更多
关键词 隐私保护 数据挖掘 关联规则 频繁项集 随机化回答
在线阅读 下载PDF
关联规则挖掘中若干关键技术的研究 被引量:62
7
作者 陈耿 朱玉全 +3 位作者 杨鹤标 陆介平 宋余庆 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2005年第10期1785-1789,共5页
Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解... Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解决第2个问题,并已取得了很好的效果·然而,对于第1个问题,仍沿用Apriori算法中的解决方案,其运算量是较大的·为此,提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该算法与Apriori类算法相结合,可以进一步提高算法的执行效率,实验结果也表明算法是有效、快速的· 展开更多
关键词 数据挖掘 关联规则 频繁项目集
在线阅读 下载PDF
快速更新频繁项集 被引量:63
8
作者 朱玉全 孙志挥 赵传申 《计算机研究与发展》 EI CSCD 北大核心 2003年第1期94-99,共6页
发现频繁项集是数据挖掘应用中的关键问题 ,发现过程的高花费要求对增量数据挖掘算法进行深入研究 首先分析并指出了增量式更新频繁项集算法的技术难点———寻找新的有效频繁项集 ;其次提出了一种快速的增量式更新频繁项集算法FUFIA ;
关键词 快速更新频繁项集 数据挖掘 关联规则 频繁项集 事务数据库
在线阅读 下载PDF
基于DDMINER分布式数据库系统中频繁项目集的更新 被引量:15
9
作者 吉根林 杨明 +1 位作者 赵斌 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1387-1392,共6页
给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项... 给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项目集的更新算法UGF .该算法能够产生较少数量的候选频繁项目集 ,在求解全局频繁项目集过程中 ,传送候选局部频繁项目集支持数的通信量为O(n) ;将文章提出的算法用Java语言加以实现 ,并对算法性能进行了研究 ;实验结果表明这些算法是正确、可行的 ,并且具有较高的效率. 展开更多
关键词 分布式数据库系统 频繁项目集 分布式数据挖掘系统 体系结构 DDMINER
在线阅读 下载PDF
关联规则挖掘Apriori算法的研究与改进 被引量:120
10
作者 刘华婷 郭仁祥 姜浩 《计算机应用与软件》 CSCD 2009年第1期146-149,共4页
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,... 关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法。该算法基于新的数据结构,改进了产生候选项集的连接方法。在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著。 展开更多
关键词 数据挖掘 关联规则 频繁项集 APRIORI算法
在线阅读 下载PDF
基于布尔矩阵的关联规则算法研究 被引量:18
11
作者 方炜炜 杨炳儒 +1 位作者 宋威 侯伟 《计算机应用研究》 CSCD 北大核心 2008年第7期1964-1966,共3页
针对可快速在大型交易事务数据库中挖掘关联规则的问题,基于布尔矩阵提出一种新的挖掘算法。该算法通过仅需存储布尔位节约了内存,通过简单布尔运算提高了求解频繁项集的效率。实验证明该算法较之于Apriori算法有更好的性能。
关键词 数据挖掘 关联规则 矩阵 APRIORI算法 频繁项集
在线阅读 下载PDF
基于频繁项集特性的Apriori算法的改进 被引量:25
12
作者 高宏宾 潘谷 黄义明 《计算机工程与设计》 CSCD 北大核心 2007年第10期2273-2275,2378,共4页
Apriori算法是关联规则中一种重要算法。Apriori算法在求出频繁项集的过程中,需要扫描事务项集里的数据。由于事务项集里只是部分数据有用,所以改进算法,缩小所需扫描的事务项集大小,并提出了一种简单的数据结构——树型结构来存储事务... Apriori算法是关联规则中一种重要算法。Apriori算法在求出频繁项集的过程中,需要扫描事务项集里的数据。由于事务项集里只是部分数据有用,所以改进算法,缩小所需扫描的事务项集大小,并提出了一种简单的数据结构——树型结构来存储事务项集数据,使得算法在数据集量巨大时,性能得到有效提高,并用实例验证了这些改进能够正确、有效、快速地实现该算法。 展开更多
关键词 数据挖掘 关联规则 频繁项集 APRIORI算法 事务项集
在线阅读 下载PDF
基于频繁闭项集的新关联分类算法ACCF 被引量:14
13
作者 李学明 杨阳 +1 位作者 秦东霞 周尚波 《电子科技大学学报》 EI CAS CSCD 北大核心 2012年第1期104-109,共6页
提出了基于频繁闭项集的新关联分类算法ACCF。ACCF首先挖掘出所有频繁闭项集(CFIs)和候选分类关联规则,然后从候选分类关联规则中产生和筛选出若干规则,并用其构建分类器;在分类应用时,采用了一种新的匹配方式对分类实例进行分类。通过... 提出了基于频繁闭项集的新关联分类算法ACCF。ACCF首先挖掘出所有频繁闭项集(CFIs)和候选分类关联规则,然后从候选分类关联规则中产生和筛选出若干规则,并用其构建分类器;在分类应用时,采用了一种新的匹配方式对分类实例进行分类。通过理论分析和对18个UCI公共数据集的实验结果表明,ACCF不仅能挖掘出高质量且不丢失信息的关联分类规则,而且大大减少了关联分类规则的数量,在分类准确率上也比现有的关联分类典型算法更高。 展开更多
关键词 关联分类 类关联规则 频繁闭项集 数据挖掘
在线阅读 下载PDF
基于分布数据库的快速关联规则挖掘算法 被引量:13
14
作者 陈耿 倪巍伟 +1 位作者 朱玉全 孙志挥 《计算机工程与应用》 CSCD 北大核心 2006年第4期165-167,194,共4页
关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)... 关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些”或”、”与”、”异或”等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。 展开更多
关键词 频繁项目集 分布式关联规则挖掘 数据挖掘 布尔关联规则
在线阅读 下载PDF
满足均匀分布的不确定数据关联规则挖掘算法 被引量:18
15
作者 陈爱东 刘国华 +3 位作者 费凡 周宇 万小妹 貟慧 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期186-195,共10页
云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布... 云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件.首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item-sets,UFI-DM)和关联规则生成子算法(algorithm for generating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性. 展开更多
关键词 大数据 均匀分布不确定数据 数据挖掘 关联规则 频繁项集
在线阅读 下载PDF
基于消费行为的Apriori算法研究 被引量:8
16
作者 骆嘉伟 彭蔓蔓 +1 位作者 陈景燕 王思玮 《计算机工程》 CAS CSCD 北大核心 2003年第5期72-73,118,共3页
介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集... 介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集的项集,进一步缩减项集的潜在规模,提高了频繁项集生成的效率。 展开更多
关键词 消费行为 APRIORI算法 数据挖掘 关联规则 候选项集 频繁项集 数据库
在线阅读 下载PDF
关联规则的增量式更新算法 被引量:227
17
作者 冯玉才 冯剑琳 《软件学报》 EI CSCD 北大核心 1998年第4期301-306,共6页
关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断... 关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断调整两个描述用户兴趣程度的阈值:最小支持度和最小可信度.本文提出了两种增量式更新算法——IUA(incrementalupdatingalgorithm)和PIUA(paralelincre-mentalupdatingalgorithm),用来解决这一关联规则高效维护问题. 展开更多
关键词 数据开采 知识发现 关联规则 增量式更新 数据库
在线阅读 下载PDF
数据库中关联规则的并行挖掘算法 被引量:11
18
作者 王运峰 张蕾 +1 位作者 韩纪富 黄勇 《计算机工程与应用》 CSCD 北大核心 2001年第16期99-100,共2页
提出了数据库中挖掘关联规则的并行算法,探讨了相关的数据结构,并对算法进行了定性分析。该算法不仅适用于布尔型属性,而且也适用于非布尔型属性。
关键词 关联规则 并行算法 数据挖掘 频繁项目集 数据库
在线阅读 下载PDF
改进购物篮分析的关联规则挖掘算法 被引量:12
19
作者 王德兴 胡学钢 +1 位作者 刘晓平 王浩 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第4期105-107,141,共4页
基于改进传统购物篮分析的关联规则挖掘是在数据处理时引入兴趣度加权的思想,将所有交易中同一类商品的交易量进行归一化处理,根据用户领域知识的要求,计算该类商品的兴趣度加权阈值,从而改进传统的购物篮分析,使所挖掘出的关联规则符... 基于改进传统购物篮分析的关联规则挖掘是在数据处理时引入兴趣度加权的思想,将所有交易中同一类商品的交易量进行归一化处理,根据用户领域知识的要求,计算该类商品的兴趣度加权阈值,从而改进传统的购物篮分析,使所挖掘出的关联规则符合实际,同时减少关联规则挖掘的工作量,提高规则挖掘的效率和准确性. 展开更多
关键词 关联规则 APRIORI算法 频繁项目集 数据挖掘
在线阅读 下载PDF
关联规则挖掘综述 被引量:162
20
作者 崔妍 包志强 《计算机应用研究》 CSCD 北大核心 2016年第2期330-334,共5页
近年来国内外学者对关联规则进行了大量的研究,为深入理解关联规则挖掘技术,掌握其研究现状与发展趋势,首先介绍了关联规则相关定义与分类方法;其次从串行和并行两个角度总结了关联规则挖掘的一般方法,概述并分析了一些典型的关联规则... 近年来国内外学者对关联规则进行了大量的研究,为深入理解关联规则挖掘技术,掌握其研究现状与发展趋势,首先介绍了关联规则相关定义与分类方法;其次从串行和并行两个角度总结了关联规则挖掘的一般方法,概述并分析了一些典型的关联规则挖掘模式;最后讨论了关联规则挖掘质量改善问题及领域应用。 展开更多
关键词 数据挖掘 关联规则 频繁项集 算法
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部