期刊文献+
共找到67篇文章
< 1 2 4 >
每页显示 20 50 100
基于频繁模式矩阵的最大频繁项目集挖掘算法 被引量:7
1
作者 李忠哗 吴聪聪 +1 位作者 戴维迪 何丕廉 《计算机应用与软件》 CSCD 北大核心 2007年第7期45-46,53,共3页
提出了一种基于频繁模式矩阵FP-array的挖掘最大频繁项目集的算法。算法基本思想:①只扫描事务数据库一遍,把该数据库转换成一个矩阵FP-array,并且保留了所有事务数据库中项目间的关联信息,然后对该矩阵进行挖掘。②在FP-array中只存放... 提出了一种基于频繁模式矩阵FP-array的挖掘最大频繁项目集的算法。算法基本思想:①只扫描事务数据库一遍,把该数据库转换成一个矩阵FP-array,并且保留了所有事务数据库中项目间的关联信息,然后对该矩阵进行挖掘。②在FP-array中只存放逻辑型数据,节省了存储空间。③直接在FP-array上挖掘而不需要递归创建大量条件模式矩阵,挖掘过程采用逻辑运算,在效率上有独特的优势。通过实验验证了算法的有效性。 展开更多
关键词 数据挖掘 频繁模式矩阵 最大频繁项目 算法
在线阅读 下载PDF
一种不确定数据集上频繁模式挖掘的近似算法 被引量:8
2
作者 王水 祝孔涛 王乐 《计算机应用研究》 CSCD 北大核心 2014年第3期725-728,共4页
为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集... 为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集进行了算法的测试,分别与目前最好的算法和典型算法进行性能对比。实验结果验证了近似算法AAT-Mine的时空效率都得到了提高。 展开更多
关键词 数据挖掘 频繁模式 频繁 不确定数据 近似算法
在线阅读 下载PDF
并行挖掘频繁项目集新算法——MREclat 被引量:4
3
作者 章志刚 吉根林 唐梦梦 《计算机应用》 CSCD 北大核心 2014年第8期2175-2178,共4页
针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节... 针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。 展开更多
关键词 频繁项目 并行挖掘算法 列存储 MAP REDUCE Eclat算法
在线阅读 下载PDF
关联规则挖掘中最大频繁集的双向查找算法 被引量:5
4
作者 宋雨 赵建利 王保义 《华北电力大学学报(自然科学版)》 CAS 北大核心 2005年第2期67-70,共4页
在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快... 在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快最大频繁集的查找速度,节省I/O操作时间,并且通过实例和仿真实验验证了算法的高效性。 展开更多
关键词 事务数据库 关联规则 数据挖掘 最大频繁 双向查找算法
在线阅读 下载PDF
基于频繁链表的频繁集的挖掘算法 被引量:5
5
作者 袁鼎荣 张师超 《计算机科学》 CSCD 北大核心 2003年第7期165-166,共2页
The problem of mining frequent set is a key issue in data mining. In this paper, a new method of miningfrequent set based on the frequent link is proposed. The algorithm constructs alternate frequent link from the tra... The problem of mining frequent set is a key issue in data mining. In this paper, a new method of miningfrequent set based on the frequent link is proposed. The algorithm constructs alternate frequent link from the transac-tion, the alternate link is yielded by adding up the alternate frequent link which constructed by scanning the transac-tion database in proper order. The frequent link that comprises all the information is constructed with the frequentnode which is selected according requirement. Our algorithm need to scan the transaction database only once and easysupervises the change of frequent set in order to guarantee the right of association rule. 展开更多
关键词 数据库 频繁 数据挖掘算法 频繁链表 事物数据库 FL-Generation算法
在线阅读 下载PDF
频繁模式集挖掘算法TFPDM的研究
6
作者 林红飞 庄卫华 《计算机工程与应用》 CSCD 北大核心 2006年第32期160-163,共4页
受经典的Apriori算法思想和FP-Growth算法思想的启发,在结合两者优点的基础上提出了一种新的算法思想,它是对传统的FP-Growth算法的变形。该算法只需对数据库扫描一次,可以同时对全局和局部频繁模式集进行挖掘,减少了对发生增益数据库... 受经典的Apriori算法思想和FP-Growth算法思想的启发,在结合两者优点的基础上提出了一种新的算法思想,它是对传统的FP-Growth算法的变形。该算法只需对数据库扫描一次,可以同时对全局和局部频繁模式集进行挖掘,减少了对发生增益数据库挖掘的费用。理论分析表明算法是有效的、可行的。 展开更多
关键词 全局和局部频繁模式 变形的频繁集挖掘算法 FP-GROWTH算法 APRIORI算法
在线阅读 下载PDF
频繁项目集及相关事务集的挖掘算法 被引量:1
7
作者 陈嶷瑛 武强 李文斌 《计算机工程与应用》 CSCD 北大核心 2006年第15期176-178,共3页
发现频繁项目集所关联的事务集是十分有意义的,它能使人们了解频繁项目集是由哪些顾客的购买行为所引起的。文章首先定义了事务树及其相关操作,在此基础上,设计了一种能在挖掘频繁项目集的同时发现项目集所在事务集的算法(FS-TS_DM),该... 发现频繁项目集所关联的事务集是十分有意义的,它能使人们了解频繁项目集是由哪些顾客的购买行为所引起的。文章首先定义了事务树及其相关操作,在此基础上,设计了一种能在挖掘频繁项目集的同时发现项目集所在事务集的算法(FS-TS_DM),该算法具有仅需扫描一次事务数据库的特点。另外,还定义了“分散度”指标,用于指导“真频繁项目集”的挖掘。 展开更多
关键词 频繁项目 关联规则 事务树 挖掘算法
在线阅读 下载PDF
基于0-1矩阵的频繁项集挖掘算法研究 被引量:8
8
作者 张月琴 《计算机工程与设计》 CSCD 北大核心 2009年第20期4662-4664,4667,共4页
通过对关联规则挖掘技术及经典算法Apriori的研究和分析,结合该算法存在的问题,提出了一种基于0-1矩阵的频繁集挖掘算法。该算法使扫描数据库的次数减为一次,有效率地降低I/O的存取时间,直接通过支持矩阵行向量的按位与运算来找出频繁集... 通过对关联规则挖掘技术及经典算法Apriori的研究和分析,结合该算法存在的问题,提出了一种基于0-1矩阵的频繁集挖掘算法。该算法使扫描数据库的次数减为一次,有效率地降低I/O的存取时间,直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法中的自联接和减枝,提高了系统的运行效率。通过不断压缩支持矩阵,不仅减少了高次频繁集挖掘的时间,而且节约了存储空间。仿真实验表明,该算法是有效的。 展开更多
关键词 数据挖掘 关联规则 频繁挖掘 APRIORI算法 0-1矩阵
在线阅读 下载PDF
频繁闭合项目集的并行挖掘算法研究 被引量:5
9
作者 缪裕青 《计算机科学》 CSCD 北大核心 2004年第5期166-168,共3页
频繁项目集挖掘因其在数据挖掘领域中的基础地位和广泛应用备受学术界和产业界的关注,用挖掘频繁闭合项目集代替挖掘频繁项目集是近年来提出的一个重要策略。不同于以往提出的挖掘所有频繁项目集的并行算法,本文针对频繁闭合项目集的特... 频繁项目集挖掘因其在数据挖掘领域中的基础地位和广泛应用备受学术界和产业界的关注,用挖掘频繁闭合项目集代替挖掘频繁项目集是近年来提出的一个重要策略。不同于以往提出的挖掘所有频繁项目集的并行算法,本文针对频繁闭合项目集的特性及并行挖掘的特点,给出了共享存储器模型上(Shared Memory)基于频繁模式树(FP-tree)的挖掘频繁闭合项目集的并行算法(FCIPM)思想,提出了频繁闭合项目集直接判断法,性能分析表明所提技术对算法的性能提高起到了关键作用。 展开更多
关键词 频繁项目 数据挖掘 并行算法 频繁模式树 频繁闭合项目
在线阅读 下载PDF
基于最大频繁项目序列集挖掘DMFIA算法的改进 被引量:1
10
作者 宋卫林 徐惠民 《计算机工程与设计》 CSCD 北大核心 2007年第7期1493-1496,1500,共5页
为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进... 为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进的DMFIA算法,并在原算法的基础上有了较大的改进。为了验证算法的正确性,运用Ora-cle9i数据库的PL/SQL进行了相应的验证。实验结果证实了改进算法的有效性和实用性,并具有较好的创新性和理论价值。 展开更多
关键词 数据挖掘 关联规则 序列模式 DMFIA算法 最大频繁项目 最大频繁项目序列
在线阅读 下载PDF
NB-MAFIA:基于N-List的最长频繁项集挖掘算法 被引量:5
11
作者 沈戈晖 刘沛东 邓志鸿 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第2期199-209,共11页
本文在深度优先搜索的框架上,引入基于项集前缀树节点链表的项集表示方法 N-List,提出一个高效的最长频繁项集挖掘算法NB-MAFIA。N-List的高压缩率和高效的求交集方法可以实现项集支持度的快速计算,同时采用对搜索空间的剪枝策略和超集... 本文在深度优先搜索的框架上,引入基于项集前缀树节点链表的项集表示方法 N-List,提出一个高效的最长频繁项集挖掘算法NB-MAFIA。N-List的高压缩率和高效的求交集方法可以实现项集支持度的快速计算,同时采用对搜索空间的剪枝策略和超集检测策略来提高算法效率。在多个真实和仿真数据集上,通过实验评估了NB-MAFIA和两个经典算法。实验结果表明NB-MAFIA在多数情况下优于其他算法,尤其在真实和稠密数据集上优势更为明显。 展开更多
关键词 数据挖掘 频繁挖掘 最长项 N-List 算法
在线阅读 下载PDF
一种挖掘最大频繁项目集的优化算法
12
作者 王晓翔 彭玉青 顾军华 《郑州轻工业学院学报(自然科学版)》 CAS 2005年第1期92-94,共3页
提出一种与Apriori算法思想截然相反的算法,称为组分解挖掘算法GDMA(Grouping_Decompo sitionMiningAlgorithm).该算法通过分解较大的非频繁项目集来产生较小候选项目集,使得扫描数据库次数明显减少,同时产生的候选项目集的数据量也大... 提出一种与Apriori算法思想截然相反的算法,称为组分解挖掘算法GDMA(Grouping_Decompo sitionMiningAlgorithm).该算法通过分解较大的非频繁项目集来产生较小候选项目集,使得扫描数据库次数明显减少,同时产生的候选项目集的数据量也大大减少,大大提高了挖掘效率. 展开更多
关键词 最大频繁项目 挖掘算法 APRIORI算法 优化算法 数据库 数据量 扫描 选项 产生 思想
在线阅读 下载PDF
快速挖掘全局频繁项目集 被引量:35
13
作者 杨明 孙志挥 吉根林 《计算机研究与发展》 EI CSCD 北大核心 2003年第4期620-626,共7页
分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为... 分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率 展开更多
关键词 数据挖掘 全局频繁项目 频繁模式树 快速挖掘算法 布尔型关联规则 数据库 APRIORI算法
在线阅读 下载PDF
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响 被引量:25
14
作者 陆楠 王喆 周春光 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2003年第2期180-185,共6页
通过对两个有代表性的算法Apriori和FP-Growth的剖析,说明频集模式挖掘的过程,比较有候选项集产生和无候选项集产生算法的特点,并给出FP-tree结构的构造方法以及对挖掘关联规则的影响,提出了对算法的改进方法.
关键词 数据挖掘 关联规则 频繁 无候选项 FP-tree频模式 FP-GROWTH算法
在线阅读 下载PDF
基于项目序列集操作的关联规则挖掘算法 被引量:37
15
作者 毛国君 刘椿年 《计算机学报》 EI CSCD 北大核心 2002年第4期417-422,共6页
最大频繁项目序列集的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探... 最大频繁项目序列集的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能 .该文首先给出项目序列集和它的基本操作的严格定义 ,然后在此基础上提出一个称为 ISS- DM的最大频繁项目序列集生成算法 .ISS- DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列集的 . 展开更多
关键词 数据挖掘 关联规则 项目序列 频繁项目序列 算法 数据库
在线阅读 下载PDF
频繁项目集的快速增量式更新算法 被引量:6
16
作者 杨明 孙志挥 +1 位作者 宋余庆 陈耿 《应用科学学报》 CAS CSCD 2003年第4期367-372,共6页
提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.
关键词 频繁项目 快速增量式更新算法 频繁模式树 数据挖掘 数据库
在线阅读 下载PDF
关联规则最大频繁项目集的快速发现算法 被引量:10
17
作者 刘大有 刘亚波 尹治东 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2004年第2期212-215,共4页
提出一种快速发现最大频繁项目集的算法,该算法对集合枚举树进行改进,结合自底向上与自顶向下的搜索策略,利用非频繁项目集对候选最大频繁项目集进行剪枝和降维,减少了不必要候选最大频繁项目集的数量,显著提高了发现的效率.
关键词 关联规则 最大频繁项目 快速发现算法 合枚举树 自底向上 自顶向下 数据挖掘
在线阅读 下载PDF
一种基于前缀树的频繁模式挖掘算法 被引量:4
18
作者 朱光喜 吴伟民 +1 位作者 阮幼林 刘干 《计算机科学》 CSCD 北大核心 2005年第4期34-36,共3页
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出... 挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。 展开更多
关键词 频繁模式 挖掘算法 前缀 关键步骤 数据挖掘 候选项 动态维护 挖掘过程 时空效率 相关信息 深度优先 数据结构 算法 中节点 递归
在线阅读 下载PDF
一种基于分布式数据库的全局频繁项目集更新算法 被引量:4
19
作者 杨明 孙志挥 吉根林 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第6期879-883,共5页
在算法FMAGF的基础上 ,提出了一种基于分布式数据库的全局频繁项目集更新算法———UAGFI,该算法主要考虑最小支持度发生变化时全局频繁项目集的更新情况 .UAGFI在最坏的情况下仅须扫描各局部数据库一遍 ,并利用已挖掘的结果 ,可避免传... 在算法FMAGF的基础上 ,提出了一种基于分布式数据库的全局频繁项目集更新算法———UAGFI,该算法主要考虑最小支持度发生变化时全局频繁项目集的更新情况 .UAGFI在最坏的情况下仅须扫描各局部数据库一遍 ,并利用已挖掘的结果 ,可避免传送某些原全局频繁项目对应的条件频繁模式树 ,从而降低网络通讯代价 .实验结果表明 。 展开更多
关键词 算法 数据挖掘 分布式数据库 全局频繁项目 频繁模式树 更新 UAGFI
在线阅读 下载PDF
基于频繁项目集链式存储方法的关联规则算法 被引量:4
20
作者 尹士闪 马增强 毛晚堆 《计算机工程与设计》 CSCD 北大核心 2012年第3期1002-1007,共6页
为了提高经典关联规则Apriori算法的挖掘效率,针对Apriori算法的瓶颈问题,提出了一种链式结构存储频繁项目集并生成最大频繁项目集的关联规则算法。该算法采用比特向量方式存储事务,生成频繁项目集的同时,把包含此频繁项目的事务作为链... 为了提高经典关联规则Apriori算法的挖掘效率,针对Apriori算法的瓶颈问题,提出了一种链式结构存储频繁项目集并生成最大频繁项目集的关联规则算法。该算法采用比特向量方式存储事务,生成频繁项目集的同时,把包含此频繁项目的事务作为链表连接到频繁项目之后,生成最大频繁项目集。该算法能够减小扫描事物数据库的次数和生成候选项目集的数量,从而减少了生成最大频繁项目集的时间,实验结果表明,该算法提高了运算效率。 展开更多
关键词 数据挖掘 APRIORI算法 候选 频繁项目 关联规则
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部