期刊文献+
共找到371篇文章
< 1 2 19 >
每页显示 20 50 100
基于频繁项集和高效用项集挖掘的银行间市场对倒交易检测
1
作者 刘丹 金天成 +3 位作者 窦亮 肖春芸 詹杭龙 卢艳民 《计算机应用与软件》 北大核心 2024年第12期376-383,共8页
传统的银行间市场对倒交易检测采用直接建立规则的方法,忽略了对倒交易的策划性、协同性和交易主体的差异性,存在运行时间长、效率低和滞后性等问题。基于频繁项集和高效用项集挖掘找到多次共同交易的群体,结合对倒交易模式检测出对倒... 传统的银行间市场对倒交易检测采用直接建立规则的方法,忽略了对倒交易的策划性、协同性和交易主体的差异性,存在运行时间长、效率低和滞后性等问题。基于频繁项集和高效用项集挖掘找到多次共同交易的群体,结合对倒交易模式检测出对倒交易链。实验结果表明,该方法识别率高于97%,且检测时间减少了45%,在效率上有明显的提高,对检测对倒交易有一定的预判指导意义。 展开更多
关键词 对倒交易 数据挖掘 高效用项集 频繁项集 市场操纵
在线阅读 下载PDF
基于滑动窗口含负项的高效用模式挖掘
2
作者 武妍 荀亚玲 马煜 《计算机工程与设计》 北大核心 2024年第3期845-851,共7页
针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有... 针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有效的逐批次挖掘,避免重复的数据库扫描,在不产生候选效用模式集的情况下,直接挖掘出高效用模式,使HUPN_SW有效适应于动态流数据。实验结果表明,HUPN_SW算法在运行时间和可扩展性方面有良好表现。 展开更多
关键词 频繁模式挖掘 滑动窗口 高效用模式挖掘 高效用项集 负效用 流数据 效用列表
在线阅读 下载PDF
关联规则挖掘综述 被引量:138
3
作者 蔡伟杰 张晓辉 +1 位作者 朱建秋 朱扬勇 《计算机工程》 CAS CSCD 北大核心 2001年第5期31-33,49,共4页
介绍了关联规则挖掘的研究性况,提出了关联规则的分类方法,对一些典型算法进行了分析和秤价,指出传统关系规则衡量标准的不足,归纳出关联规则的价值衡量方,展望了关联规则挖掘的未来研究方向。
关键词 数据挖掘 关联规则 OLAP 数据库 知识发现
在线阅读 下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
4
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
在线阅读 下载PDF
关联规则挖掘中若干关键技术的研究 被引量:62
5
作者 陈耿 朱玉全 +3 位作者 杨鹤标 陆介平 宋余庆 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2005年第10期1785-1789,共5页
Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解... Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解决第2个问题,并已取得了很好的效果·然而,对于第1个问题,仍沿用Apriori算法中的解决方案,其运算量是较大的·为此,提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该算法与Apriori类算法相结合,可以进一步提高算法的执行效率,实验结果也表明算法是有效、快速的· 展开更多
关键词 数据挖掘 关联规则 频繁项目集
在线阅读 下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:96
6
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁项集 候选项集
在线阅读 下载PDF
一种有效的隐私保护关联规则挖掘方法 被引量:53
7
作者 张鹏 童云海 +2 位作者 唐世渭 杨冬青 马秀莉 《软件学报》 EI CSCD 北大核心 2006年第8期1764-1774,共11页
隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据... 隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据干扰和查询限制这两种隐私保护的基本策略相结合,提出了一种新的数据随机处理方法,即部分隐藏的随机化回答(randomizedresponsewithpartialhiding,简称RRPH)方法,以对原始数据进行变换和隐藏.然后以此为基础,针对经过RRPH方法处理后的数据,给出了一种简单而又高效的频繁项集生成算法,进而实现了隐私保护的关联规则挖掘.理论分析和实验结果均表明,基于RRPH的隐私保护关联规则挖掘方法具有很好的隐私性、准确性、高效性和适用性. 展开更多
关键词 隐私保护 数据挖掘 关联规则 频繁项集 随机化回答
在线阅读 下载PDF
关联规则挖掘的矩阵算法 被引量:33
8
作者 曾万聃 周绪波 +2 位作者 戴勃 常桂然 李春平 《计算机工程》 CAS CSCD 北大核心 2006年第2期45-47,共3页
关联挖掘算法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显。... 关联挖掘算法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显。文章提出了一种新的关联规则挖掘算法:矩阵算法。同Apriori算法相比较,该算法能直接查找高次频繁项集,可以有效地屏蔽Apriori算法性能瓶颈。试验结果表明,当频繁项级较高时该算法比Apriori具有更高的执行效率和性能,并具有良好的可行性。 展开更多
关键词 关联挖掘 APRIORI算法 频繁项集 矩阵算法
在线阅读 下载PDF
基于DDMINER分布式数据库系统中频繁项目集的更新 被引量:15
9
作者 吉根林 杨明 +1 位作者 赵斌 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1387-1392,共6页
给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项... 给出了一种分布式数据挖掘系统的体系结构DDMINER ,对分布式数据库系统中频繁项目集的更新问题进行探讨 ,既考虑了数据库中事务增加的情况 ,又考虑了事务删除的情况 ;提出了一种基于DDMINER的局部频繁项目集的更新算法ULF和全局频繁项目集的更新算法UGF .该算法能够产生较少数量的候选频繁项目集 ,在求解全局频繁项目集过程中 ,传送候选局部频繁项目集支持数的通信量为O(n) ;将文章提出的算法用Java语言加以实现 ,并对算法性能进行了研究 ;实验结果表明这些算法是正确、可行的 ,并且具有较高的效率. 展开更多
关键词 分布式数据库系统 频繁项目集 分布式数据挖掘系统 体系结构 DDMINER
在线阅读 下载PDF
利用项集有序特性改进Apriori算法 被引量:11
10
作者 刘美玲 徐章艳 +3 位作者 卢景丽 区玉明 袁鼎荣 吴信东 《广西师范大学学报(自然科学版)》 CAS 2004年第1期33-37,共5页
Apriori算法是挖掘关联规则的一个经典算法,通过分析、研究该算法的基本思想,并利用项集的有序特性对其进行改进,减少了生成的候选集数量,从而提高算法的效率.
关键词 APRIORI算法 挖掘关联规则 非频繁项集 有序特性 数据挖掘
在线阅读 下载PDF
时间敏感数据流上的频繁项集挖掘算法 被引量:29
11
作者 李海峰 章宁 +1 位作者 朱建明 曹怀虎 《计算机学报》 EI CSCD 北大核心 2012年第11期2283-2293,共11页
数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了... 数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了频繁项集的挖掘算法FIMoTS.该算法引入了类型变化界限的概念,将项集进行动态分类,根据滑动窗口大小的变化对项集进行延迟处理,仅当项集的类型变化界限超出一定阈值的时候才进行支持度的重新计算,能够达到剪枝的目的.在4种不同密度的数据集上完成的实验结果显示,该算法能够在保证内存开销基本不变的情况下显著提高计算效率. 展开更多
关键词 频繁项集 数据流 时间敏感 滑动窗口 数据挖掘
在线阅读 下载PDF
快速更新频繁项集 被引量:63
12
作者 朱玉全 孙志挥 赵传申 《计算机研究与发展》 EI CSCD 北大核心 2003年第1期94-99,共6页
发现频繁项集是数据挖掘应用中的关键问题 ,发现过程的高花费要求对增量数据挖掘算法进行深入研究 首先分析并指出了增量式更新频繁项集算法的技术难点———寻找新的有效频繁项集 ;其次提出了一种快速的增量式更新频繁项集算法FUFIA ;
关键词 快速更新频繁项集 数据挖掘 关联规则 频繁项集 事务数据库
在线阅读 下载PDF
快速挖掘全局频繁项目集 被引量:35
13
作者 杨明 孙志挥 吉根林 《计算机研究与发展》 EI CSCD 北大核心 2003年第4期620-626,共7页
分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为... 分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率 展开更多
关键词 数据挖掘 全局频繁项目集 频繁模式树 快速挖掘算法 布尔型关联规则 数据库 APRIORI算法
在线阅读 下载PDF
不确定数据频繁项集挖掘方法综述 被引量:19
14
作者 汪金苗 张龙波 +2 位作者 邓齐志 王凤英 王勇 《计算机工程与应用》 CSCD 北大核心 2011年第20期121-125,共5页
近几年来,不确定数据广泛出现在传感器网络、Web应用等领域中。不确定数据挖掘已经成为了新的研究热点,主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中频繁项集挖掘是重点研究的问题之一。综述了传统的频繁项集挖掘的两类基... 近几年来,不确定数据广泛出现在传感器网络、Web应用等领域中。不确定数据挖掘已经成为了新的研究热点,主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中频繁项集挖掘是重点研究的问题之一。综述了传统的频繁项集挖掘的两类基本算法,分析了在此基础上提出的适用于不确定数据以及不确定数据流的频繁项集挖掘的方法,并探讨了今后可能的研究方向。 展开更多
关键词 不确定数据 频繁项集 数据挖掘
在线阅读 下载PDF
关联规则挖掘Apriori算法的研究与改进 被引量:120
15
作者 刘华婷 郭仁祥 姜浩 《计算机应用与软件》 CSCD 2009年第1期146-149,共4页
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,... 关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法。该算法基于新的数据结构,改进了产生候选项集的连接方法。在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著。 展开更多
关键词 数据挖掘 关联规则 频繁项集 APRIORI算法
在线阅读 下载PDF
基于FP-Tree的反向频繁项集挖掘 被引量:21
16
作者 郭宇红 童云海 +1 位作者 唐世渭 杨冬青 《软件学报》 EI CSCD 北大核心 2008年第2期338-350,共13页
在拓展现有反向频繁挖掘问题定义,探索反向频繁项集的3个具体应用后,提出了一种基于FP-tree的反向频繁项集挖掘方法.该方法首先采用分治思想,将目标约束划分为若干子约束,每步求解一个子线性约束问题,经过若干步迭代后找到一个满足整个... 在拓展现有反向频繁挖掘问题定义,探索反向频繁项集的3个具体应用后,提出了一种基于FP-tree的反向频繁项集挖掘方法.该方法首先采用分治思想,将目标约束划分为若干子约束,每步求解一个子线性约束问题,经过若干步迭代后找到一个满足整个给定约束的目标FP-tree;然后根据目标FP-tree生成一个仅含频繁项的临时事务数据库TempD;最后通过向TempD中撒入非频繁项得到目标数据集.理论分析和实验表明该方法是正确的、高效的,且与现有方法仅能输出1个目标数据集相比,该方法能够输出较多的目标数据集. 展开更多
关键词 反向挖掘 FP树 频繁项集 隐私保护 知识隐藏
在线阅读 下载PDF
基于频繁项集特性的Apriori算法的改进 被引量:25
17
作者 高宏宾 潘谷 黄义明 《计算机工程与设计》 CSCD 北大核心 2007年第10期2273-2275,2378,共4页
Apriori算法是关联规则中一种重要算法。Apriori算法在求出频繁项集的过程中,需要扫描事务项集里的数据。由于事务项集里只是部分数据有用,所以改进算法,缩小所需扫描的事务项集大小,并提出了一种简单的数据结构——树型结构来存储事务... Apriori算法是关联规则中一种重要算法。Apriori算法在求出频繁项集的过程中,需要扫描事务项集里的数据。由于事务项集里只是部分数据有用,所以改进算法,缩小所需扫描的事务项集大小,并提出了一种简单的数据结构——树型结构来存储事务项集数据,使得算法在数据集量巨大时,性能得到有效提高,并用实例验证了这些改进能够正确、有效、快速地实现该算法。 展开更多
关键词 数据挖掘 关联规则 频繁项集 APRIORI算法 事务项集
在线阅读 下载PDF
关联规则挖掘算法的改进与优化研究 被引量:9
18
作者 李小兵 吴锦林 +1 位作者 薛永生 翁伟 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第4期468-471,共4页
首先对Apriori算法过程本身进行了详细的研究,给出了三种改进措施,各种改进措施在特定的应用场合有着明显的优点,均能有效减少存储候选集所占用的空间或算法过程占用的时间,之后着重对强关联规则的生成算法进行了详细讨论,给出了优化算... 首先对Apriori算法过程本身进行了详细的研究,给出了三种改进措施,各种改进措施在特定的应用场合有着明显的优点,均能有效减少存储候选集所占用的空间或算法过程占用的时间,之后着重对强关联规则的生成算法进行了详细讨论,给出了优化算法,实例表明该算法能有效减少相关计算量,比已有算法运算效率明显提高. 展开更多
关键词 关联规则挖掘算法 优化研究 APRIORI算法 改进措施 应用场合 运算效率 优化算法 生成算法 候选集 计算量 占用
在线阅读 下载PDF
基于消费行为的Apriori算法研究 被引量:8
19
作者 骆嘉伟 彭蔓蔓 +1 位作者 陈景燕 王思玮 《计算机工程》 CAS CSCD 北大核心 2003年第5期72-73,118,共3页
介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集... 介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集的项集,进一步缩减项集的潜在规模,提高了频繁项集生成的效率。 展开更多
关键词 消费行为 APRIORI算法 数据挖掘 关联规则 候选项集 频繁项集 数据库
在线阅读 下载PDF
基于布尔矩阵的关联规则算法研究 被引量:18
20
作者 方炜炜 杨炳儒 +1 位作者 宋威 侯伟 《计算机应用研究》 CSCD 北大核心 2008年第7期1964-1966,共3页
针对可快速在大型交易事务数据库中挖掘关联规则的问题,基于布尔矩阵提出一种新的挖掘算法。该算法通过仅需存储布尔位节约了内存,通过简单布尔运算提高了求解频繁项集的效率。实验证明该算法较之于Apriori算法有更好的性能。
关键词 数据挖掘 关联规则 矩阵 APRIORI算法 频繁项集
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部