期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于有序树的不确定数据最大频繁项挖掘算法 被引量:7
1
作者 刘卫明 蒯海龙 +1 位作者 陈志刚 毛伊敏 《计算机工程与应用》 CSCD 北大核心 2015年第24期145-149,共5页
针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了... 针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了一种挖掘不确定最大频繁项集算法UMMFI算法,并采取逐层逐个的NBN策略挖掘不确定最大频繁项集。实验结果表明,UMMFI算法具有较好的时空效益和适应性。 展开更多
关键词 不确定数据最大频繁 不确定数据最大频繁挖掘(ummfi)算法 有序的压缩不确定树(SCUF-tree) 逐层逐个地处理节点(NBN)策略
在线阅读 下载PDF
一种不确定数据集上频繁模式挖掘的近似算法 被引量:8
2
作者 王水 祝孔涛 王乐 《计算机应用研究》 CSCD 北大核心 2014年第3期725-728,共4页
为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集... 为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集进行了算法的测试,分别与目前最好的算法和典型算法进行性能对比。实验结果验证了近似算法AAT-Mine的时空效率都得到了提高。 展开更多
关键词 数据挖掘 频繁模式 频繁 不确定数据 近似算法
在线阅读 下载PDF
不确定数据流中频繁模式的并行挖掘算法 被引量:6
3
作者 常艳芬 王乐 王辉兵 《计算机应用与软件》 CSCD 2016年第9期20-23,162,共5页
不确定数据集中频繁模式挖掘的研究热点之一是挖掘算法的时空效率的提高,特别在目前数据量越来越大的情况下,实际应用对挖掘算法效率的要求也更高。针对动态不确定数据流中的频繁模式挖掘模型,在算法AT-Mine的基础上,给出一个基于MapRed... 不确定数据集中频繁模式挖掘的研究热点之一是挖掘算法的时空效率的提高,特别在目前数据量越来越大的情况下,实际应用对挖掘算法效率的要求也更高。针对动态不确定数据流中的频繁模式挖掘模型,在算法AT-Mine的基础上,给出一个基于MapReduce的并行挖掘算法。该算法需要两次MapReduce就可以从一个滑动窗口中挖掘出所有的频繁模式。实验中,多数情况下通过一次MapReduce就可以挖掘到全部频繁项集,并且能按数据量大小均匀地把数据分配到各个节点上。实验验证了该算法的时间效率能提高1个数量级。 展开更多
关键词 不确定数据 频繁模式 数据挖掘 并行算法
在线阅读 下载PDF
压缩UF-tree挖掘不确定数据频繁项 被引量:1
4
作者 陈超泉 黄佳欢 江云辉 《计算机应用研究》 CSCD 北大核心 2014年第3期716-719,共4页
针对UF-growth算法构造大量树节点和分支的局限性,且不断计算候选数据项支持度的不足,提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时,将该数据项合并到分支中;否则,从该分支节点创... 针对UF-growth算法构造大量树节点和分支的局限性,且不断计算候选数据项支持度的不足,提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时,将该数据项合并到分支中;否则,从该分支节点创建新的分支,叶节点保存当前事务编号。构建单项数据项的概率向量,搜索树分支产生候选项,通过事务编号和概率向量计算候选数据项的支持度进而挖掘频繁项。通过实验对比与分析,压缩UF-tree算法可行且更高效。 展开更多
关键词 数据挖掘 不确定数据 事务 分支 概率向量 频繁
在线阅读 下载PDF
高速网络流频繁项挖掘算法 被引量:5
5
作者 赵小欢 夏靖波 +1 位作者 付凯 李明辉 《计算机研究与发展》 EI CSCD 北大核心 2014年第11期2458-2469,共12页
在当前骨干网络链路速率呈几何倍数增长的情况下,实时准确地挖掘出网络流中的频繁项对于网络管理和网络安全具有重要的意义.在SS(space saving)计数算法的启发之下,针对网络流的实际特性,提出了一种剪枝操作受时间和流长双重约束的网络... 在当前骨干网络链路速率呈几何倍数增长的情况下,实时准确地挖掘出网络流中的频繁项对于网络管理和网络安全具有重要的意义.在SS(space saving)计数算法的启发之下,针对网络流的实际特性,提出了一种剪枝操作受时间和流长双重约束的网络流频繁项挖掘算法(integrated weighted frequent items mining,IWFIM).IWFIM计数算法采用时间和流长组合赋权的方式为每个流项赋权,且算法每次剪枝操作时总是删除权值最小的流项.在IWFIM算法的基础上,依据网络流的重尾分布特性,又提出了一种能够结合散列方法和计数方法优点的网络流频繁项挖掘算法(counting Blooming filter and integrated weighted frequent items mining,CBF_IWFIM).CBF_IWFIM算法首先采用改进的计数型布鲁姆过滤器(counting Blooming filter,CBF)在不保存网络流信息的情况下过滤掉绝大部分的短流,然后采用IWFIM算法实现网络流频繁项挖掘.通过实际网络流量测试表明,CBF_IWFIM和IWFIM算法具有非常高的空间利用率和准确率,2种算法对于网络流频繁项的挖掘效果明显优于SS等3种算法,即使在使用其他算法1?3缓存的极端情况下,CBF_IWFIM和IWFIM 2种算法的频繁项识别效果仍然要优于SS等算法. 展开更多
关键词 网络流 频繁 数据挖掘 剪枝策略 计数算法 散列算法 重尾分布 计数型布鲁姆过滤器
在线阅读 下载PDF
基于遗传算法的频繁项挖掘算法 被引量:2
6
作者 张军 《计算机工程与应用》 CSCD 北大核心 2008年第12期161-165,共5页
从数学规划的角度重新表述了单维布尔型频繁项挖掘问题,利用新定义的加法和数乘及范数运算将其归结为一个非线性0-1规划问题,并利用遗传算法进行求解。在分析频繁项挖掘问题困难原因的基础上,提出了利用原数据库记录确定初始种群的方法... 从数学规划的角度重新表述了单维布尔型频繁项挖掘问题,利用新定义的加法和数乘及范数运算将其归结为一个非线性0-1规划问题,并利用遗传算法进行求解。在分析频繁项挖掘问题困难原因的基础上,提出了利用原数据库记录确定初始种群的方法,并在IBM公布的ticeval2000数据库上进行了数值实验。实际计算结果表明,该方法一般在几代内即可找到一批长频繁模式。 展开更多
关键词 频繁 数据挖掘 非线性规划 遗传算法
在线阅读 下载PDF
一种基于人工免疫的新的频繁项挖掘算法 被引量:1
7
作者 王评 陈国龙 《计算机科学》 CSCD 北大核心 2005年第8期155-157,共3页
以往算法的研究主要围绕着减少候选项目集进而减少事务数据库的扫描次数的角度,先求出候选项集,再计算候选项集的支持度求得频繁项集。本文改变过去求频繁项集的角度,从新的角度来看频繁项目集的定义,同时结合人工免疫的特点,设计一个... 以往算法的研究主要围绕着减少候选项目集进而减少事务数据库的扫描次数的角度,先求出候选项集,再计算候选项集的支持度求得频繁项集。本文改变过去求频繁项集的角度,从新的角度来看频繁项目集的定义,同时结合人工免疫的特点,设计一个基于人工免疫的新频繁项集挖掘算法。本文详细介绍了算法设计等。新算法的复杂度与支持度,数据库总容量有关。验证实验的结果与其他算法相比较证明了该算法的可行性、有效性和完备性。 展开更多
关键词 免疫算法 频繁 支持度 关联规则 挖掘算法 人工免疫 事务数据 候选 算法设计 候选目集
在线阅读 下载PDF
一种基于前缀树的频繁模式挖掘算法 被引量:4
8
作者 朱光喜 吴伟民 +1 位作者 阮幼林 刘干 《计算机科学》 CSCD 北大核心 2005年第4期34-36,共3页
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出... 挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。 展开更多
关键词 频繁模式 挖掘算法 前缀 关键步骤 数据挖掘 候选 动态维护 挖掘过程 时空效率 相关信息 深度优先 数据结构 算法 中节点 递归
在线阅读 下载PDF
基于逆向FP-树的频繁模式挖掘算法 被引量:8
9
作者 赵艳铎 宋斌恒 《计算机应用》 CSCD 北大核心 2005年第6期1385-1387,共3页
提出了一种称为逆向FP 合并的算法,该算法逆向构造FP 树并通过在其中寻找频繁扩展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP 增长算法,其中时间效率提高了2倍以上。此外,新算法还具有良好的伸缩性。
关键词 数据挖掘 频繁模式 逆向FP-树 逆向FP-合并算法 频繁扩展
在线阅读 下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:96
10
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁 候选
在线阅读 下载PDF
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响 被引量:25
11
作者 陆楠 王喆 周春光 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2003年第2期180-185,共6页
通过对两个有代表性的算法Apriori和FP-Growth的剖析,说明频集模式挖掘的过程,比较有候选项集产生和无候选项集产生算法的特点,并给出FP-tree结构的构造方法以及对挖掘关联规则的影响,提出了对算法的改进方法.
关键词 数据挖掘 关联规则 频繁 无候选 FP-tree频集模式 FP-GROWTH算法
在线阅读 下载PDF
单调和反单调约束条件下关联规则的挖掘算法分析 被引量:3
12
作者 杜剑峰 李宏 +1 位作者 陈松乔 陈建二 《计算机科学》 CSCD 北大核心 2005年第6期142-144,166,共4页
本文充分利用了 Eclat算法的概念格理论和等价类划分方法,将约束条件融入基于垂直数据分布的关联规则挖掘算法中。提出了一种新的反单调和单调约束条件下关联规则的挖掘算法,分别为EclatA算法和EclatM算法。算法采用自底向上的搜索方法... 本文充分利用了 Eclat算法的概念格理论和等价类划分方法,将约束条件融入基于垂直数据分布的关联规则挖掘算法中。提出了一种新的反单调和单调约束条件下关联规则的挖掘算法,分别为EclatA算法和EclatM算法。算法采用自底向上的搜索方法,在发现频繁项集的同时进行约束条件的检验。数据库的扫描次数较少,无需对候选项集进行剪枝,占用内存较小。实验证明:该算法的执行效率比已有算法有显著提高。 展开更多
关键词 约束条件 算法分析 单调 调和 关联规则挖掘算法 划分方法 充分利用 数据分布 搜索方法 自底向上 频繁 扫描次数 候选 实验证明 等价类 概念格 A算法 数据 效率比 内存
在线阅读 下载PDF
基于格论的关联规则挖掘算法的研究
13
作者 蒋震 葛垚 +1 位作者 黄剑 文俊浩 《计算机科学》 CSCD 北大核心 2005年第8期158-160,共3页
本文通过对关联规则挖掘中由候选项集生成频繁项集算法的分析,引入了格论的一些思想来改进算法,其中心思想是:通过在属性集和事务数据库的基础上进行建格,然后在格的基础上直接进行规则提取。在实验的基础上对Apriori算法和改进的算法... 本文通过对关联规则挖掘中由候选项集生成频繁项集算法的分析,引入了格论的一些思想来改进算法,其中心思想是:通过在属性集和事务数据库的基础上进行建格,然后在格的基础上直接进行规则提取。在实验的基础上对Apriori算法和改进的算法进行了比较,实验结果表明,在特定的数据库中,改进的算法在挖掘效率上优于 Apriori算法。 展开更多
关键词 数据挖掘 关联规则 候选 频繁 格论 集格 关联规则挖掘算法 Apriori算法 事务数据
在线阅读 下载PDF
基于消费行为的Apriori算法研究 被引量:8
14
作者 骆嘉伟 彭蔓蔓 +1 位作者 陈景燕 王思玮 《计算机工程》 CAS CSCD 北大核心 2003年第5期72-73,118,共3页
介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集... 介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集的项集,进一步缩减项集的潜在规模,提高了频繁项集生成的效率。 展开更多
关键词 消费行为 APRIORI算法 数据挖掘 关联规则 候选 频繁 数据
在线阅读 下载PDF
关联规则增量更新算法研究 被引量:10
15
作者 李宝东 宋瀚涛 《计算机工程与应用》 CSCD 北大核心 2002年第23期6-8,共3页
该文研究了关联规则更新的第一类问题,即数据库记录增加时的关联规则更新问题。首先,该文讨论了现有的FUP算法的基本思想,然后在此基础上对其进行改进,提出了改进的FUP算法EFUP,给出了具体实现方法。最后在不同方面针对EFUP与FUP算法进... 该文研究了关联规则更新的第一类问题,即数据库记录增加时的关联规则更新问题。首先,该文讨论了现有的FUP算法的基本思想,然后在此基础上对其进行改进,提出了改进的FUP算法EFUP,给出了具体实现方法。最后在不同方面针对EFUP与FUP算法进行了实验比较,说明了EFUP相对于FUP算法的优点。 展开更多
关键词 关联规则增量更新算法 数据挖掘 关联规则 频繁 支持数 候选 数据 知识发现
在线阅读 下载PDF
基于修正BPSO的通用模式指标上界估算方法
16
作者 王菊 刘付显 靳春杰 《计算机工程》 CAS CSCD 北大核心 2018年第10期168-174,共7页
针对约束频繁模式挖掘中模式指标的界值估算问题,提出一种基于修正二进制粒子群优化(BPSO)算法的通用模式指标上界估算方法。根据带有权值的不确定型事务数据库的特点,建立通用的模式指标上界估算框架,并提出在该框架下基于修正BPSO的... 针对约束频繁模式挖掘中模式指标的界值估算问题,提出一种基于修正二进制粒子群优化(BPSO)算法的通用模式指标上界估算方法。根据带有权值的不确定型事务数据库的特点,建立通用的模式指标上界估算框架,并提出在该框架下基于修正BPSO的模式指标上界值求解方法。对比UHUI-Apriori算法分别结合事务加权效用值、本文方法估算所得上界值和实际上界值后的候选项集数量、运行时间和内存占用情况,结果表明,该方法可以较快计算模式效用的上界值,且能够节省运行时间和内存空间。 展开更多
关键词 不确定数据 模式指标 界值估算 粒子群优化算法 约束频繁模式挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部