期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
16
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于有序树的不确定数据最大频繁项挖掘算法
被引量:
7
1
作者
刘卫明
蒯海龙
+1 位作者
陈志刚
毛伊敏
《计算机工程与应用》
CSCD
北大核心
2015年第24期145-149,共5页
针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了...
针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了一种挖掘不确定最大频繁项集算法UMMFI算法,并采取逐层逐个的NBN策略挖掘不确定最大频繁项集。实验结果表明,UMMFI算法具有较好的时空效益和适应性。
展开更多
关键词
不确定
数据
的
最大频繁
项
集
不确定
数据最大
频繁
项
挖掘
(
ummfi
)
算法
有序的压缩
不确定
树(SCUF-tree)
逐层逐个地处理节点(NBN)策略
在线阅读
下载PDF
职称材料
一种不确定数据集上频繁模式挖掘的近似算法
被引量:
8
2
作者
王水
祝孔涛
王乐
《计算机应用研究》
CSCD
北大核心
2014年第3期725-728,共4页
为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集...
为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集进行了算法的测试,分别与目前最好的算法和典型算法进行性能对比。实验结果验证了近似算法AAT-Mine的时空效率都得到了提高。
展开更多
关键词
数据
挖掘
频繁
模式
频繁
项
集
不确定
数据
集
近似
算法
在线阅读
下载PDF
职称材料
不确定数据流中频繁模式的并行挖掘算法
被引量:
6
3
作者
常艳芬
王乐
王辉兵
《计算机应用与软件》
CSCD
2016年第9期20-23,162,共5页
不确定数据集中频繁模式挖掘的研究热点之一是挖掘算法的时空效率的提高,特别在目前数据量越来越大的情况下,实际应用对挖掘算法效率的要求也更高。针对动态不确定数据流中的频繁模式挖掘模型,在算法AT-Mine的基础上,给出一个基于MapRed...
不确定数据集中频繁模式挖掘的研究热点之一是挖掘算法的时空效率的提高,特别在目前数据量越来越大的情况下,实际应用对挖掘算法效率的要求也更高。针对动态不确定数据流中的频繁模式挖掘模型,在算法AT-Mine的基础上,给出一个基于MapReduce的并行挖掘算法。该算法需要两次MapReduce就可以从一个滑动窗口中挖掘出所有的频繁模式。实验中,多数情况下通过一次MapReduce就可以挖掘到全部频繁项集,并且能按数据量大小均匀地把数据分配到各个节点上。实验验证了该算法的时间效率能提高1个数量级。
展开更多
关键词
不确定
数据
频繁
模式
数据
挖掘
并行
算法
在线阅读
下载PDF
职称材料
压缩UF-tree挖掘不确定数据频繁项
被引量:
1
4
作者
陈超泉
黄佳欢
江云辉
《计算机应用研究》
CSCD
北大核心
2014年第3期716-719,共4页
针对UF-growth算法构造大量树节点和分支的局限性,且不断计算候选数据项支持度的不足,提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时,将该数据项合并到分支中;否则,从该分支节点创...
针对UF-growth算法构造大量树节点和分支的局限性,且不断计算候选数据项支持度的不足,提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时,将该数据项合并到分支中;否则,从该分支节点创建新的分支,叶节点保存当前事务编号。构建单项数据项的概率向量,搜索树分支产生候选项,通过事务编号和概率向量计算候选数据项的支持度进而挖掘频繁项。通过实验对比与分析,压缩UF-tree算法可行且更高效。
展开更多
关键词
数据
挖掘
不确定
数据
事务
分支
概率向量
频繁
项
在线阅读
下载PDF
职称材料
高速网络流频繁项挖掘算法
被引量:
5
5
作者
赵小欢
夏靖波
+1 位作者
付凯
李明辉
《计算机研究与发展》
EI
CSCD
北大核心
2014年第11期2458-2469,共12页
在当前骨干网络链路速率呈几何倍数增长的情况下,实时准确地挖掘出网络流中的频繁项对于网络管理和网络安全具有重要的意义.在SS(space saving)计数算法的启发之下,针对网络流的实际特性,提出了一种剪枝操作受时间和流长双重约束的网络...
在当前骨干网络链路速率呈几何倍数增长的情况下,实时准确地挖掘出网络流中的频繁项对于网络管理和网络安全具有重要的意义.在SS(space saving)计数算法的启发之下,针对网络流的实际特性,提出了一种剪枝操作受时间和流长双重约束的网络流频繁项挖掘算法(integrated weighted frequent items mining,IWFIM).IWFIM计数算法采用时间和流长组合赋权的方式为每个流项赋权,且算法每次剪枝操作时总是删除权值最小的流项.在IWFIM算法的基础上,依据网络流的重尾分布特性,又提出了一种能够结合散列方法和计数方法优点的网络流频繁项挖掘算法(counting Blooming filter and integrated weighted frequent items mining,CBF_IWFIM).CBF_IWFIM算法首先采用改进的计数型布鲁姆过滤器(counting Blooming filter,CBF)在不保存网络流信息的情况下过滤掉绝大部分的短流,然后采用IWFIM算法实现网络流频繁项挖掘.通过实际网络流量测试表明,CBF_IWFIM和IWFIM算法具有非常高的空间利用率和准确率,2种算法对于网络流频繁项的挖掘效果明显优于SS等3种算法,即使在使用其他算法1?3缓存的极端情况下,CBF_IWFIM和IWFIM 2种算法的频繁项识别效果仍然要优于SS等算法.
展开更多
关键词
网络流
频繁
项
数据
挖掘
剪枝策略
计数
算法
散列
算法
重尾分布
计数型布鲁姆过滤器
在线阅读
下载PDF
职称材料
基于遗传算法的频繁项挖掘算法
被引量:
2
6
作者
张军
《计算机工程与应用》
CSCD
北大核心
2008年第12期161-165,共5页
从数学规划的角度重新表述了单维布尔型频繁项挖掘问题,利用新定义的加法和数乘及范数运算将其归结为一个非线性0-1规划问题,并利用遗传算法进行求解。在分析频繁项挖掘问题困难原因的基础上,提出了利用原数据库记录确定初始种群的方法...
从数学规划的角度重新表述了单维布尔型频繁项挖掘问题,利用新定义的加法和数乘及范数运算将其归结为一个非线性0-1规划问题,并利用遗传算法进行求解。在分析频繁项挖掘问题困难原因的基础上,提出了利用原数据库记录确定初始种群的方法,并在IBM公布的ticeval2000数据库上进行了数值实验。实际计算结果表明,该方法一般在几代内即可找到一批长频繁模式。
展开更多
关键词
频繁
项
数据
挖掘
非线性规划
遗传
算法
在线阅读
下载PDF
职称材料
一种基于人工免疫的新的频繁项挖掘算法
被引量:
1
7
作者
王评
陈国龙
《计算机科学》
CSCD
北大核心
2005年第8期155-157,共3页
以往算法的研究主要围绕着减少候选项目集进而减少事务数据库的扫描次数的角度,先求出候选项集,再计算候选项集的支持度求得频繁项集。本文改变过去求频繁项集的角度,从新的角度来看频繁项目集的定义,同时结合人工免疫的特点,设计一个...
以往算法的研究主要围绕着减少候选项目集进而减少事务数据库的扫描次数的角度,先求出候选项集,再计算候选项集的支持度求得频繁项集。本文改变过去求频繁项集的角度,从新的角度来看频繁项目集的定义,同时结合人工免疫的特点,设计一个基于人工免疫的新频繁项集挖掘算法。本文详细介绍了算法设计等。新算法的复杂度与支持度,数据库总容量有关。验证实验的结果与其他算法相比较证明了该算法的可行性、有效性和完备性。
展开更多
关键词
免疫
算法
频繁
项
集
支持度
关联规则
挖掘
算法
人工免疫
事务
数据
库
候选
项
集
算法
设计
候选
项
目集
在线阅读
下载PDF
职称材料
一种基于前缀树的频繁模式挖掘算法
被引量:
4
8
作者
朱光喜
吴伟民
+1 位作者
阮幼林
刘干
《计算机科学》
CSCD
北大核心
2005年第4期34-36,共3页
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出...
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。
展开更多
关键词
频繁
模式
挖掘
算法
前缀
关键步骤
数据
挖掘
候选
项
集
动态维护
挖掘
过程
时空效率
相关信息
深度优先
数据
结构
新
算法
中节点
递归
在线阅读
下载PDF
职称材料
基于逆向FP-树的频繁模式挖掘算法
被引量:
8
9
作者
赵艳铎
宋斌恒
《计算机应用》
CSCD
北大核心
2005年第6期1385-1387,共3页
提出了一种称为逆向FP 合并的算法,该算法逆向构造FP 树并通过在其中寻找频繁扩展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP 增长算法,其中时间效率提高了2倍以上。此外,新算法还具有良好的伸缩性。
关键词
数据
挖掘
频繁
模式
逆向FP-树
逆向FP-合并
算法
频繁
扩展
项
在线阅读
下载PDF
职称材料
关联规则挖掘中Apriori算法的研究与改进
被引量:
96
10
作者
崔贯勋
李梁
+2 位作者
王柯柯
苟光磊
邹航
《计算机应用》
CSCD
北大核心
2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和...
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。
展开更多
关键词
数据
挖掘
关联规则
APRIORI
算法
频繁
项
集
候选
项
集
在线阅读
下载PDF
职称材料
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响
被引量:
25
11
作者
陆楠
王喆
周春光
《吉林大学学报(理学版)》
CAS
CSCD
北大核心
2003年第2期180-185,共6页
通过对两个有代表性的算法Apriori和FP-Growth的剖析,说明频集模式挖掘的过程,比较有候选项集产生和无候选项集产生算法的特点,并给出FP-tree结构的构造方法以及对挖掘关联规则的影响,提出了对算法的改进方法.
关键词
数据
挖掘
关联规则
频繁
项
集
无候选
项
集
FP-tree频集模式
FP-GROWTH
算法
在线阅读
下载PDF
职称材料
单调和反单调约束条件下关联规则的挖掘算法分析
被引量:
3
12
作者
杜剑峰
李宏
+1 位作者
陈松乔
陈建二
《计算机科学》
CSCD
北大核心
2005年第6期142-144,166,共4页
本文充分利用了 Eclat算法的概念格理论和等价类划分方法,将约束条件融入基于垂直数据分布的关联规则挖掘算法中。提出了一种新的反单调和单调约束条件下关联规则的挖掘算法,分别为EclatA算法和EclatM算法。算法采用自底向上的搜索方法...
本文充分利用了 Eclat算法的概念格理论和等价类划分方法,将约束条件融入基于垂直数据分布的关联规则挖掘算法中。提出了一种新的反单调和单调约束条件下关联规则的挖掘算法,分别为EclatA算法和EclatM算法。算法采用自底向上的搜索方法,在发现频繁项集的同时进行约束条件的检验。数据库的扫描次数较少,无需对候选项集进行剪枝,占用内存较小。实验证明:该算法的执行效率比已有算法有显著提高。
展开更多
关键词
约束条件
算法
分析
单调
调和
关联规则
挖掘
算法
划分方法
充分利用
数据
分布
搜索方法
自底向上
频繁
项
集
扫描次数
候选
项
集
实验证明
等价类
概念格
A
算法
数据
库
效率比
内存
在线阅读
下载PDF
职称材料
基于格论的关联规则挖掘算法的研究
13
作者
蒋震
葛垚
+1 位作者
黄剑
文俊浩
《计算机科学》
CSCD
北大核心
2005年第8期158-160,共3页
本文通过对关联规则挖掘中由候选项集生成频繁项集算法的分析,引入了格论的一些思想来改进算法,其中心思想是:通过在属性集和事务数据库的基础上进行建格,然后在格的基础上直接进行规则提取。在实验的基础上对Apriori算法和改进的算法...
本文通过对关联规则挖掘中由候选项集生成频繁项集算法的分析,引入了格论的一些思想来改进算法,其中心思想是:通过在属性集和事务数据库的基础上进行建格,然后在格的基础上直接进行规则提取。在实验的基础上对Apriori算法和改进的算法进行了比较,实验结果表明,在特定的数据库中,改进的算法在挖掘效率上优于 Apriori算法。
展开更多
关键词
数据
挖掘
关联规则
候选
项
集
频繁
项
集
闭
项
集
格论
闹
项
集格
关联规则
挖掘
算法
Apriori
算法
事务
数据
库
在线阅读
下载PDF
职称材料
基于消费行为的Apriori算法研究
被引量:
8
14
作者
骆嘉伟
彭蔓蔓
+1 位作者
陈景燕
王思玮
《计算机工程》
CAS
CSCD
北大核心
2003年第5期72-73,118,共3页
介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集...
介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集的项集,进一步缩减项集的潜在规模,提高了频繁项集生成的效率。
展开更多
关键词
消费行为
APRIORI
算法
数据
挖掘
关联规则
候选
项
集
频繁
项
集
数据
库
在线阅读
下载PDF
职称材料
关联规则增量更新算法研究
被引量:
10
15
作者
李宝东
宋瀚涛
《计算机工程与应用》
CSCD
北大核心
2002年第23期6-8,共3页
该文研究了关联规则更新的第一类问题,即数据库记录增加时的关联规则更新问题。首先,该文讨论了现有的FUP算法的基本思想,然后在此基础上对其进行改进,提出了改进的FUP算法EFUP,给出了具体实现方法。最后在不同方面针对EFUP与FUP算法进...
该文研究了关联规则更新的第一类问题,即数据库记录增加时的关联规则更新问题。首先,该文讨论了现有的FUP算法的基本思想,然后在此基础上对其进行改进,提出了改进的FUP算法EFUP,给出了具体实现方法。最后在不同方面针对EFUP与FUP算法进行了实验比较,说明了EFUP相对于FUP算法的优点。
展开更多
关键词
关联规则增量更新
算法
数据
挖掘
关联规则
频繁
项
集
支持数
候选
项
集
数据
库
知识发现
在线阅读
下载PDF
职称材料
基于修正BPSO的通用模式指标上界估算方法
16
作者
王菊
刘付显
靳春杰
《计算机工程》
CAS
CSCD
北大核心
2018年第10期168-174,共7页
针对约束频繁模式挖掘中模式指标的界值估算问题,提出一种基于修正二进制粒子群优化(BPSO)算法的通用模式指标上界估算方法。根据带有权值的不确定型事务数据库的特点,建立通用的模式指标上界估算框架,并提出在该框架下基于修正BPSO的...
针对约束频繁模式挖掘中模式指标的界值估算问题,提出一种基于修正二进制粒子群优化(BPSO)算法的通用模式指标上界估算方法。根据带有权值的不确定型事务数据库的特点,建立通用的模式指标上界估算框架,并提出在该框架下基于修正BPSO的模式指标上界值求解方法。对比UHUI-Apriori算法分别结合事务加权效用值、本文方法估算所得上界值和实际上界值后的候选项集数量、运行时间和内存占用情况,结果表明,该方法可以较快计算模式效用的上界值,且能够节省运行时间和内存空间。
展开更多
关键词
不确定
型
数据
库
模式指标
界值估算
粒子群优化
算法
约束
频繁
模式
挖掘
在线阅读
下载PDF
职称材料
题名
基于有序树的不确定数据最大频繁项挖掘算法
被引量:
7
1
作者
刘卫明
蒯海龙
陈志刚
毛伊敏
机构
江西理工大学信息工程学院
江西理工大学资源与环境工程学院
中南大学软件学院
江西理工大学应用科学学院
出处
《计算机工程与应用》
CSCD
北大核心
2015年第24期145-149,共5页
基金
江西省自然科学基金(No.20122BAB201045)
国家自然科学基金(No.41362015
No.61073186)
文摘
针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了一种挖掘不确定最大频繁项集算法UMMFI算法,并采取逐层逐个的NBN策略挖掘不确定最大频繁项集。实验结果表明,UMMFI算法具有较好的时空效益和适应性。
关键词
不确定
数据
的
最大频繁
项
集
不确定
数据最大
频繁
项
挖掘
(
ummfi
)
算法
有序的压缩
不确定
树(SCUF-tree)
逐层逐个地处理节点(NBN)策略
Keywords
maximal frequent itemsets in uncertain databases
Mining Maximal Frequent Items from Uncertain data(
ummfi
) algorithm
Sequential Compressed Uncertain Frequent pattern tree(SCUF-tree)
Node By Node(NBN)strategy
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种不确定数据集上频繁模式挖掘的近似算法
被引量:
8
2
作者
王水
祝孔涛
王乐
机构
宁波大红鹰学院信息工程学院
南阳理工学院软件学院
大连理工大学电子信息与电气工程学部计算机科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2014年第3期725-728,共4页
基金
国家自然科学基金资助项目(61173163)
宁波市自然科学基金资助项目(2013A610115)
宁波大红鹰学院大宗商品专项项目
文摘
为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集进行了算法的测试,分别与目前最好的算法和典型算法进行性能对比。实验结果验证了近似算法AAT-Mine的时空效率都得到了提高。
关键词
数据
挖掘
频繁
模式
频繁
项
集
不确定
数据
集
近似
算法
Keywords
vdata mining
frequent itemsets
frequent pattern
uncertain dataset
approximation algorithm
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
不确定数据流中频繁模式的并行挖掘算法
被引量:
6
3
作者
常艳芬
王乐
王辉兵
机构
宁波大红鹰学院信息工程学院
大连理工大学创新实验学院
出处
《计算机应用与软件》
CSCD
2016年第9期20-23,162,共5页
基金
国家自然科学基金项目(61370200)
宁波市自然科学基金项目(2013A610115
+3 种基金
2014A610073)
宁波市软科学研究计划项目(2014A10008)
浙江省科技厅计划项目(2016C31128)
浙江省教育厅一般科研项目(Y201533234)
文摘
不确定数据集中频繁模式挖掘的研究热点之一是挖掘算法的时空效率的提高,特别在目前数据量越来越大的情况下,实际应用对挖掘算法效率的要求也更高。针对动态不确定数据流中的频繁模式挖掘模型,在算法AT-Mine的基础上,给出一个基于MapReduce的并行挖掘算法。该算法需要两次MapReduce就可以从一个滑动窗口中挖掘出所有的频繁模式。实验中,多数情况下通过一次MapReduce就可以挖掘到全部频繁项集,并且能按数据量大小均匀地把数据分配到各个节点上。实验验证了该算法的时间效率能提高1个数量级。
关键词
不确定
数据
频繁
模式
数据
挖掘
并行
算法
Keywords
Uncertain data Frequent pattern Data mining Parallel algorithm
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
压缩UF-tree挖掘不确定数据频繁项
被引量:
1
4
作者
陈超泉
黄佳欢
江云辉
机构
桂林理工大学信息科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2014年第3期716-719,共4页
基金
国家科技支撑计划资助项目(2008BAK50B02-02
2011BAD32B02)
文摘
针对UF-growth算法构造大量树节点和分支的局限性,且不断计算候选数据项支持度的不足,提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时,将该数据项合并到分支中;否则,从该分支节点创建新的分支,叶节点保存当前事务编号。构建单项数据项的概率向量,搜索树分支产生候选项,通过事务编号和概率向量计算候选数据项的支持度进而挖掘频繁项。通过实验对比与分析,压缩UF-tree算法可行且更高效。
关键词
数据
挖掘
不确定
数据
事务
分支
概率向量
频繁
项
Keywords
data mining
uncertain data
transaction
branch
probability vector
frequent items
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
高速网络流频繁项挖掘算法
被引量:
5
5
作者
赵小欢
夏靖波
付凯
李明辉
机构
中国人民解放军
空军工程大学信息与导航学院
空军后勤部
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第11期2458-2469,共12页
基金
国家自然科学基金项目(61201209)
陕西省自然科学基金重点项目(2012JZ8005)
全军军事学研究生课题(2010JYXXXX-488)
文摘
在当前骨干网络链路速率呈几何倍数增长的情况下,实时准确地挖掘出网络流中的频繁项对于网络管理和网络安全具有重要的意义.在SS(space saving)计数算法的启发之下,针对网络流的实际特性,提出了一种剪枝操作受时间和流长双重约束的网络流频繁项挖掘算法(integrated weighted frequent items mining,IWFIM).IWFIM计数算法采用时间和流长组合赋权的方式为每个流项赋权,且算法每次剪枝操作时总是删除权值最小的流项.在IWFIM算法的基础上,依据网络流的重尾分布特性,又提出了一种能够结合散列方法和计数方法优点的网络流频繁项挖掘算法(counting Blooming filter and integrated weighted frequent items mining,CBF_IWFIM).CBF_IWFIM算法首先采用改进的计数型布鲁姆过滤器(counting Blooming filter,CBF)在不保存网络流信息的情况下过滤掉绝大部分的短流,然后采用IWFIM算法实现网络流频繁项挖掘.通过实际网络流量测试表明,CBF_IWFIM和IWFIM算法具有非常高的空间利用率和准确率,2种算法对于网络流频繁项的挖掘效果明显优于SS等3种算法,即使在使用其他算法1?3缓存的极端情况下,CBF_IWFIM和IWFIM 2种算法的频繁项识别效果仍然要优于SS等算法.
关键词
网络流
频繁
项
数据
挖掘
剪枝策略
计数
算法
散列
算法
重尾分布
计数型布鲁姆过滤器
Keywords
network flows
frequent items
data mining
pruning strategy
counting method
Hashmethod
heavy-tailed distribution
counting Blooming filter
分类号
TP393 [自动化与计算机技术—计算机应用技术]
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于遗传算法的频繁项挖掘算法
被引量:
2
6
作者
张军
机构
四川大学计算机学院图形图像研究所
出处
《计算机工程与应用》
CSCD
北大核心
2008年第12期161-165,共5页
文摘
从数学规划的角度重新表述了单维布尔型频繁项挖掘问题,利用新定义的加法和数乘及范数运算将其归结为一个非线性0-1规划问题,并利用遗传算法进行求解。在分析频繁项挖掘问题困难原因的基础上,提出了利用原数据库记录确定初始种群的方法,并在IBM公布的ticeval2000数据库上进行了数值实验。实际计算结果表明,该方法一般在几代内即可找到一批长频繁模式。
关键词
频繁
项
数据
挖掘
非线性规划
遗传
算法
Keywords
frequent item
data mining
nonlinear programming
genetic algorithm
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种基于人工免疫的新的频繁项挖掘算法
被引量:
1
7
作者
王评
陈国龙
机构
福州大学数学与计算机学院
出处
《计算机科学》
CSCD
北大核心
2005年第8期155-157,共3页
基金
福建省自然科学基金(编号:A0410010)
福州大学科技发展基金(编号 2003-xq-23)
文摘
以往算法的研究主要围绕着减少候选项目集进而减少事务数据库的扫描次数的角度,先求出候选项集,再计算候选项集的支持度求得频繁项集。本文改变过去求频繁项集的角度,从新的角度来看频繁项目集的定义,同时结合人工免疫的特点,设计一个基于人工免疫的新频繁项集挖掘算法。本文详细介绍了算法设计等。新算法的复杂度与支持度,数据库总容量有关。验证实验的结果与其他算法相比较证明了该算法的可行性、有效性和完备性。
关键词
免疫
算法
频繁
项
集
支持度
关联规则
挖掘
算法
人工免疫
事务
数据
库
候选
项
集
算法
设计
候选
项
目集
Keywords
Immune algorlthm, Support, Associate rules , Frequent itemsets
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
TP393.08 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种基于前缀树的频繁模式挖掘算法
被引量:
4
8
作者
朱光喜
吴伟民
阮幼林
刘干
机构
华中科技大学计算机科学与技术学院
出处
《计算机科学》
CSCD
北大核心
2005年第4期34-36,共3页
基金
国家自然科学基金(603905405)
国家自然科学基金(60273075)
国家863计划课题(2001AA123014)
文摘
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。
关键词
频繁
模式
挖掘
算法
前缀
关键步骤
数据
挖掘
候选
项
集
动态维护
挖掘
过程
时空效率
相关信息
深度优先
数据
结构
新
算法
中节点
递归
Keywords
Frequent pattern
Frequent itemsets
FP-tree
Prefix tree
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
H313 [语言文字—英语]
在线阅读
下载PDF
职称材料
题名
基于逆向FP-树的频繁模式挖掘算法
被引量:
8
9
作者
赵艳铎
宋斌恒
机构
清华大学软件学院
出处
《计算机应用》
CSCD
北大核心
2005年第6期1385-1387,共3页
文摘
提出了一种称为逆向FP 合并的算法,该算法逆向构造FP 树并通过在其中寻找频繁扩展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP 增长算法,其中时间效率提高了2倍以上。此外,新算法还具有良好的伸缩性。
关键词
数据
挖掘
频繁
模式
逆向FP-树
逆向FP-合并
算法
频繁
扩展
项
Keywords
data mining
frequent pattern
conversed FP-tree
conversed FP-merging algorithm
frequent extension item
分类号
TP311.12 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
关联规则挖掘中Apriori算法的研究与改进
被引量:
96
10
作者
崔贯勋
李梁
王柯柯
苟光磊
邹航
机构
重庆理工大学计算机科学与工程学院
出处
《计算机应用》
CSCD
北大核心
2010年第11期2952-2955,共4页
基金
教育部科学研究项目(09yjc870032)
重庆市科技攻关计划项目(CSTC2008AC2126
+2 种基金
CSTC2009AC2034)
重庆市自然科学基金资助项目(CSTC2008BB2065)
重庆理工大学科研青年基金资助项目(2010ZQ22)
文摘
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。
关键词
数据
挖掘
关联规则
APRIORI
算法
频繁
项
集
候选
项
集
Keywords
data mining
association rule
Apriori algorithm
frequent itemsets
candidate item set
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响
被引量:
25
11
作者
陆楠
王喆
周春光
机构
深圳大学信息工程学院
吉林大学计算机科学与技术学院
出处
《吉林大学学报(理学版)》
CAS
CSCD
北大核心
2003年第2期180-185,共6页
基金
国家自然科学基金(批准号:60175024)
教育部科学技术研究重点项目(批准号:02090)
教育部"符号计算与知识工程"重点实验室资助项目.
文摘
通过对两个有代表性的算法Apriori和FP-Growth的剖析,说明频集模式挖掘的过程,比较有候选项集产生和无候选项集产生算法的特点,并给出FP-tree结构的构造方法以及对挖掘关联规则的影响,提出了对算法的改进方法.
关键词
数据
挖掘
关联规则
频繁
项
集
无候选
项
集
FP-tree频集模式
FP-GROWTH
算法
Keywords
data mining
association rule
frequent item set
non candidate item set
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
单调和反单调约束条件下关联规则的挖掘算法分析
被引量:
3
12
作者
杜剑峰
李宏
陈松乔
陈建二
机构
中南大学信息科学与工程学院
出处
《计算机科学》
CSCD
北大核心
2005年第6期142-144,166,共4页
基金
国家杰出青年自然科学基金(69928201)
文摘
本文充分利用了 Eclat算法的概念格理论和等价类划分方法,将约束条件融入基于垂直数据分布的关联规则挖掘算法中。提出了一种新的反单调和单调约束条件下关联规则的挖掘算法,分别为EclatA算法和EclatM算法。算法采用自底向上的搜索方法,在发现频繁项集的同时进行约束条件的检验。数据库的扫描次数较少,无需对候选项集进行剪枝,占用内存较小。实验证明:该算法的执行效率比已有算法有显著提高。
关键词
约束条件
算法
分析
单调
调和
关联规则
挖掘
算法
划分方法
充分利用
数据
分布
搜索方法
自底向上
频繁
项
集
扫描次数
候选
项
集
实验证明
等价类
概念格
A
算法
数据
库
效率比
内存
Keywords
Data mining
Association rules with constraints
Lattices
Equivalence classes
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
O221.1 [理学—运筹学与控制论]
在线阅读
下载PDF
职称材料
题名
基于格论的关联规则挖掘算法的研究
13
作者
蒋震
葛垚
黄剑
文俊浩
机构
重庆交通学院计算机与信息学院
重庆大学计算机学院
重庆大学自动化学院
重庆大学软件学院
出处
《计算机科学》
CSCD
北大核心
2005年第8期158-160,共3页
文摘
本文通过对关联规则挖掘中由候选项集生成频繁项集算法的分析,引入了格论的一些思想来改进算法,其中心思想是:通过在属性集和事务数据库的基础上进行建格,然后在格的基础上直接进行规则提取。在实验的基础上对Apriori算法和改进的算法进行了比较,实验结果表明,在特定的数据库中,改进的算法在挖掘效率上优于 Apriori算法。
关键词
数据
挖掘
关联规则
候选
项
集
频繁
项
集
闭
项
集
格论
闹
项
集格
关联规则
挖掘
算法
Apriori
算法
事务
数据
库
Keywords
Data mining, Association rule, Frequent itemset, Closed itemset, Candidate itemsel, Lattice theory, Closed itemset lattice
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
O153.1 [理学—基础数学]
在线阅读
下载PDF
职称材料
题名
基于消费行为的Apriori算法研究
被引量:
8
14
作者
骆嘉伟
彭蔓蔓
陈景燕
王思玮
机构
湖南大学计算机与通信学院
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第5期72-73,118,共3页
文摘
介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法——Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法。此算法既提高在扫描数据库过程中的信息获取率,又及时剔除超集不是频繁项集的项集,进一步缩减项集的潜在规模,提高了频繁项集生成的效率。
关键词
消费行为
APRIORI
算法
数据
挖掘
关联规则
候选
项
集
频繁
项
集
数据
库
Keywords
Data mining
Association rules
Apriori algorithm
Candidate itemsets
Frequent itemsets
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
关联规则增量更新算法研究
被引量:
10
15
作者
李宝东
宋瀚涛
机构
北京理工大学计算中心
出处
《计算机工程与应用》
CSCD
北大核心
2002年第23期6-8,共3页
基金
部委科研项目资助
文摘
该文研究了关联规则更新的第一类问题,即数据库记录增加时的关联规则更新问题。首先,该文讨论了现有的FUP算法的基本思想,然后在此基础上对其进行改进,提出了改进的FUP算法EFUP,给出了具体实现方法。最后在不同方面针对EFUP与FUP算法进行了实验比较,说明了EFUP相对于FUP算法的优点。
关键词
关联规则增量更新
算法
数据
挖掘
关联规则
频繁
项
集
支持数
候选
项
集
数据
库
知识发现
Keywords
Data Mining,Association Rules,Frequent Itemsets,Support Count ,Candidate Itemsets
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于修正BPSO的通用模式指标上界估算方法
16
作者
王菊
刘付显
靳春杰
机构
空军工程大学防空反导学院
[
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第10期168-174,共7页
文摘
针对约束频繁模式挖掘中模式指标的界值估算问题,提出一种基于修正二进制粒子群优化(BPSO)算法的通用模式指标上界估算方法。根据带有权值的不确定型事务数据库的特点,建立通用的模式指标上界估算框架,并提出在该框架下基于修正BPSO的模式指标上界值求解方法。对比UHUI-Apriori算法分别结合事务加权效用值、本文方法估算所得上界值和实际上界值后的候选项集数量、运行时间和内存占用情况,结果表明,该方法可以较快计算模式效用的上界值,且能够节省运行时间和内存空间。
关键词
不确定
型
数据
库
模式指标
界值估算
粒子群优化
算法
约束
频繁
模式
挖掘
Keywords
uncertain database
pattern index
bound value estimation
Particle Swarm Optimization(PSO)algorithm
constrained frequent pattern mining
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于有序树的不确定数据最大频繁项挖掘算法
刘卫明
蒯海龙
陈志刚
毛伊敏
《计算机工程与应用》
CSCD
北大核心
2015
7
在线阅读
下载PDF
职称材料
2
一种不确定数据集上频繁模式挖掘的近似算法
王水
祝孔涛
王乐
《计算机应用研究》
CSCD
北大核心
2014
8
在线阅读
下载PDF
职称材料
3
不确定数据流中频繁模式的并行挖掘算法
常艳芬
王乐
王辉兵
《计算机应用与软件》
CSCD
2016
6
在线阅读
下载PDF
职称材料
4
压缩UF-tree挖掘不确定数据频繁项
陈超泉
黄佳欢
江云辉
《计算机应用研究》
CSCD
北大核心
2014
1
在线阅读
下载PDF
职称材料
5
高速网络流频繁项挖掘算法
赵小欢
夏靖波
付凯
李明辉
《计算机研究与发展》
EI
CSCD
北大核心
2014
5
在线阅读
下载PDF
职称材料
6
基于遗传算法的频繁项挖掘算法
张军
《计算机工程与应用》
CSCD
北大核心
2008
2
在线阅读
下载PDF
职称材料
7
一种基于人工免疫的新的频繁项挖掘算法
王评
陈国龙
《计算机科学》
CSCD
北大核心
2005
1
在线阅读
下载PDF
职称材料
8
一种基于前缀树的频繁模式挖掘算法
朱光喜
吴伟民
阮幼林
刘干
《计算机科学》
CSCD
北大核心
2005
4
在线阅读
下载PDF
职称材料
9
基于逆向FP-树的频繁模式挖掘算法
赵艳铎
宋斌恒
《计算机应用》
CSCD
北大核心
2005
8
在线阅读
下载PDF
职称材料
10
关联规则挖掘中Apriori算法的研究与改进
崔贯勋
李梁
王柯柯
苟光磊
邹航
《计算机应用》
CSCD
北大核心
2010
96
在线阅读
下载PDF
职称材料
11
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响
陆楠
王喆
周春光
《吉林大学学报(理学版)》
CAS
CSCD
北大核心
2003
25
在线阅读
下载PDF
职称材料
12
单调和反单调约束条件下关联规则的挖掘算法分析
杜剑峰
李宏
陈松乔
陈建二
《计算机科学》
CSCD
北大核心
2005
3
在线阅读
下载PDF
职称材料
13
基于格论的关联规则挖掘算法的研究
蒋震
葛垚
黄剑
文俊浩
《计算机科学》
CSCD
北大核心
2005
0
在线阅读
下载PDF
职称材料
14
基于消费行为的Apriori算法研究
骆嘉伟
彭蔓蔓
陈景燕
王思玮
《计算机工程》
CAS
CSCD
北大核心
2003
8
在线阅读
下载PDF
职称材料
15
关联规则增量更新算法研究
李宝东
宋瀚涛
《计算机工程与应用》
CSCD
北大核心
2002
10
在线阅读
下载PDF
职称材料
16
基于修正BPSO的通用模式指标上界估算方法
王菊
刘付显
靳春杰
《计算机工程》
CAS
CSCD
北大核心
2018
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部