期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
65
篇文章
<
1
2
…
4
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
共现聚类分析的新方法:最大频繁项集挖掘
被引量:
22
1
作者
徐硕
乔晓东
+2 位作者
朱礼军
张运良
薛春香
《情报学报》
CSSCI
北大核心
2012年第2期143-150,共8页
针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大。从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行。然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,...
针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大。从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行。然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,从而导致最后得到的共现聚类分析的结果可能存在一定的误导性。为克服该缺陷,本文从关联规则挖掘领域引入了一种新的共现聚类分析方法——最大频繁项集挖掘,它将传统共现分析法的三个阶段压缩为一个阶段,充分利用了可以利用的各种信息,克服了传统方法的缺陷。通过实验分析发现,设置合适的最小支持度阈值,基本上可以得到比较满意的结果。
展开更多
关键词
共现分析
共词分析
聚类分析
最大频繁项集
层次聚类
在线阅读
下载PDF
职称材料
基于向量的数据流滑动窗口中最大频繁项集挖掘
被引量:
7
2
作者
徐嘉莉
陈佳
+2 位作者
胡庆
黄波
郭红霞
《计算机应用研究》
CSCD
北大核心
2012年第3期837-840,共4页
针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算产生频繁项集,利用矩...
针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算产生频繁项集,利用矩阵和数组存储辅助信息,深度优先搜索产生最大频繁项集时利用剪枝策略进一步减少挖掘时间;最后用索引链表存储挖掘结果以提高超集检测效率。理论分析和实验结果验证了该算法的有效性。
展开更多
关键词
数据流
最大频繁项集
滑动窗口
向量
在线阅读
下载PDF
职称材料
一种挖掘最大频繁项集的深度优先算法
被引量:
20
3
作者
颜跃进
李舟军
陈火旺
《计算机研究与发展》
EI
CSCD
北大核心
2005年第3期462-467,共6页
最大频繁项集挖掘是许多数据挖掘应用中的重要问题.提出一种新的深度优先搜索最大频繁项集的算法.该算法采用位图数据格式,结合了流行的各种有效剪枝技术,并使用局部最大频繁项集来进行高效的超集存在判断,明显地加速了最大频繁项集的生...
最大频繁项集挖掘是许多数据挖掘应用中的重要问题.提出一种新的深度优先搜索最大频繁项集的算法.该算法采用位图数据格式,结合了流行的各种有效剪枝技术,并使用局部最大频繁项集来进行高效的超集存在判断,明显地加速了最大频繁项集的生成,从而降低了CPU时间.
展开更多
关键词
最大频繁项集
深度优先搜索
位图
前瞻剪枝
在线阅读
下载PDF
职称材料
基于改进FP-tree的最大频繁项目集挖掘算法
被引量:
9
4
作者
马丽生
姚光顺
杨传健
《计算机应用》
CSCD
北大核心
2012年第2期326-329,共4页
针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存...
针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存条件模式基的存储空间开销。在分析最大频繁项目集挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率。最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性。实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍。
展开更多
关键词
频繁项目集
最大频繁项目集
条件模式基
项头表
剪枝策略
压缩策略
在线阅读
下载PDF
职称材料
基于Iceberg概念格的最大频繁项集挖掘
被引量:
4
5
作者
薛安荣
王富强
李明
《计算机工程》
CAS
CSCD
北大核心
2011年第7期35-37,共3页
最大频繁项集挖掘算法存在扫描数据集次数多和候选集规模过大等局限。基于Iceberg概念格模型,提出一种在Iceberg概念格上挖掘最大频繁项集的算法ICMFIA。该算法通过一次扫描数据集构建Iceberg概念格,利用Iceberg概念格中频繁概念之间良...
最大频繁项集挖掘算法存在扫描数据集次数多和候选集规模过大等局限。基于Iceberg概念格模型,提出一种在Iceberg概念格上挖掘最大频繁项集的算法ICMFIA。该算法通过一次扫描数据集构建Iceberg概念格,利用Iceberg概念格中频繁概念之间良好的覆盖关系能快速计算出最大频繁项集所对应的最大频繁概念,所有最大频繁概念的内涵就是所求的最大频繁项集的集合。实验结果表明,该算法具有扫描数据集次数少和挖掘效率高的优点。
展开更多
关键词
Iceberg概念格
频繁概念
最大频繁概念
最大频繁项集
在线阅读
下载PDF
职称材料
一种基于频繁模式树的最大频繁项目集挖掘算法
被引量:
6
6
作者
任永功
张亮
付玉
《小型微型计算机系统》
CSCD
北大核心
2010年第2期317-321,共5页
目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位...
目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位图建树的方法有效的减少了扫描数据库的次数,从而节省了CPU的执行时间.另外,此算法运用独特的最大频繁项目集判断策略,同时运用投影技术进行超集检测,提高了遍历的效率,实验结果表明该算法是快速有效的.
展开更多
关键词
频繁项目集
最大频繁项目集
频繁模式树
深度优先搜索
在线阅读
下载PDF
职称材料
基于数据流挖掘技术的入侵检测模型与算法
被引量:
6
7
作者
毛伊敏
杨路明
+1 位作者
陈志刚
刘立新
《中南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第9期2720-2728,共9页
针对目前基于数据流关联规则挖掘技术的入侵检测系统响应速度不够快和检测精度不够高的问题,提出一个基于数据流最大频繁模式的入侵检测系统模型MMFIID-DS;设计各种剪枝策略,挖掘经过训练学习后的正常数据集、异常数据集和当前检测数据...
针对目前基于数据流关联规则挖掘技术的入侵检测系统响应速度不够快和检测精度不够高的问题,提出一个基于数据流最大频繁模式的入侵检测系统模型MMFIID-DS;设计各种剪枝策略,挖掘经过训练学习后的正常数据集、异常数据集和当前检测数据流的最大频繁项集,建立系统的正常行为模式、异常行为模式和用户行为模式,达到极大缩小搜索空间的目的,提高系统的响应速度;结合误用检测和异常检测2种入侵检测方法进行实时在线检测入侵,提高系统的检测精度。理论与实验结果表明:MMFIID-DS入侵检测系统具有较好的性能。
展开更多
关键词
数据流
最大频繁项集
异常检测
误用检测
在线阅读
下载PDF
职称材料
频繁闭项目集挖掘算法研究
被引量:
10
8
作者
朱玉全
宋余庆
《计算机研究与发展》
EI
CSCD
北大核心
2007年第7期1177-1183,共7页
目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出...
目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出事务数据库中所有的频繁项目集,并对其更新问题进行了研究,提出了一种相应的频繁闭项目集增量式更新算法UMFCIA,该算法将充分利用先前的挖掘结果来节省发现新的频繁闭项目集的时间开销.实验结果表明算法MFCIA是有效可行的.
展开更多
关键词
频繁项目集
频繁闭项目集
最小频繁闭项目集
最大频繁闭项目集
增量式更新
在线阅读
下载PDF
职称材料
在线挖掘数据流滑动窗口中最大频繁项集
被引量:
9
9
作者
敖富江
颜跃进
+1 位作者
刘宝宏
黄柯棣
《系统仿真学报》
CAS
CSCD
北大核心
2009年第4期1134-1139,共6页
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪...
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术—"子集等价剪枝技术",有效缩小搜索空间的大小。基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+。FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集。仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快。
展开更多
关键词
数据流
最大频繁项集
在线挖掘
滑动窗口
文法顺序FP-Tree
在线阅读
下载PDF
职称材料
基于链表数组的最大频繁项集挖掘算法
被引量:
4
10
作者
刘应东
冷明伟
陈晓云
《计算机工程》
CAS
CSCD
北大核心
2010年第6期89-90,93,共3页
挖掘密集型数据集的全部频繁项集代价高昂,针对该问题,提出一种数据结构链表数组和基于链表数组的最大频繁项集快速生成算法。该方法使用链表数组为每个项目建立事务链表,并且链表的创建过程只需扫描数据库1次。使用深度优先搜索得到所...
挖掘密集型数据集的全部频繁项集代价高昂,针对该问题,提出一种数据结构链表数组和基于链表数组的最大频繁项集快速生成算法。该方法使用链表数组为每个项目建立事务链表,并且链表的创建过程只需扫描数据库1次。使用深度优先搜索得到所有候选最大频繁项集,利用约束条件缩小搜索空间。使用标准数据集进行验证测试并与其他算法进行比较,实验结果表明,该算法具有较快的挖掘速度。
展开更多
关键词
数据挖掘
最大频繁项集
链表数组
解空间
在线阅读
下载PDF
职称材料
基于FP-tree的最大频繁项目集挖掘算法
被引量:
4
11
作者
马丽生
邓辉文
齐逸
《计算机工程与设计》
CSCD
北大核心
2008年第2期385-388,共4页
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使...
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使用投影的方法对超集检测进行了优化,减少了项目匹配的次数。最后实验结果表明,该算法在性能上优于已有的同类算法。
展开更多
关键词
数据挖掘
关联规则
频繁项目集
最大频繁项目集
频繁模式树
在线阅读
下载PDF
职称材料
基于FPMAX的最大频繁项目集挖掘改进算法
被引量:
9
12
作者
牛新征
佘堃
《计算机科学》
CSCD
北大核心
2013年第12期223-228,共6页
挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree...
挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree构造开销。而且在支持度较低时,FPMAX则会因用于超集检测的全局MFItree较为庞大而导致超集检测的性能下降。为此提出FPMAX的改进算法FPMAX-reduce,其通过采用基于事务共同后缀的前瞻剪枝策略来减少挖掘过程中的冗余递归过程。当递归过程中产生的新条件FP-tree规模较小时,FPMAX-reduce通过构造条件MFI-tree来减小后续超集检测遍历的开销。性能试验表明,FPMAX-reduce算法通过有效的前瞻剪枝,在稠密事务数据库以及低支持度的情况下至多可将递归过程减少至原算法的一半以下,进而有效地提高了FPMAX算法的效率。
展开更多
关键词
频繁项目集
最大频繁项目集
FP-TREE
FPMAX
FP-GROWTH
在线阅读
下载PDF
职称材料
数据流中基于滑动窗口的最大频繁项集挖掘算法
被引量:
4
13
作者
杨路明
刘立新
+1 位作者
毛伊敏
谢东
《计算机应用研究》
CSCD
北大核心
2010年第2期519-522,共4页
挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和...
挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和更新数据流上的数据;在深度优先搜索挖掘最大频繁项集时,除采用经典的剪枝策略外,还提出了与父等价原理相对应的子等价剪枝策略;最后将挖掘结果存储在索引链表中以提高超集检测效率,进一步减少挖掘最大频繁项集的时间。理论分析和实验结果证实了该算法在时间和空间上的有效性。
展开更多
关键词
数据流
数据挖掘
最大频繁项集
滑动窗口
位图
在线阅读
下载PDF
职称材料
一种新的最大频繁项目集挖掘算法
被引量:
6
14
作者
马丽生
邓辉文
齐逸
《计算机应用》
CSCD
北大核心
2006年第11期2670-2673,共4页
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上,提出了一种新的挖掘最大频繁项目集的算法,实验表明该算法在性能上优于已有的同类算法。
关键词
数据挖掘
最大频繁项目集
关联规则
在线阅读
下载PDF
职称材料
基于改进FP-tree的最大频繁项集挖掘算法
被引量:
14
15
作者
陈晨
鞠时光
《计算机工程与设计》
CSCD
北大核心
2008年第24期6236-6239,共4页
现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖...
现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖掘过程中既不需要进行超集检测也不需要递归的建立条件频繁模式树。算法分析和实验结果表明,该算法是一种有效、快速的算法。
展开更多
关键词
数据挖掘
关联规则
最大频繁项集
超集检测
频繁模式树
在线阅读
下载PDF
职称材料
基于多维数据流挖掘技术的入侵检测模型与算法
被引量:
25
16
作者
毛国君
宗东军
《计算机研究与发展》
EI
CSCD
北大核心
2009年第4期602-609,共8页
网络访问数据有着数据流的高速、无穷达到的特点,所以利用传统多遍扫描数据库的挖掘技术来构建入侵检测模型是不可行的.针对网络访问数据流的特点,提出了一种基于多维数据流挖掘技术的入侵检测模型.此模型将传统的误用检测和异常检测两...
网络访问数据有着数据流的高速、无穷达到的特点,所以利用传统多遍扫描数据库的挖掘技术来构建入侵检测模型是不可行的.针对网络访问数据流的特点,提出了一种基于多维数据流挖掘技术的入侵检测模型.此模型将传统的误用检测和异常检测两种入侵检测方法进行有机融合,因此能够克服目前广泛使用的误用检测方法无法检测新的攻击类型的缺点,并且也能够保持检测的高效性.网络访问数据记录的结构是复杂的,一个访问行为总是联系到许多属性,所以分析的难度很大.因此,引入多维频度等概念来解决网络数据流的模式表示和生成问题.同时,针对多维频度模式的特点,提出了一种新型数据结构MaxFP-Tree.在MaxFP-Tree的基础上,给出了一种高效的挖掘网络访问数据流的学习算法MaxFPinNDS.MaxFPinNDS采用衰减机制挖掘,可以快速地形成一个数据流的最近时期数据所隐含的最大频繁项目集.实验表明,设计的入侵检测模型是有效的.
展开更多
关键词
多维数据流
入侵检测
异常检测
误用检测
最大频繁项集
在线阅读
下载PDF
职称材料
项约束先过滤的最大频繁项集挖掘算法
被引量:
8
17
作者
姚全珠
李如琼
王美君
《计算机工程》
CAS
CSCD
2012年第4期73-75,共3页
在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数...
在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数据库进行最大频繁相集的挖掘。实验结果表明,该算法快速有效,尤其在挖掘具有长模式的稠密数据库时优势明显。
展开更多
关键词
关联规则
最大频繁项集
项约束
垂直数据格式
深度优先
稠密数据库
在线阅读
下载PDF
职称材料
基于图论的最大频繁项集挖掘
被引量:
3
18
作者
宋旭东
翟坤
+2 位作者
刘晓冰
王亚伟
张通学
《计算机应用研究》
CSCD
北大核心
2007年第11期43-45,99,共4页
利用有向项集图来存储事务数据库中有关频繁项集的信息,提出了有向项集图的三叉链表式存储结构和基于有向项集图的最大频繁项集挖掘算法。它不仅实现了事务数据库的一次扫描,减少了I/O代价,而且可以同时解决好稀疏数据库和稠密数据库的...
利用有向项集图来存储事务数据库中有关频繁项集的信息,提出了有向项集图的三叉链表式存储结构和基于有向项集图的最大频繁项集挖掘算法。它不仅实现了事务数据库的一次扫描,减少了I/O代价,而且可以同时解决好稀疏数据库和稠密数据库的最大频繁项集挖掘问题。
展开更多
关键词
数据挖掘
关联规则
最大频繁项集
有向项集图
三叉链表式存储结构
挖掘算法
在线阅读
下载PDF
职称材料
基于有序FP-tree的最大频繁项集挖掘算法
被引量:
5
19
作者
李少华
吕志旺
+1 位作者
车德勇
周宁
《东北师大学报(自然科学版)》
CAS
CSCD
北大核心
2016年第2期65-69,共5页
通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析...
通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析和实验数据发现MMFI算法比传统算法快速、合理.
展开更多
关键词
数据挖掘
FP-TREE
最大频繁项集
关联规则
在线阅读
下载PDF
职称材料
基于索引数组与集合枚举树的最大频繁项集挖掘算法
被引量:
4
20
作者
宋威
杨炳儒
+1 位作者
徐章艳
侯伟
《计算机科学》
CSCD
北大核心
2007年第7期146-149,共4页
由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘算法中常用的数据结构,最大频繁项集的挖掘过程也可以看作是集合枚举树的搜索过程。为缩小集合枚举树...
由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘算法中常用的数据结构,最大频繁项集的挖掘过程也可以看作是集合枚举树的搜索过程。为缩小集合枚举树的搜索空间,采用宽度优先和深度优先相结合的混合搜索策略,提出了一种新的最大频繁项集的挖掘算法Index-MaxMiner。该算法首先设计了索引数组这种新的数据结构,并给出了一个基于二进制位图技术的索引数组的计算方法。通过为每个频繁项增加包含索引,Index-MaxMiner利用一次宽度优先搜索得到了候选最大频繁项集,使集合枚举树的第一层结点个数大幅度减少。然后在候选最大频繁项集中通过深度优先搜索,得到全部最大频繁项集,从而实现了集合枚举树的跳跃式搜索,大大缩小了搜索空间。实验结果表明,该算法可有效提高最大频繁项集的挖掘效率。
展开更多
关键词
数据挖掘
关联规则
最大频繁项集
索引数组
集合枚举树
在线阅读
下载PDF
职称材料
题名
共现聚类分析的新方法:最大频繁项集挖掘
被引量:
22
1
作者
徐硕
乔晓东
朱礼军
张运良
薛春香
机构
中国科学技术信息研究所
南京理工大学经济管理学院
出处
《情报学报》
CSSCI
北大核心
2012年第2期143-150,共8页
基金
)本研究受“十二五”国家科技支撑计划项目“面向外文科技知识组织体系的大规模语义计算关键技术研究”(2011BAH10804)
中国科学技术信息研究所预研项目“科技文献深层领域主题监测及主题演化规律揭示”(YY-201129)
江苏省社会科学基金项目“数字报纸的自动标引研究”(09TQC011)和教育部人文社会科学研究项目“电子报纸内容深加工研究”(09YJC870014)资助.
文摘
针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大。从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行。然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,从而导致最后得到的共现聚类分析的结果可能存在一定的误导性。为克服该缺陷,本文从关联规则挖掘领域引入了一种新的共现聚类分析方法——最大频繁项集挖掘,它将传统共现分析法的三个阶段压缩为一个阶段,充分利用了可以利用的各种信息,克服了传统方法的缺陷。通过实验分析发现,设置合适的最小支持度阈值,基本上可以得到比较满意的结果。
关键词
共现分析
共词分析
聚类分析
最大频繁项集
层次聚类
Keywords
co-occurrence analysis ,co-word analysis, clustering analysis,
maximal
frequent
itemset
,hierarchical clustering
分类号
G254 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
基于向量的数据流滑动窗口中最大频繁项集挖掘
被引量:
7
2
作者
徐嘉莉
陈佳
胡庆
黄波
郭红霞
机构
成都大学电子信息工程学院
电子科技大学计算机科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2012年第3期837-840,共4页
基金
国家"863"计划资助项目(2007AA01Z443)
成都大学校基金资助项目(2010XJZ16)
文摘
针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算产生频繁项集,利用矩阵和数组存储辅助信息,深度优先搜索产生最大频繁项集时利用剪枝策略进一步减少挖掘时间;最后用索引链表存储挖掘结果以提高超集检测效率。理论分析和实验结果验证了该算法的有效性。
关键词
数据流
最大频繁项集
滑动窗口
向量
Keywords
data stream
maximal
frequent
itemset
s
sliding window
vector
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种挖掘最大频繁项集的深度优先算法
被引量:
20
3
作者
颜跃进
李舟军
陈火旺
机构
国防科学技术大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第3期462-467,共6页
基金
国家自然科学基金项目(9010402660073001)国家"八六三"高技术研究发展计划基金项目(2002AA144040)
文摘
最大频繁项集挖掘是许多数据挖掘应用中的重要问题.提出一种新的深度优先搜索最大频繁项集的算法.该算法采用位图数据格式,结合了流行的各种有效剪枝技术,并使用局部最大频繁项集来进行高效的超集存在判断,明显地加速了最大频繁项集的生成,从而降低了CPU时间.
关键词
最大频繁项集
深度优先搜索
位图
前瞻剪枝
Keywords
maximal
frequent
itemset
s
depth-first search
bitmap
look-ahead pruning
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于改进FP-tree的最大频繁项目集挖掘算法
被引量:
9
4
作者
马丽生
姚光顺
杨传健
机构
滁州学院计算机与信息工程学院
出处
《计算机应用》
CSCD
北大核心
2012年第2期326-329,共4页
基金
安徽省高校省级自然科学研究项目(KJ2010B421
KJ2011Z276)
+1 种基金
安徽省高校省级优秀青年人才基金项目(2010SQRL137
2011SQRL123)
文摘
针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存条件模式基的存储空间开销。在分析最大频繁项目集挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率。最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性。实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍。
关键词
频繁项目集
最大频繁项目集
条件模式基
项头表
剪枝策略
压缩策略
Keywords
frequent
itemset
maximal
frequent
itemset
conditional pattern base
item header table
pruning strategy
compression strategy
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于Iceberg概念格的最大频繁项集挖掘
被引量:
4
5
作者
薛安荣
王富强
李明
机构
江苏大学计算机科学与通信工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第7期35-37,共3页
基金
国家自然科学基金资助项目(60773049)
江苏大学高级人才启动基金资助项目(09JDG041)
文摘
最大频繁项集挖掘算法存在扫描数据集次数多和候选集规模过大等局限。基于Iceberg概念格模型,提出一种在Iceberg概念格上挖掘最大频繁项集的算法ICMFIA。该算法通过一次扫描数据集构建Iceberg概念格,利用Iceberg概念格中频繁概念之间良好的覆盖关系能快速计算出最大频繁项集所对应的最大频繁概念,所有最大频繁概念的内涵就是所求的最大频繁项集的集合。实验结果表明,该算法具有扫描数据集次数少和挖掘效率高的优点。
关键词
Iceberg概念格
频繁概念
最大频繁概念
最大频繁项集
Keywords
Iceberg concept lattice
frequent
concept
maximal
frequent
concept
maximal frequent itemset(mfi)
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种基于频繁模式树的最大频繁项目集挖掘算法
被引量:
6
6
作者
任永功
张亮
付玉
机构
辽宁师范大学计算机与信息技术学院
出处
《小型微型计算机系统》
CSCD
北大核心
2010年第2期317-321,共5页
基金
国家自然科学基金项目(60603047)资助
辽宁省科技计划项目(2008216014)资助
+1 种基金
大连市优秀青年科技人才基金项目(2008J23JH026)资助
教育部留学回国人员科研启动基金资助项目
文摘
目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位图建树的方法有效的减少了扫描数据库的次数,从而节省了CPU的执行时间.另外,此算法运用独特的最大频繁项目集判断策略,同时运用投影技术进行超集检测,提高了遍历的效率,实验结果表明该算法是快速有效的.
关键词
频繁项目集
最大频繁项目集
频繁模式树
深度优先搜索
Keywords
frequent
itemset
s
maximal
frequent
itemset
s
FP-tree
depth-first search
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于数据流挖掘技术的入侵检测模型与算法
被引量:
6
7
作者
毛伊敏
杨路明
陈志刚
刘立新
机构
中南大学信息科学与工程学院
江西理工大学应用科学学院
出处
《中南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第9期2720-2728,共9页
基金
国家自然科学基金面上资助项目(60873082)
文摘
针对目前基于数据流关联规则挖掘技术的入侵检测系统响应速度不够快和检测精度不够高的问题,提出一个基于数据流最大频繁模式的入侵检测系统模型MMFIID-DS;设计各种剪枝策略,挖掘经过训练学习后的正常数据集、异常数据集和当前检测数据流的最大频繁项集,建立系统的正常行为模式、异常行为模式和用户行为模式,达到极大缩小搜索空间的目的,提高系统的响应速度;结合误用检测和异常检测2种入侵检测方法进行实时在线检测入侵,提高系统的检测精度。理论与实验结果表明:MMFIID-DS入侵检测系统具有较好的性能。
关键词
数据流
最大频繁项集
异常检测
误用检测
Keywords
data streams
maximal
frequent
itemset
s
anomaly detection
misuse detection
分类号
TP399 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
频繁闭项目集挖掘算法研究
被引量:
10
8
作者
朱玉全
宋余庆
机构
江苏大学计算机科学与通信工程学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第7期1177-1183,共7页
基金
国家自然科学基金项目(60572112)
文摘
目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出事务数据库中所有的频繁项目集,并对其更新问题进行了研究,提出了一种相应的频繁闭项目集增量式更新算法UMFCIA,该算法将充分利用先前的挖掘结果来节省发现新的频繁闭项目集的时间开销.实验结果表明算法MFCIA是有效可行的.
关键词
频繁项目集
频繁闭项目集
最小频繁闭项目集
最大频繁闭项目集
增量式更新
Keywords
frequent
itemset
s
frequent
closed
itemset
s
minimum
frequent
closed
itemset
s
maximal
frequent
closed
itemset
s
incremental updating
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
在线挖掘数据流滑动窗口中最大频繁项集
被引量:
9
9
作者
敖富江
颜跃进
刘宝宏
黄柯棣
机构
国防科技大学机电工程与自动化学院
国防科技大学计算机学院
出处
《系统仿真学报》
CAS
CSCD
北大核心
2009年第4期1134-1139,共6页
基金
国家自然科学基金资助项目(60573057
60704038)
文摘
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术—"子集等价剪枝技术",有效缩小搜索空间的大小。基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+。FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集。仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快。
关键词
数据流
最大频繁项集
在线挖掘
滑动窗口
文法顺序FP-Tree
Keywords
data streams
maximal
frequent
itemset
s
online mining
sliding window
lexicographical-order FP-Tree
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于链表数组的最大频繁项集挖掘算法
被引量:
4
10
作者
刘应东
冷明伟
陈晓云
机构
兰州交通大学交通运输学院
上饶师范学院数学与计算机系
兰州大学信息科学与工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第6期89-90,93,共3页
基金
江西省教育厅青年科学基金资助项目(GJJ09616)
江西省教育厅科技课题基金资助项目(GJJ09377)
文摘
挖掘密集型数据集的全部频繁项集代价高昂,针对该问题,提出一种数据结构链表数组和基于链表数组的最大频繁项集快速生成算法。该方法使用链表数组为每个项目建立事务链表,并且链表的创建过程只需扫描数据库1次。使用深度优先搜索得到所有候选最大频繁项集,利用约束条件缩小搜索空间。使用标准数据集进行验证测试并与其他算法进行比较,实验结果表明,该算法具有较快的挖掘速度。
关键词
数据挖掘
最大频繁项集
链表数组
解空间
Keywords
data mining
maximal
frequent
itemset
s
(mfi
)
linked list array
solution space
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于FP-tree的最大频繁项目集挖掘算法
被引量:
4
11
作者
马丽生
邓辉文
齐逸
机构
滁州学院计算机科学与技术系
西南大学计算机与信息科学学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第2期385-388,共4页
文摘
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使用投影的方法对超集检测进行了优化,减少了项目匹配的次数。最后实验结果表明,该算法在性能上优于已有的同类算法。
关键词
数据挖掘
关联规则
频繁项目集
最大频繁项目集
频繁模式树
Keywords
data mining
association rules
frequent
itemset
s
maximal
frequent
itemset
s
frequent
pattern tree
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于FPMAX的最大频繁项目集挖掘改进算法
被引量:
9
12
作者
牛新征
佘堃
机构
电子科技大学计算机科学与工程学院
出处
《计算机科学》
CSCD
北大核心
2013年第12期223-228,共6页
基金
国家自然科学基金(61300192)
四川省科技厅科技支撑计划项目(2012GZ0061)
中央高校基本科研业务费电子科技大学项目(ZYGX2010J075)资助
文摘
挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree构造开销。而且在支持度较低时,FPMAX则会因用于超集检测的全局MFItree较为庞大而导致超集检测的性能下降。为此提出FPMAX的改进算法FPMAX-reduce,其通过采用基于事务共同后缀的前瞻剪枝策略来减少挖掘过程中的冗余递归过程。当递归过程中产生的新条件FP-tree规模较小时,FPMAX-reduce通过构造条件MFI-tree来减小后续超集检测遍历的开销。性能试验表明,FPMAX-reduce算法通过有效的前瞻剪枝,在稠密事务数据库以及低支持度的情况下至多可将递归过程减少至原算法的一半以下,进而有效地提高了FPMAX算法的效率。
关键词
频繁项目集
最大频繁项目集
FP-TREE
FPMAX
FP-GROWTH
Keywords
frequent
itemset
,
maximal
frequent
itemset
, FP-tree, FPMAX, FP-growth
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
数据流中基于滑动窗口的最大频繁项集挖掘算法
被引量:
4
13
作者
杨路明
刘立新
毛伊敏
谢东
机构
中南大学信息科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2010年第2期519-522,共4页
基金
湖南省教育厅科研资助项目(08B040)
文摘
挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和更新数据流上的数据;在深度优先搜索挖掘最大频繁项集时,除采用经典的剪枝策略外,还提出了与父等价原理相对应的子等价剪枝策略;最后将挖掘结果存储在索引链表中以提高超集检测效率,进一步减少挖掘最大频繁项集的时间。理论分析和实验结果证实了该算法在时间和空间上的有效性。
关键词
数据流
数据挖掘
最大频繁项集
滑动窗口
位图
Keywords
data stream
data mining
maximal
frequent
itemset
s
sliding window
bitmap
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种新的最大频繁项目集挖掘算法
被引量:
6
14
作者
马丽生
邓辉文
齐逸
机构
西南大学计算机与信息科学学院
出处
《计算机应用》
CSCD
北大核心
2006年第11期2670-2673,共4页
文摘
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上,提出了一种新的挖掘最大频繁项目集的算法,实验表明该算法在性能上优于已有的同类算法。
关键词
数据挖掘
最大频繁项目集
关联规则
Keywords
data mining
maximal
frequent
itemset
s
association roles
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于改进FP-tree的最大频繁项集挖掘算法
被引量:
14
15
作者
陈晨
鞠时光
机构
江苏大学计算机科学与通信工程学院
江苏财经职业技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第24期6236-6239,共4页
基金
国家自然科学基金项目(60773049)
江苏省自然科学基金项目(BK2006073)
文摘
现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖掘过程中既不需要进行超集检测也不需要递归的建立条件频繁模式树。算法分析和实验结果表明,该算法是一种有效、快速的算法。
关键词
数据挖掘
关联规则
最大频繁项集
超集检测
频繁模式树
Keywords
data mining
association rules
maximal
frequent
itemset
superset checking
frequent
pattern tree
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于多维数据流挖掘技术的入侵检测模型与算法
被引量:
25
16
作者
毛国君
宗东军
机构
北京工业大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第4期602-609,共8页
基金
国家自然科学基金项目(60873145)
国家"九七三"重点基础研究发展计划基金项目(2007CB311100)~~
文摘
网络访问数据有着数据流的高速、无穷达到的特点,所以利用传统多遍扫描数据库的挖掘技术来构建入侵检测模型是不可行的.针对网络访问数据流的特点,提出了一种基于多维数据流挖掘技术的入侵检测模型.此模型将传统的误用检测和异常检测两种入侵检测方法进行有机融合,因此能够克服目前广泛使用的误用检测方法无法检测新的攻击类型的缺点,并且也能够保持检测的高效性.网络访问数据记录的结构是复杂的,一个访问行为总是联系到许多属性,所以分析的难度很大.因此,引入多维频度等概念来解决网络数据流的模式表示和生成问题.同时,针对多维频度模式的特点,提出了一种新型数据结构MaxFP-Tree.在MaxFP-Tree的基础上,给出了一种高效的挖掘网络访问数据流的学习算法MaxFPinNDS.MaxFPinNDS采用衰减机制挖掘,可以快速地形成一个数据流的最近时期数据所隐含的最大频繁项目集.实验表明,设计的入侵检测模型是有效的.
关键词
多维数据流
入侵检测
异常检测
误用检测
最大频繁项集
Keywords
multi-dimension data stream
intrusion detection
anomaly detection
misuse detection
maximal
frequent
itemset
分类号
TP309 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
项约束先过滤的最大频繁项集挖掘算法
被引量:
8
17
作者
姚全珠
李如琼
王美君
机构
西安理工大学计算机科学与工程学院
出处
《计算机工程》
CAS
CSCD
2012年第4期73-75,共3页
文摘
在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数据库进行最大频繁相集的挖掘。实验结果表明,该算法快速有效,尤其在挖掘具有长模式的稠密数据库时优势明显。
关键词
关联规则
最大频繁项集
项约束
垂直数据格式
深度优先
稠密数据库
Keywords
association rule
maximal
frequent
itemset
item constraint
vertical data format
depth-first
dense database
分类号
TP311.12 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于图论的最大频繁项集挖掘
被引量:
3
18
作者
宋旭东
翟坤
刘晓冰
王亚伟
张通学
机构
大连交通大学软件学院
大连理工大学CIMS中心
出处
《计算机应用研究》
CSCD
北大核心
2007年第11期43-45,99,共4页
基金
国家自然科学基金资助项目(70471056)
文摘
利用有向项集图来存储事务数据库中有关频繁项集的信息,提出了有向项集图的三叉链表式存储结构和基于有向项集图的最大频繁项集挖掘算法。它不仅实现了事务数据库的一次扫描,减少了I/O代价,而且可以同时解决好稀疏数据库和稠密数据库的最大频繁项集挖掘问题。
关键词
数据挖掘
关联规则
最大频繁项集
有向项集图
三叉链表式存储结构
挖掘算法
Keywords
data mining
association rules
maximal
frequent
itemset
s
directed
itemset
s graph
trifurcate linked list storage structure
mining algorithm
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于有序FP-tree的最大频繁项集挖掘算法
被引量:
5
19
作者
李少华
吕志旺
车德勇
周宁
机构
东北电力大学能源与动力工程学院
东北电力大学信息工程学院
出处
《东北师大学报(自然科学版)》
CAS
CSCD
北大核心
2016年第2期65-69,共5页
基金
吉林省科技发展计划项目(20140307022GX)
文摘
通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析和实验数据发现MMFI算法比传统算法快速、合理.
关键词
数据挖掘
FP-TREE
最大频繁项集
关联规则
Keywords
data mining
FP-tree
maximal
frequent
itemset
s
association rules
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于索引数组与集合枚举树的最大频繁项集挖掘算法
被引量:
4
20
作者
宋威
杨炳儒
徐章艳
侯伟
机构
北京科技大学信息工程学院
出处
《计算机科学》
CSCD
北大核心
2007年第7期146-149,共4页
基金
国家科技成果重点推广项目计划(2003EC000001)资助
文摘
由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘算法中常用的数据结构,最大频繁项集的挖掘过程也可以看作是集合枚举树的搜索过程。为缩小集合枚举树的搜索空间,采用宽度优先和深度优先相结合的混合搜索策略,提出了一种新的最大频繁项集的挖掘算法Index-MaxMiner。该算法首先设计了索引数组这种新的数据结构,并给出了一个基于二进制位图技术的索引数组的计算方法。通过为每个频繁项增加包含索引,Index-MaxMiner利用一次宽度优先搜索得到了候选最大频繁项集,使集合枚举树的第一层结点个数大幅度减少。然后在候选最大频繁项集中通过深度优先搜索,得到全部最大频繁项集,从而实现了集合枚举树的跳跃式搜索,大大缩小了搜索空间。实验结果表明,该算法可有效提高最大频繁项集的挖掘效率。
关键词
数据挖掘
关联规则
最大频繁项集
索引数组
集合枚举树
Keywords
Data mining, Association rule,
maximal
frequent
itemset
, Index array, Set-enumeration tree
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
共现聚类分析的新方法:最大频繁项集挖掘
徐硕
乔晓东
朱礼军
张运良
薛春香
《情报学报》
CSSCI
北大核心
2012
22
在线阅读
下载PDF
职称材料
2
基于向量的数据流滑动窗口中最大频繁项集挖掘
徐嘉莉
陈佳
胡庆
黄波
郭红霞
《计算机应用研究》
CSCD
北大核心
2012
7
在线阅读
下载PDF
职称材料
3
一种挖掘最大频繁项集的深度优先算法
颜跃进
李舟军
陈火旺
《计算机研究与发展》
EI
CSCD
北大核心
2005
20
在线阅读
下载PDF
职称材料
4
基于改进FP-tree的最大频繁项目集挖掘算法
马丽生
姚光顺
杨传健
《计算机应用》
CSCD
北大核心
2012
9
在线阅读
下载PDF
职称材料
5
基于Iceberg概念格的最大频繁项集挖掘
薛安荣
王富强
李明
《计算机工程》
CAS
CSCD
北大核心
2011
4
在线阅读
下载PDF
职称材料
6
一种基于频繁模式树的最大频繁项目集挖掘算法
任永功
张亮
付玉
《小型微型计算机系统》
CSCD
北大核心
2010
6
在线阅读
下载PDF
职称材料
7
基于数据流挖掘技术的入侵检测模型与算法
毛伊敏
杨路明
陈志刚
刘立新
《中南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
6
在线阅读
下载PDF
职称材料
8
频繁闭项目集挖掘算法研究
朱玉全
宋余庆
《计算机研究与发展》
EI
CSCD
北大核心
2007
10
在线阅读
下载PDF
职称材料
9
在线挖掘数据流滑动窗口中最大频繁项集
敖富江
颜跃进
刘宝宏
黄柯棣
《系统仿真学报》
CAS
CSCD
北大核心
2009
9
在线阅读
下载PDF
职称材料
10
基于链表数组的最大频繁项集挖掘算法
刘应东
冷明伟
陈晓云
《计算机工程》
CAS
CSCD
北大核心
2010
4
在线阅读
下载PDF
职称材料
11
基于FP-tree的最大频繁项目集挖掘算法
马丽生
邓辉文
齐逸
《计算机工程与设计》
CSCD
北大核心
2008
4
在线阅读
下载PDF
职称材料
12
基于FPMAX的最大频繁项目集挖掘改进算法
牛新征
佘堃
《计算机科学》
CSCD
北大核心
2013
9
在线阅读
下载PDF
职称材料
13
数据流中基于滑动窗口的最大频繁项集挖掘算法
杨路明
刘立新
毛伊敏
谢东
《计算机应用研究》
CSCD
北大核心
2010
4
在线阅读
下载PDF
职称材料
14
一种新的最大频繁项目集挖掘算法
马丽生
邓辉文
齐逸
《计算机应用》
CSCD
北大核心
2006
6
在线阅读
下载PDF
职称材料
15
基于改进FP-tree的最大频繁项集挖掘算法
陈晨
鞠时光
《计算机工程与设计》
CSCD
北大核心
2008
14
在线阅读
下载PDF
职称材料
16
基于多维数据流挖掘技术的入侵检测模型与算法
毛国君
宗东军
《计算机研究与发展》
EI
CSCD
北大核心
2009
25
在线阅读
下载PDF
职称材料
17
项约束先过滤的最大频繁项集挖掘算法
姚全珠
李如琼
王美君
《计算机工程》
CAS
CSCD
2012
8
在线阅读
下载PDF
职称材料
18
基于图论的最大频繁项集挖掘
宋旭东
翟坤
刘晓冰
王亚伟
张通学
《计算机应用研究》
CSCD
北大核心
2007
3
在线阅读
下载PDF
职称材料
19
基于有序FP-tree的最大频繁项集挖掘算法
李少华
吕志旺
车德勇
周宁
《东北师大学报(自然科学版)》
CAS
CSCD
北大核心
2016
5
在线阅读
下载PDF
职称材料
20
基于索引数组与集合枚举树的最大频繁项集挖掘算法
宋威
杨炳儒
徐章艳
侯伟
《计算机科学》
CSCD
北大核心
2007
4
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
4
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部