期刊文献+
共找到65篇文章
< 1 2 4 >
每页显示 20 50 100
共现聚类分析的新方法:最大频繁项集挖掘 被引量:22
1
作者 徐硕 乔晓东 +2 位作者 朱礼军 张运良 薛春香 《情报学报》 CSSCI 北大核心 2012年第2期143-150,共8页
针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大。从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行。然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,... 针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大。从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行。然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,从而导致最后得到的共现聚类分析的结果可能存在一定的误导性。为克服该缺陷,本文从关联规则挖掘领域引入了一种新的共现聚类分析方法——最大频繁项集挖掘,它将传统共现分析法的三个阶段压缩为一个阶段,充分利用了可以利用的各种信息,克服了传统方法的缺陷。通过实验分析发现,设置合适的最小支持度阈值,基本上可以得到比较满意的结果。 展开更多
关键词 共现分析 共词分析 聚类分析 最大频繁项集 层次聚类
在线阅读 下载PDF
基于向量的数据流滑动窗口中最大频繁项集挖掘 被引量:7
2
作者 徐嘉莉 陈佳 +2 位作者 胡庆 黄波 郭红霞 《计算机应用研究》 CSCD 北大核心 2012年第3期837-840,共4页
针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算产生频繁项集,利用矩... 针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算产生频繁项集,利用矩阵和数组存储辅助信息,深度优先搜索产生最大频繁项集时利用剪枝策略进一步减少挖掘时间;最后用索引链表存储挖掘结果以提高超集检测效率。理论分析和实验结果验证了该算法的有效性。 展开更多
关键词 数据流 最大频繁项集 滑动窗口 向量
在线阅读 下载PDF
一种挖掘最大频繁项集的深度优先算法 被引量:20
3
作者 颜跃进 李舟军 陈火旺 《计算机研究与发展》 EI CSCD 北大核心 2005年第3期462-467,共6页
最大频繁项集挖掘是许多数据挖掘应用中的重要问题.提出一种新的深度优先搜索最大频繁项集的算法.该算法采用位图数据格式,结合了流行的各种有效剪枝技术,并使用局部最大频繁项集来进行高效的超集存在判断,明显地加速了最大频繁项集的生... 最大频繁项集挖掘是许多数据挖掘应用中的重要问题.提出一种新的深度优先搜索最大频繁项集的算法.该算法采用位图数据格式,结合了流行的各种有效剪枝技术,并使用局部最大频繁项集来进行高效的超集存在判断,明显地加速了最大频繁项集的生成,从而降低了CPU时间. 展开更多
关键词 最大频繁项集 深度优先搜索 位图 前瞻剪枝
在线阅读 下载PDF
基于改进FP-tree的最大频繁项目集挖掘算法 被引量:9
4
作者 马丽生 姚光顺 杨传健 《计算机应用》 CSCD 北大核心 2012年第2期326-329,共4页
针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存... 针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存条件模式基的存储空间开销。在分析最大频繁项目集挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率。最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性。实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍。 展开更多
关键词 频繁项目集 最大频繁项目集 条件模式基 项头表 剪枝策略 压缩策略
在线阅读 下载PDF
基于Iceberg概念格的最大频繁项集挖掘 被引量:4
5
作者 薛安荣 王富强 李明 《计算机工程》 CAS CSCD 北大核心 2011年第7期35-37,共3页
最大频繁项集挖掘算法存在扫描数据集次数多和候选集规模过大等局限。基于Iceberg概念格模型,提出一种在Iceberg概念格上挖掘最大频繁项集的算法ICMFIA。该算法通过一次扫描数据集构建Iceberg概念格,利用Iceberg概念格中频繁概念之间良... 最大频繁项集挖掘算法存在扫描数据集次数多和候选集规模过大等局限。基于Iceberg概念格模型,提出一种在Iceberg概念格上挖掘最大频繁项集的算法ICMFIA。该算法通过一次扫描数据集构建Iceberg概念格,利用Iceberg概念格中频繁概念之间良好的覆盖关系能快速计算出最大频繁项集所对应的最大频繁概念,所有最大频繁概念的内涵就是所求的最大频繁项集的集合。实验结果表明,该算法具有扫描数据集次数少和挖掘效率高的优点。 展开更多
关键词 Iceberg概念格 频繁概念 最大频繁概念 最大频繁项集
在线阅读 下载PDF
一种基于频繁模式树的最大频繁项目集挖掘算法 被引量:6
6
作者 任永功 张亮 付玉 《小型微型计算机系统》 CSCD 北大核心 2010年第2期317-321,共5页
目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位... 目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位图建树的方法有效的减少了扫描数据库的次数,从而节省了CPU的执行时间.另外,此算法运用独特的最大频繁项目集判断策略,同时运用投影技术进行超集检测,提高了遍历的效率,实验结果表明该算法是快速有效的. 展开更多
关键词 频繁项目集 最大频繁项目集 频繁模式树 深度优先搜索
在线阅读 下载PDF
基于数据流挖掘技术的入侵检测模型与算法 被引量:6
7
作者 毛伊敏 杨路明 +1 位作者 陈志刚 刘立新 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第9期2720-2728,共9页
针对目前基于数据流关联规则挖掘技术的入侵检测系统响应速度不够快和检测精度不够高的问题,提出一个基于数据流最大频繁模式的入侵检测系统模型MMFIID-DS;设计各种剪枝策略,挖掘经过训练学习后的正常数据集、异常数据集和当前检测数据... 针对目前基于数据流关联规则挖掘技术的入侵检测系统响应速度不够快和检测精度不够高的问题,提出一个基于数据流最大频繁模式的入侵检测系统模型MMFIID-DS;设计各种剪枝策略,挖掘经过训练学习后的正常数据集、异常数据集和当前检测数据流的最大频繁项集,建立系统的正常行为模式、异常行为模式和用户行为模式,达到极大缩小搜索空间的目的,提高系统的响应速度;结合误用检测和异常检测2种入侵检测方法进行实时在线检测入侵,提高系统的检测精度。理论与实验结果表明:MMFIID-DS入侵检测系统具有较好的性能。 展开更多
关键词 数据流 最大频繁项集 异常检测 误用检测
在线阅读 下载PDF
频繁闭项目集挖掘算法研究 被引量:10
8
作者 朱玉全 宋余庆 《计算机研究与发展》 EI CSCD 北大核心 2007年第7期1177-1183,共7页
目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出... 目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出事务数据库中所有的频繁项目集,并对其更新问题进行了研究,提出了一种相应的频繁闭项目集增量式更新算法UMFCIA,该算法将充分利用先前的挖掘结果来节省发现新的频繁闭项目集的时间开销.实验结果表明算法MFCIA是有效可行的. 展开更多
关键词 频繁项目集 频繁闭项目集 最小频繁闭项目集 最大频繁闭项目集 增量式更新
在线阅读 下载PDF
在线挖掘数据流滑动窗口中最大频繁项集 被引量:9
9
作者 敖富江 颜跃进 +1 位作者 刘宝宏 黄柯棣 《系统仿真学报》 CAS CSCD 北大核心 2009年第4期1134-1139,共6页
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪... 相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术—"子集等价剪枝技术",有效缩小搜索空间的大小。基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+。FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集。仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快。 展开更多
关键词 数据流 最大频繁项集 在线挖掘 滑动窗口 文法顺序FP-Tree
在线阅读 下载PDF
基于链表数组的最大频繁项集挖掘算法 被引量:4
10
作者 刘应东 冷明伟 陈晓云 《计算机工程》 CAS CSCD 北大核心 2010年第6期89-90,93,共3页
挖掘密集型数据集的全部频繁项集代价高昂,针对该问题,提出一种数据结构链表数组和基于链表数组的最大频繁项集快速生成算法。该方法使用链表数组为每个项目建立事务链表,并且链表的创建过程只需扫描数据库1次。使用深度优先搜索得到所... 挖掘密集型数据集的全部频繁项集代价高昂,针对该问题,提出一种数据结构链表数组和基于链表数组的最大频繁项集快速生成算法。该方法使用链表数组为每个项目建立事务链表,并且链表的创建过程只需扫描数据库1次。使用深度优先搜索得到所有候选最大频繁项集,利用约束条件缩小搜索空间。使用标准数据集进行验证测试并与其他算法进行比较,实验结果表明,该算法具有较快的挖掘速度。 展开更多
关键词 数据挖掘 最大频繁项集 链表数组 解空间
在线阅读 下载PDF
基于FP-tree的最大频繁项目集挖掘算法 被引量:4
11
作者 马丽生 邓辉文 齐逸 《计算机工程与设计》 CSCD 北大核心 2008年第2期385-388,共4页
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使... 最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使用投影的方法对超集检测进行了优化,减少了项目匹配的次数。最后实验结果表明,该算法在性能上优于已有的同类算法。 展开更多
关键词 数据挖掘 关联规则 频繁项目集 最大频繁项目集 频繁模式树
在线阅读 下载PDF
基于FPMAX的最大频繁项目集挖掘改进算法 被引量:9
12
作者 牛新征 佘堃 《计算机科学》 CSCD 北大核心 2013年第12期223-228,共6页
挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree... 挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree构造开销。而且在支持度较低时,FPMAX则会因用于超集检测的全局MFItree较为庞大而导致超集检测的性能下降。为此提出FPMAX的改进算法FPMAX-reduce,其通过采用基于事务共同后缀的前瞻剪枝策略来减少挖掘过程中的冗余递归过程。当递归过程中产生的新条件FP-tree规模较小时,FPMAX-reduce通过构造条件MFI-tree来减小后续超集检测遍历的开销。性能试验表明,FPMAX-reduce算法通过有效的前瞻剪枝,在稠密事务数据库以及低支持度的情况下至多可将递归过程减少至原算法的一半以下,进而有效地提高了FPMAX算法的效率。 展开更多
关键词 频繁项目集 最大频繁项目集 FP-TREE FPMAX FP-GROWTH
在线阅读 下载PDF
数据流中基于滑动窗口的最大频繁项集挖掘算法 被引量:4
13
作者 杨路明 刘立新 +1 位作者 毛伊敏 谢东 《计算机应用研究》 CSCD 北大核心 2010年第2期519-522,共4页
挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和... 挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和更新数据流上的数据;在深度优先搜索挖掘最大频繁项集时,除采用经典的剪枝策略外,还提出了与父等价原理相对应的子等价剪枝策略;最后将挖掘结果存储在索引链表中以提高超集检测效率,进一步减少挖掘最大频繁项集的时间。理论分析和实验结果证实了该算法在时间和空间上的有效性。 展开更多
关键词 数据流 数据挖掘 最大频繁项集 滑动窗口 位图
在线阅读 下载PDF
一种新的最大频繁项目集挖掘算法 被引量:6
14
作者 马丽生 邓辉文 齐逸 《计算机应用》 CSCD 北大核心 2006年第11期2670-2673,共4页
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上,提出了一种新的挖掘最大频繁项目集的算法,实验表明该算法在性能上优于已有的同类算法。
关键词 数据挖掘 最大频繁项目集 关联规则
在线阅读 下载PDF
基于改进FP-tree的最大频繁项集挖掘算法 被引量:14
15
作者 陈晨 鞠时光 《计算机工程与设计》 CSCD 北大核心 2008年第24期6236-6239,共4页
现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖... 现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖掘过程中既不需要进行超集检测也不需要递归的建立条件频繁模式树。算法分析和实验结果表明,该算法是一种有效、快速的算法。 展开更多
关键词 数据挖掘 关联规则 最大频繁项集 超集检测 频繁模式树
在线阅读 下载PDF
基于多维数据流挖掘技术的入侵检测模型与算法 被引量:25
16
作者 毛国君 宗东军 《计算机研究与发展》 EI CSCD 北大核心 2009年第4期602-609,共8页
网络访问数据有着数据流的高速、无穷达到的特点,所以利用传统多遍扫描数据库的挖掘技术来构建入侵检测模型是不可行的.针对网络访问数据流的特点,提出了一种基于多维数据流挖掘技术的入侵检测模型.此模型将传统的误用检测和异常检测两... 网络访问数据有着数据流的高速、无穷达到的特点,所以利用传统多遍扫描数据库的挖掘技术来构建入侵检测模型是不可行的.针对网络访问数据流的特点,提出了一种基于多维数据流挖掘技术的入侵检测模型.此模型将传统的误用检测和异常检测两种入侵检测方法进行有机融合,因此能够克服目前广泛使用的误用检测方法无法检测新的攻击类型的缺点,并且也能够保持检测的高效性.网络访问数据记录的结构是复杂的,一个访问行为总是联系到许多属性,所以分析的难度很大.因此,引入多维频度等概念来解决网络数据流的模式表示和生成问题.同时,针对多维频度模式的特点,提出了一种新型数据结构MaxFP-Tree.在MaxFP-Tree的基础上,给出了一种高效的挖掘网络访问数据流的学习算法MaxFPinNDS.MaxFPinNDS采用衰减机制挖掘,可以快速地形成一个数据流的最近时期数据所隐含的最大频繁项目集.实验表明,设计的入侵检测模型是有效的. 展开更多
关键词 多维数据流 入侵检测 异常检测 误用检测 最大频繁项集
在线阅读 下载PDF
项约束先过滤的最大频繁项集挖掘算法 被引量:8
17
作者 姚全珠 李如琼 王美君 《计算机工程》 CAS CSCD 2012年第4期73-75,共3页
在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数... 在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数据库进行最大频繁相集的挖掘。实验结果表明,该算法快速有效,尤其在挖掘具有长模式的稠密数据库时优势明显。 展开更多
关键词 关联规则 最大频繁项集 项约束 垂直数据格式 深度优先 稠密数据库
在线阅读 下载PDF
基于图论的最大频繁项集挖掘 被引量:3
18
作者 宋旭东 翟坤 +2 位作者 刘晓冰 王亚伟 张通学 《计算机应用研究》 CSCD 北大核心 2007年第11期43-45,99,共4页
利用有向项集图来存储事务数据库中有关频繁项集的信息,提出了有向项集图的三叉链表式存储结构和基于有向项集图的最大频繁项集挖掘算法。它不仅实现了事务数据库的一次扫描,减少了I/O代价,而且可以同时解决好稀疏数据库和稠密数据库的... 利用有向项集图来存储事务数据库中有关频繁项集的信息,提出了有向项集图的三叉链表式存储结构和基于有向项集图的最大频繁项集挖掘算法。它不仅实现了事务数据库的一次扫描,减少了I/O代价,而且可以同时解决好稀疏数据库和稠密数据库的最大频繁项集挖掘问题。 展开更多
关键词 数据挖掘 关联规则 最大频繁项集 有向项集图 三叉链表式存储结构 挖掘算法
在线阅读 下载PDF
基于有序FP-tree的最大频繁项集挖掘算法 被引量:5
19
作者 李少华 吕志旺 +1 位作者 车德勇 周宁 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期65-69,共5页
通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析... 通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析和实验数据发现MMFI算法比传统算法快速、合理. 展开更多
关键词 数据挖掘 FP-TREE 最大频繁项集 关联规则
在线阅读 下载PDF
基于索引数组与集合枚举树的最大频繁项集挖掘算法 被引量:4
20
作者 宋威 杨炳儒 +1 位作者 徐章艳 侯伟 《计算机科学》 CSCD 北大核心 2007年第7期146-149,共4页
由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘算法中常用的数据结构,最大频繁项集的挖掘过程也可以看作是集合枚举树的搜索过程。为缩小集合枚举树... 由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘算法中常用的数据结构,最大频繁项集的挖掘过程也可以看作是集合枚举树的搜索过程。为缩小集合枚举树的搜索空间,采用宽度优先和深度优先相结合的混合搜索策略,提出了一种新的最大频繁项集的挖掘算法Index-MaxMiner。该算法首先设计了索引数组这种新的数据结构,并给出了一个基于二进制位图技术的索引数组的计算方法。通过为每个频繁项增加包含索引,Index-MaxMiner利用一次宽度优先搜索得到了候选最大频繁项集,使集合枚举树的第一层结点个数大幅度减少。然后在候选最大频繁项集中通过深度优先搜索,得到全部最大频繁项集,从而实现了集合枚举树的跳跃式搜索,大大缩小了搜索空间。实验结果表明,该算法可有效提高最大频繁项集的挖掘效率。 展开更多
关键词 数据挖掘 关联规则 最大频繁项集 索引数组 集合枚举树
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部