期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
E-FP:一种挖掘多层高维频繁序列的高效算法
1
作者 何光辉 王蔚韬 +1 位作者 郭平 蒋渝 《计算机科学》 CSCD 北大核心 2002年第11期76-78,共3页
The classic sequential frequent pattern mining algorithms are based on a uniform mining support, either miss interesting patterns of low support or suffer from the bottleneck of pattern generation. In this thesis, we ... The classic sequential frequent pattern mining algorithms are based on a uniform mining support, either miss interesting patterns of low support or suffer from the bottleneck of pattern generation. In this thesis, we extend FP-growth to attack the problem of multi-level multi-dimensional sequential frequent pattern mining. The experimental result shows that our E-FP is more flexible at capturing desired knowledge than previous studies. 展开更多
关键词 数据挖掘 数据库 多层高维频繁序列挖掘算法 E-FP算法
在线阅读 下载PDF
网络告警序列中的频繁情景规则挖掘算法 被引量:9
2
作者 刘康平 李增智 《小型微型计算机系统》 CSCD 北大核心 2003年第5期891-894,共4页
网络告警序列中隐含着丰富的关于网络自身行为特征的模式知识,对其进行有效挖掘和利用将显著提高网络故障管理智能化程度.本文研究网络告警序列中的知识发现问题,提出并实现了一种基于滑动窗口的情景规则挖掘算法.
关键词 计算机网络 网络管理 网络告警序列 频繁情景规则挖掘算法 数据挖掘
在线阅读 下载PDF
基于频繁序列挖掘的预取算法研究与实现 被引量:4
3
作者 王芳 王培群 朱春节 《计算机研究与发展》 EI CSCD 北大核心 2016年第2期443-448,共6页
预取作为一种提升存储系统性能的有效手段被广泛使用,然而传统的预取算法大多基于顺序性访问特征的探测,这使得它们在非顺序数据访问环境下很难奏效,甚至可能因为预取准确率较低而对存储系统的性能带来负面影响.而基于频繁序列挖掘的预... 预取作为一种提升存储系统性能的有效手段被广泛使用,然而传统的预取算法大多基于顺序性访问特征的探测,这使得它们在非顺序数据访问环境下很难奏效,甚至可能因为预取准确率较低而对存储系统的性能带来负面影响.而基于频繁序列挖掘的预取算法则能够通过分析数据的访问行为找出潜在规律,从而能在非顺序访问模式下也取得一定的性能提升.同时,为了应对某些缓存受限的应用场景,如嵌入式系统,预取算法通过提高分析的准确率减少预取可能对缓存带来的不利影响.新提出的预取算法基于频繁序列挖掘技术,并使用字典树组织预取规则,通过多步匹配和子树分割技术精细地控制规则的使用,提升预取的准确率,从而使得预取算法能够有效提升存储系统的性能. 展开更多
关键词 频繁序列挖掘 预取算法 字典树 多步匹配 子树分割
在线阅读 下载PDF
多维序列模式挖掘算法 被引量:2
4
作者 李广原 杨炳儒 +1 位作者 刘永彬 刘英华 《计算机工程与设计》 CSCD 北大核心 2011年第7期2377-2380,共4页
提出一种基于最大频繁模式、模式相似与属性描述相结合的多维序列模式挖掘算法MSP,该算法包括3个步骤:挖掘数据集中的最大频繁模式,每个频繁模式成为一个模式类;比较数据中各序列项序列与各模式类的包含与相似关系;按照一定的规则抽取... 提出一种基于最大频繁模式、模式相似与属性描述相结合的多维序列模式挖掘算法MSP,该算法包括3个步骤:挖掘数据集中的最大频繁模式,每个频繁模式成为一个模式类;比较数据中各序列项序列与各模式类的包含与相似关系;按照一定的规则抽取与各模式类相关的属性,给出以属性为前件、模式类为后件的多维序列规则为形式的多维序列模式挖掘结果。对算法进行分析表明,该算法是有效的,且具有较好的可扩展性。 展开更多
关键词 数据挖掘 序列模式 序列模式 最大频繁模式 相似度
在线阅读 下载PDF
基于多维频繁序列挖掘的攻击轨迹识别方法 被引量:3
5
作者 李洪成 吴晓平 俞艺涵 《海军工程大学学报》 CAS 北大核心 2018年第1期40-45,共6页
针对传统攻击轨迹识别方法处理时序数据效率较低且无法全面反映告警各维属性变化规律的不足,首先基于前缀-投影思想,设计了不产生候选集的频繁告警属性序列挖掘算法;然后,利用时间窗分割全局攻击类型序列和全局攻击目标序列,挖掘出网络... 针对传统攻击轨迹识别方法处理时序数据效率较低且无法全面反映告警各维属性变化规律的不足,首先基于前缀-投影思想,设计了不产生候选集的频繁告警属性序列挖掘算法;然后,利用时间窗分割全局攻击类型序列和全局攻击目标序列,挖掘出网络中频繁攻击行为序列和频繁攻击目标序列,并利用目的IP分割全局攻击类型序列,挖掘出针对单个主机的组合攻击模式,进而全面识别网络和主机上的攻击轨迹;最后,在典型分布式拒绝服务攻击场景LLDoS1.0inside的流量数据集中验证了以上方法的有效性。 展开更多
关键词 入侵检测 攻击轨迹识别 频繁序列挖掘 关联 序列分割
在线阅读 下载PDF
基于AC算法的比特流频繁序列挖掘 被引量:1
6
作者 雷东 王韬 马云飞 《计算机科学》 CSCD 北大核心 2017年第1期128-133,共6页
为解决比特流频繁序列挖掘效率不高以及易受用户数据影响而导致准确率低的问题,首先从理论上论证了短频繁序列挖掘存在的局限性,根据不同长度的频繁序列挖掘时存在的特点,将其分为长频繁序列与短频繁序列,提出比特流协议头部字段定位算... 为解决比特流频繁序列挖掘效率不高以及易受用户数据影响而导致准确率低的问题,首先从理论上论证了短频繁序列挖掘存在的局限性,根据不同长度的频繁序列挖掘时存在的特点,将其分为长频繁序列与短频繁序列,提出比特流协议头部字段定位算法;基于AC多模式匹配算法分别针对长、短频繁序列挖掘的不同特点,提出了相应的挖掘方法,提高了挖掘结果的准确性。最后通过实验验证了所提算法的有效性。 展开更多
关键词 比特流 AC算法 频繁序列挖掘 频繁序列挖掘
在线阅读 下载PDF
基于最大频繁项目序列集挖掘DMFIA算法的改进 被引量:1
7
作者 宋卫林 徐惠民 《计算机工程与设计》 CSCD 北大核心 2007年第7期1493-1496,1500,共5页
为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进... 为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进的DMFIA算法,并在原算法的基础上有了较大的改进。为了验证算法的正确性,运用Ora-cle9i数据库的PL/SQL进行了相应的验证。实验结果证实了改进算法的有效性和实用性,并具有较好的创新性和理论价值。 展开更多
关键词 数据挖掘 关联规则 序列模式 DMFIA算法 最大频繁项目集 最大频繁项目序列
在线阅读 下载PDF
一种高效的并行挖掘频繁序列的算法
8
作者 佘春东 吴跃 +2 位作者 孙世新 李磊 车著明 《计算机科学》 CSCD 北大核心 2004年第10期203-205,共3页
序列模式发现在数据挖掘领域中的地位越来越重要,本文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,给出了其数据并行模式和任务并行模式,接着进行了算法的复杂性分析,我们的实验证明这些算法都能获得较好的加速比,而且任... 序列模式发现在数据挖掘领域中的地位越来越重要,本文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,给出了其数据并行模式和任务并行模式,接着进行了算法的复杂性分析,我们的实验证明这些算法都能获得较好的加速比,而且任务并行模式具有更好的可扩展性。 展开更多
关键词 频繁序列 并行挖掘 算法 并行模式 序列模式 数据并行 数据挖掘 任务 地位 复杂性分析
在线阅读 下载PDF
基于频繁序列挖掘的文件系统缓存算法设计 被引量:2
9
作者 杜科星 张小芳 +1 位作者 张晓 赵晓南 《计算机应用研究》 CSCD 北大核心 2022年第3期831-835,共5页
传统缓存算法存在命中率低、交换率高等问题,且现有缓存算法在分布式大数据存储系统中并不适用,为此提出了一种基于频繁序列挖掘的自适应缓存策略。该方法使用数据挖掘算法挖掘历史访问窗口内的频繁序列,将频繁序列模糊合并后构建匹配... 传统缓存算法存在命中率低、交换率高等问题,且现有缓存算法在分布式大数据存储系统中并不适用,为此提出了一种基于频繁序列挖掘的自适应缓存策略。该方法使用数据挖掘算法挖掘历史访问窗口内的频繁序列,将频繁序列模糊合并后构建匹配模式集合以供查询。当新的访问来临时,将固定访问长度内的子序列与匹配模式集合进行匹配,然后根据匹配结果预取数据,同时结合修改后的S4LRU(4-segmented least recently used)数据结构进行缓存数据换出。在公开的大数据处理trace集上进行了仿真实验,实验结果表明,在不同的缓存大小下,提出算法与现有典型缓存算法相比,平均命中率提高了0.327倍,平均交换率降低了0.33倍,同时具有低开销和高时效的特点。此结果表明,该方法较传统替换算法而言是一个更为有效的缓存策略。 展开更多
关键词 缓存算法 频繁序列挖掘 分布文件系统优化
在线阅读 下载PDF
非同步多时间序列中频繁模式的发现算法 被引量:8
10
作者 李斌 谭立湘 +2 位作者 解光军 李海鹰 庄镇泉 《软件学报》 EI CSCD 北大核心 2002年第3期410-416,共7页
从多个时间序列中发现频繁模式在实际应用中具有非常重要的价值.已知文献所提供的方法均假设多时间序列是同步的,但是,在现实世界中,这一条件并不总能满足,许多情况下它们是非同步的.提出了一个从非同步多时间序列中发现频繁模式的算法... 从多个时间序列中发现频繁模式在实际应用中具有非常重要的价值.已知文献所提供的方法均假设多时间序列是同步的,但是,在现实世界中,这一条件并不总能满足,许多情况下它们是非同步的.提出了一个从非同步多时间序列中发现频繁模式的算法.该算法首先利用线性化分段表示法和矢量形态聚类实现时间序列的特征分割与符号化转换,然后通过将Agrawal关联模式发现算法的核心思想与时间序列最短实现表示方法相结合,实现了非同步多时间序列中多种结构频繁模式的发掘.与已有算法相比,该算法更简单、更灵活,并且不要求序列严格同步.实验结果证明了该算法的有效性. 展开更多
关键词 数据挖掘 频繁模式 符号化 多同步多时间序列 算法 数据库
在线阅读 下载PDF
基于项目序列集操作的关联规则挖掘算法 被引量:37
11
作者 毛国君 刘椿年 《计算机学报》 EI CSCD 北大核心 2002年第4期417-422,共6页
最大频繁项目序列集的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探... 最大频繁项目序列集的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能 .该文首先给出项目序列集和它的基本操作的严格定义 ,然后在此基础上提出一个称为 ISS- DM的最大频繁项目序列集生成算法 .ISS- DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列集的 . 展开更多
关键词 数据挖掘 关联规则 项目序列 频繁项目序列 算法 数据库
在线阅读 下载PDF
序列模式的一种挖掘算法 被引量:4
12
作者 陈金玉 樊兴华 曹长修 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第1期92-94,共3页
序列模式挖掘是数据挖掘中最重要的研究课题之一。基于记录数据库频繁集中各元素Ctid表的基础上 ,提出了序列模式挖掘的一种算法ISP。该算法考虑了项目集与序列之间的关系 ,利用时序连接法 ,采用不同的构造法 ,构造出相对应的候选集 ,... 序列模式挖掘是数据挖掘中最重要的研究课题之一。基于记录数据库频繁集中各元素Ctid表的基础上 ,提出了序列模式挖掘的一种算法ISP。该算法考虑了项目集与序列之间的关系 ,利用时序连接法 ,采用不同的构造法 ,构造出相对应的候选集 ,从而计算出频繁集。由于算法ISP能够利用中间的挖掘结果 ,故提高了挖掘过程的效率。 展开更多
关键词 序列模式 挖掘算法ISP 频繁 候选集 数据挖掘
在线阅读 下载PDF
改进的序列模式挖掘算法在交叉营销中的应用 被引量:3
13
作者 赵华 宋顺林 《计算机工程与设计》 CSCD 北大核心 2007年第5期1219-1222,共4页
在企业营销活动中,对现有客户进行有针对性的交叉营销活动,可以节省开支,增加企业利润,将引入多维属性和多种约束的改进序列模式算法用于构建交叉营销模型,提出了增加老客户价值、进行交叉营销的合理可行的数据挖掘步骤,用以指导企业的... 在企业营销活动中,对现有客户进行有针对性的交叉营销活动,可以节省开支,增加企业利润,将引入多维属性和多种约束的改进序列模式算法用于构建交叉营销模型,提出了增加老客户价值、进行交叉营销的合理可行的数据挖掘步骤,用以指导企业的营销决策。试验结果表明,该方法有着很好的理论价值和应用价值。 展开更多
关键词 序列模式挖掘算法 属性 交叉营销 约束 模式
在线阅读 下载PDF
一种序列模式的概念及挖掘算法 被引量:2
14
作者 李宏 陈松乔 《中南工业大学学报》 CSCD 北大核心 2001年第4期425-427,共3页
介绍了一种时间序列模式的形式和概念 ,讨论了其相关的挖掘算法 .将时间序列模式既用于具有时间关系的购买行为的分析 ,以揭示购买行为后面一种序列关系信息 ,又用于其他有时间关联的事件分析 .挖掘算法由以下几部分构成 :建立频繁物品... 介绍了一种时间序列模式的形式和概念 ,讨论了其相关的挖掘算法 .将时间序列模式既用于具有时间关系的购买行为的分析 ,以揭示购买行为后面一种序列关系信息 ,又用于其他有时间关联的事件分析 .挖掘算法由以下几部分构成 :建立频繁物品集 ,进行数据处理和转换 ,并生成候选子序列 ,通过验证后 ,得到长度为 2 ,3 ,…的序列集合 ,从中选出独立最大序列即为所求 .通过实例指出了该算法和传统的Aprioriall算法的不同之处 .结果表明 ,这种序列模式在网络通信。 展开更多
关键词 时间序列模式 挖掘算法 频繁物品集 独立最大序列 数据库
在线阅读 下载PDF
一种基于投影树的并行序列挖掘算法
15
作者 佘春东 范植华 +2 位作者 孙世新 胡四泉 车著明 《计算机工程与应用》 CSCD 北大核心 2004年第14期4-5,56,共3页
在许多科学和商业领域,序列模式的发现技术发挥着越来越重要的作用,然而人们对于高效的基于投影树算法的并行模式关注较少。该文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,提出了分布式存储并行序列挖掘算法,并对算法... 在许多科学和商业领域,序列模式的发现技术发挥着越来越重要的作用,然而人们对于高效的基于投影树算法的并行模式关注较少。该文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,提出了分布式存储并行序列挖掘算法,并对算法的性能进行了详细的分析。 展开更多
关键词 数据挖掘 投影算法 并行处理 频繁序列模式
在线阅读 下载PDF
渐进式序列模式挖掘算法IMSP分析
16
作者 陈金玉 曹长修 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第1期75-79,共5页
序列模式挖掘是数据挖掘中最重要的研究课题之一。基于记录频繁集各元素的Ctid表的基础上 ,有研究者提出了一种渐进式序列模式挖掘算法IMSP ,目的是当支持度保持不变 ,而数据库变化不大时 ,如何利用前次的结果和中间结果 ,以加速本次挖... 序列模式挖掘是数据挖掘中最重要的研究课题之一。基于记录频繁集各元素的Ctid表的基础上 ,有研究者提出了一种渐进式序列模式挖掘算法IMSP ,目的是当支持度保持不变 ,而数据库变化不大时 ,如何利用前次的结果和中间结果 ,以加速本次挖掘过程。笔者深入分析了算法IMSP结构 ,指出该算法在时间复杂度、挖掘规则的完备性上的不足 。 展开更多
关键词 序列模式 IMSP 频繁 数据挖掘 渐进式算法 分析 序列模式挖掘
在线阅读 下载PDF
序列模式数据挖掘算法的并行化研究
17
作者 王宗江 《计算机科学》 CSCD 北大核心 2008年第8期249-251,257,共4页
序列模式在许多领域都有着重要的应用,大量的数据和模式需要高效的、可扩展的并行算法。针对目前序列模式挖掘算法存在的普遍问题,在对串行序列模式数据挖掘算法研究的基础上,本文提出了一种并行的序列模式数据挖掘算法。通过理论分析... 序列模式在许多领域都有着重要的应用,大量的数据和模式需要高效的、可扩展的并行算法。针对目前序列模式挖掘算法存在的普遍问题,在对串行序列模式数据挖掘算法研究的基础上,本文提出了一种并行的序列模式数据挖掘算法。通过理论分析与实验验证可知:该并行数据挖掘算法,在海量数据的情形下,能很好地提高数据挖掘的效率。 展开更多
关键词 数据挖掘 序列模式 最小支持度 并行算法 频繁序列
在线阅读 下载PDF
重用最大频繁模式的可持续进化算法 被引量:1
18
作者 杨观赐 李琴 +1 位作者 李少波 钟勇 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第5期115-119,共5页
为了重用进化过程中沉淀在优秀个体集中的信息,设计了最大频繁序列模式挖掘算法,并在其基础上提出了重用最大频繁模式的可持续进化算法(MFPEA).该算法设置了多个不同层次的种群为不同适应度水平的个体提供生存空间,采用最大频繁序列模... 为了重用进化过程中沉淀在优秀个体集中的信息,设计了最大频繁序列模式挖掘算法,并在其基础上提出了重用最大频繁模式的可持续进化算法(MFPEA).该算法设置了多个不同层次的种群为不同适应度水平的个体提供生存空间,采用最大频繁序列模式挖掘算法挖掘种群中的优良基因,并将具有优良基因模块的新个体注入到不同适应度水平的种群中.文中还设计了针对不同问题动态调整进化种群规模的函数,通过一组统计数据研究了平衡计算时间与进化质量的相关参数.实验结果表明,MFPEA在维持遗传信息稳定性、避免早熟收敛方面表现良好,且获得了xit1083问题的新最优解记录(3611.496). 展开更多
关键词 最大频繁序列模式 序列挖掘 基因重用 可持续进化算法 旅行商问题
在线阅读 下载PDF
分布式光纤预警系统同质序列数据异常模式挖掘方法 被引量:2
19
作者 赵海燕 杜丽娟 +1 位作者 刘琨 刘建国 《激光杂志》 CAS 北大核心 2022年第9期134-138,共5页
采用目前方法挖掘分布式光纤预警系统中同质序列数据时,存在挖掘失败率高的问题,为此,设计一种分布式光纤预警系统同质序列数据异常模式挖掘方法。采用经验模态分解算法提取分布式光纤预警系统数据的特征,降维处理同质序列数据,并通过... 采用目前方法挖掘分布式光纤预警系统中同质序列数据时,存在挖掘失败率高的问题,为此,设计一种分布式光纤预警系统同质序列数据异常模式挖掘方法。采用经验模态分解算法提取分布式光纤预警系统数据的特征,降维处理同质序列数据,并通过请求循环平均异常度、浏览时间平均异常度和序列比对平均异常度这三个角度,检测同质序列数据中存在异常模式,进行最大频繁序列模式挖掘。实验结果表明,所提方法的挖掘失败率低,错误率低,正确率高,预警精度高。 展开更多
关键词 分布式光纤 预警系统 同质序列 经验模态分解算法 数据降 异常模式挖掘
在线阅读 下载PDF
基于改进的Wap算法的Web序列模式的研究 被引量:1
20
作者 王慧 张骏温 《计算机科学》 CSCD 北大核心 2012年第2期206-208,239,共4页
序列模式挖掘是Web日志挖掘中的一个重要范畴。针对Wap算法中递归构建大量条件树的这一缺陷,提出了一种改进算法NGCWAP。NGCWAP算法采用前序遍历号和后序遍历号来跟踪频繁序列分布在哪些后缀树集中,避免了条件树的构建,从而减少了内存... 序列模式挖掘是Web日志挖掘中的一个重要范畴。针对Wap算法中递归构建大量条件树的这一缺陷,提出了一种改进算法NGCWAP。NGCWAP算法采用前序遍历号和后序遍历号来跟踪频繁序列分布在哪些后缀树集中,避免了条件树的构建,从而减少了内存消耗。通过实验验证了改进算法的正确性和高效性。 展开更多
关键词 数据挖掘 WEB日志挖掘 Wap算法 频繁序列
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部