期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
Web日志挖掘中的用户序列模式识别 被引量:6
1
作者 李明星 衡萍 +1 位作者 董沛武 陈健 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第11期1570-1572,1602,共4页
为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的... 为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性. 展开更多
关键词 WEB日志挖掘 阈值 序列模式识别 IA^x算法
在线阅读 下载PDF
基于加权频繁模式树的通信网络告警规则挖掘方法 被引量:14
2
作者 罗明 孟传伟 黄海量 《计算机工程》 CAS CSCD 北大核心 2016年第4期190-196,共7页
传统通信网络告警处理方法主要由维护专家依据经验判断形成处理规则并固化在网络告警系统中进行实现,然而该人工维护方式难以适应海量数据环境下实时通信告警规则的处理需求。为此,提出一种基于加权频繁模式树(WFP-tree)算法的告警规则... 传统通信网络告警处理方法主要由维护专家依据经验判断形成处理规则并固化在网络告警系统中进行实现,然而该人工维护方式难以适应海量数据环境下实时通信告警规则的处理需求。为此,提出一种基于加权频繁模式树(WFP-tree)算法的告警规则自动挖掘方法,将原始告警数据按时间窗口方式进行分段处理,通过BP神经网络、支持向量机、层次分析法生成告警设备的权重信息,并采用WFP-tree算法自动挖掘加权频繁项集。实验结果表明,与传统Apriori和FP-growth算法相比,WFP-tree算法在通信网络告警分析方面具有更好的频繁项压缩效果及更强的重要关联规则发现能力。 展开更多
关键词 通信网络告警 关联规则 权重因子 加权频繁项集 FP-GROWTH算法 加权频繁模式树算法 支持度
在线阅读 下载PDF
NPSP:一种高效的序列模式增量挖掘算法 被引量:4
3
作者 张兵 聂永红 林士敏 《广西师范大学学报(自然科学版)》 CAS 2004年第4期22-26,共5页
提出了一种称为"异构树"的数据结构,采用一套编号规则对异构树的分支进行编号,使具有相同编号的分支代表相同的候选序列,编号不同的分支代表不同的候选序列,极大地简化了候选集计数过程.在此基础上提出了具有增量挖掘功能的... 提出了一种称为"异构树"的数据结构,采用一套编号规则对异构树的分支进行编号,使具有相同编号的分支代表相同的候选序列,编号不同的分支代表不同的候选序列,极大地简化了候选集计数过程.在此基础上提出了具有增量挖掘功能的序列模式高效挖掘算法NPSP,并从理论分析和实验两方面证明了其挖掘结果集的完备性和算法的高效性. 展开更多
关键词 数据挖掘 序列模式 NPSP算法 增量挖掘
在线阅读 下载PDF
一种基于改进的AprioriAll算法的Web路径模式挖掘 被引量:4
4
作者 司应硕 杨世平 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期172-175,共4页
对路径模式挖掘的原理做了详细的阐述,并且针对挖掘对象的特性,对AprioriAll算法中生成侯选序列的函数做了相应的改进。最后通过实例说明了改进的AprioriAll算法在路径模式挖掘中的有效性。
关键词 路径模式挖掘 WEB数据挖掘 大引用序列 AprioriAll算法
在线阅读 下载PDF
重用最大频繁模式的可持续进化算法 被引量:1
5
作者 杨观赐 李琴 +1 位作者 李少波 钟勇 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第5期115-119,共5页
为了重用进化过程中沉淀在优秀个体集中的信息,设计了最大频繁序列模式挖掘算法,并在其基础上提出了重用最大频繁模式的可持续进化算法(MFPEA).该算法设置了多个不同层次的种群为不同适应度水平的个体提供生存空间,采用最大频繁序列模... 为了重用进化过程中沉淀在优秀个体集中的信息,设计了最大频繁序列模式挖掘算法,并在其基础上提出了重用最大频繁模式的可持续进化算法(MFPEA).该算法设置了多个不同层次的种群为不同适应度水平的个体提供生存空间,采用最大频繁序列模式挖掘算法挖掘种群中的优良基因,并将具有优良基因模块的新个体注入到不同适应度水平的种群中.文中还设计了针对不同问题动态调整进化种群规模的函数,通过一组统计数据研究了平衡计算时间与进化质量的相关参数.实验结果表明,MFPEA在维持遗传信息稳定性、避免早熟收敛方面表现良好,且获得了xit1083问题的新最优解记录(3611.496). 展开更多
关键词 最大频繁序列模式 序列挖掘 基因重用 可持续进化算法 旅行商问题
在线阅读 下载PDF
一种序列模式的概念及挖掘算法 被引量:2
6
作者 李宏 陈松乔 《中南工业大学学报》 CSCD 北大核心 2001年第4期425-427,共3页
介绍了一种时间序列模式的形式和概念 ,讨论了其相关的挖掘算法 .将时间序列模式既用于具有时间关系的购买行为的分析 ,以揭示购买行为后面一种序列关系信息 ,又用于其他有时间关联的事件分析 .挖掘算法由以下几部分构成 :建立频繁物品... 介绍了一种时间序列模式的形式和概念 ,讨论了其相关的挖掘算法 .将时间序列模式既用于具有时间关系的购买行为的分析 ,以揭示购买行为后面一种序列关系信息 ,又用于其他有时间关联的事件分析 .挖掘算法由以下几部分构成 :建立频繁物品集 ,进行数据处理和转换 ,并生成候选子序列 ,通过验证后 ,得到长度为 2 ,3 ,…的序列集合 ,从中选出独立最大序列即为所求 .通过实例指出了该算法和传统的Aprioriall算法的不同之处 .结果表明 ,这种序列模式在网络通信。 展开更多
关键词 时间序列模式 挖掘算法 频繁物品集 独立最大序列 数据库
在线阅读 下载PDF
基于BIDE的多核并行闭合序列模式挖掘 被引量:1
7
作者 俞东进 郑苏杭 +1 位作者 李万清 吴为 《计算机工程》 CAS CSCD 2012年第12期55-58,共4页
基于经典的BIDE算法,提出一种多核并行闭合序列模式挖掘算法——MT_BIDE。该算法在频繁序列扩展判断前进行剪枝,在扩展过程中动态调整频繁序列及其伪投影数据集,平衡不同线程间挖掘闭合序列模式的计算量差异。实验结果表明,该算法具有... 基于经典的BIDE算法,提出一种多核并行闭合序列模式挖掘算法——MT_BIDE。该算法在频繁序列扩展判断前进行剪枝,在扩展过程中动态调整频繁序列及其伪投影数据集,平衡不同线程间挖掘闭合序列模式的计算量差异。实验结果表明,该算法具有较高的运行效率和加速比。 展开更多
关键词 多核 闭合序列 BIDE算法 序列模式挖掘 伪投影数据集
在线阅读 下载PDF
基于加权序列模式的推荐算法研究 被引量:5
8
作者 宋威 乔阳阳 《计算机工程与科学》 CSCD 北大核心 2015年第7期1399-1404,共6页
由于考虑了用户的访问顺序,基于序列模式的推荐方法正在成为推荐系统研究的热点之一。为提高推荐结果的个性化程度,提出了一种基于加权序列模式的推荐算法PRWSP。首先,给出了新的加权序列模式模型,该模型在设置权重时充分考虑了项目在... 由于考虑了用户的访问顺序,基于序列模式的推荐方法正在成为推荐系统研究的热点之一。为提高推荐结果的个性化程度,提出了一种基于加权序列模式的推荐算法PRWSP。首先,给出了新的加权序列模式模型,该模型在设置权重时充分考虑了项目在不同序列中的不同重要程度。其次,通过近似估计序列权重的方式,论证了挖掘加权序列模式时同样满足反单调性,从而约简了搜索空间。最后,定义了序列模式匹配程度的度量标准。实验结果表明,PRWSP算法具有较高的挖掘效率和推荐精度。 展开更多
关键词 数据挖掘 加权序列模式 反单调性 推荐算法
在线阅读 下载PDF
基于最大频繁项目序列集挖掘DMFIA算法的改进 被引量:1
9
作者 宋卫林 徐惠民 《计算机工程与设计》 CSCD 北大核心 2007年第7期1493-1496,1500,共5页
为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进... 为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进的DMFIA算法,并在原算法的基础上有了较大的改进。为了验证算法的正确性,运用Ora-cle9i数据库的PL/SQL进行了相应的验证。实验结果证实了改进算法的有效性和实用性,并具有较好的创新性和理论价值。 展开更多
关键词 数据挖掘 关联规则 序列模式 DMFIA算法 最大频繁项目集 最大频繁项目序列集
在线阅读 下载PDF
攻击案例综合学习系统研究
10
作者 昝鑫 郑庆华 +1 位作者 范宇倩 韩九强 《计算机应用》 CSCD 北大核心 2007年第9期2177-2179,2183,共4页
随着入侵检测系统在安全领域的广泛应用,入侵报警学习和分析已经成为一个研究热点。针对目前入侵报警泛滥和知识贫乏等问题,设计了一个完整的攻击案例学习系统框架。该学习系统分为两个阶段:入侵报警精简和典型攻击案例挖掘。前者利用... 随着入侵检测系统在安全领域的广泛应用,入侵报警学习和分析已经成为一个研究热点。针对目前入侵报警泛滥和知识贫乏等问题,设计了一个完整的攻击案例学习系统框架。该学习系统分为两个阶段:入侵报警精简和典型攻击案例挖掘。前者利用改进的密度聚类方法实现相似报警聚合以及报警聚类的自动精简表示,后者利用序列模式挖掘方法挖掘频繁入侵事件序列。进一步提出一种基于入侵执行顺序约束关系的攻击案例评估算法实现典型攻击案例的自动筛选。最后,利用真实入侵报警数据测试了该攻击案例学习系统,结果表明该系统能够实现高效报警精简和典型攻击案例的准确学习。 展开更多
关键词 入侵检测 密度聚类算法 序列模式挖掘 攻击案例
在线阅读 下载PDF
基于完井业务流程的加权序列模式挖掘算法研究
11
作者 尚福华 孙姝凝 +1 位作者 陈效果 杜睿山 《计算机应用研究》 CSCD 北大核心 2014年第9期2719-2723,共5页
针对完井移动平台Web访问模式中用户对整体上符合完井业务流程习惯的序列模式更加感兴趣的特点,提出一种基于完井业务流程的加权序列模式挖掘算法。通过对完井业务流程模型和完井Web访问日志作分析,确定完井业务依赖强度计算模型并作为... 针对完井移动平台Web访问模式中用户对整体上符合完井业务流程习惯的序列模式更加感兴趣的特点,提出一种基于完井业务流程的加权序列模式挖掘算法。通过对完井业务流程模型和完井Web访问日志作分析,确定完井业务依赖强度计算模型并作为序列的权重,同时在加权挖掘的过程中采用k-最小加权支持数技术,对PrefixSpan算法进行改进。该算法在加权挖掘的过程中可以舍弃一大批不满足业务流程的访问序列,有效地避免候选组合爆炸的发生。实验表明该算法能快速地挖掘出有意义的完井访问序列模式。 展开更多
关键词 数据挖掘 完井业务流程 加权序列模式 最小加权支持数
在线阅读 下载PDF
序列模式数据挖掘算法的并行化研究
12
作者 王宗江 《计算机科学》 CSCD 北大核心 2008年第8期249-251,257,共4页
序列模式在许多领域都有着重要的应用,大量的数据和模式需要高效的、可扩展的并行算法。针对目前序列模式挖掘算法存在的普遍问题,在对串行序列模式数据挖掘算法研究的基础上,本文提出了一种并行的序列模式数据挖掘算法。通过理论分析... 序列模式在许多领域都有着重要的应用,大量的数据和模式需要高效的、可扩展的并行算法。针对目前序列模式挖掘算法存在的普遍问题,在对串行序列模式数据挖掘算法研究的基础上,本文提出了一种并行的序列模式数据挖掘算法。通过理论分析与实验验证可知:该并行数据挖掘算法,在海量数据的情形下,能很好地提高数据挖掘的效率。 展开更多
关键词 数据挖掘 序列模式 最小支持度 并行算法 频繁序列集
在线阅读 下载PDF
基于MapReduce的序列模式挖掘算法 被引量:5
13
作者 余啸 马传香 +1 位作者 李伟亮 金聪 《计算机应用研究》 CSCD 北大核心 2015年第11期3312-3314,共3页
针对传统GSP算法需要多次扫描数据库、I/O开销巨大的缺点,提出了一种基于MapReduce编程框架的序列模式挖掘算法MR-GSP(GSP algorithm based on MapReduce)。MR-GSP算法将原序列数据库划分为多个子序列数据库并分发到多个Map节点,Map函... 针对传统GSP算法需要多次扫描数据库、I/O开销巨大的缺点,提出了一种基于MapReduce编程框架的序列模式挖掘算法MR-GSP(GSP algorithm based on MapReduce)。MR-GSP算法将原序列数据库划分为多个子序列数据库并分发到多个Map节点,Map函数扫描存放在Map节点内存中的子序列数据库,产生局部序列模式,Reduce函数对所有局部序列模式合并,扫描原序列数据库,计算局部序列模式的支持度,得到最终的序列模式。相比于传统GSP算法,MR-GSP算法只需扫描两次原始数据库即可得到所有序列模式。实验结果表明,MRGSP算法在对大数据集进行序列模式挖掘时,可充分利用云计算技术的优势,提高挖掘效率。 展开更多
关键词 数据挖掘 GSP算法 序列模式 MAPREDUCE 子序列数据库
在线阅读 下载PDF
恶意代码检测中的PrefixSpan算法应用 被引量:3
14
作者 王丽娜 谭小彬 +1 位作者 潘剑锋 奚宏生 《计算机工程》 CAS CSCD 北大核心 2010年第7期119-121,共3页
结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码... 结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码行为序列库中挖掘关联规则,专家系统将获取的主机行为与规则匹配,从而达到检测恶意行为的目的。实验结果证明了该算法的正确性和有效性。 展开更多
关键词 恶意代码检测 基于行为检测 序列模式挖掘 PREFIXSPAN算法 投影数据库
在线阅读 下载PDF
一种有效的通信网络告警分析方法 被引量:6
15
作者 齐小刚 胡秋秋 +1 位作者 姚旭清 刘立芳 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第4期1-8,158,共9页
以往大多告警分析研究都是假设通信网络中所有告警是平等的,考虑此假设的不合理性,提出了一种加权告警分析方法。首先,根据告警对网络的影响程度,采用熵值法为不同的告警分配不同的权值,并将其转换成适合于数据挖掘的序列数据集;然后,... 以往大多告警分析研究都是假设通信网络中所有告警是平等的,考虑此假设的不合理性,提出了一种加权告警分析方法。首先,根据告警对网络的影响程度,采用熵值法为不同的告警分配不同的权值,并将其转换成适合于数据挖掘的序列数据集;然后,设计了一种加权告警序列模式挖掘算法,并采用了一种新颖的剪枝策略来缩减需要挖掘的数据集大小以提高算法的效率;最后,利用该算法挖掘告警数据中的时序关系。实验结果表明,这种加权告警分析方法在剪枝效果、挖掘重要告警序列模式和执行效率方面具有很好的性能。 展开更多
关键词 相关性分析 通信网络 熵值法 剪枝策略 加权告警序列模式挖掘算法
在线阅读 下载PDF
加权增量关联规则挖掘在通信告警预测中的应用 被引量:11
16
作者 王帅 杨秋辉 +3 位作者 曾嘉彦 万莹 樊哲宁 张光兰 《计算机应用》 CSCD 北大核心 2018年第10期2875-2880,共6页
针对通信网络告警预测中预测精度不高、模型训练效率较低等缺陷,提出告警权值确定方法和基于自然序树(Can-tree)的加权增量关联规则挖掘的通信网络告警预测方案。首先,对告警数据进行预处理,确定告警数据权值并压缩到Can-tree结构中;其... 针对通信网络告警预测中预测精度不高、模型训练效率较低等缺陷,提出告警权值确定方法和基于自然序树(Can-tree)的加权增量关联规则挖掘的通信网络告警预测方案。首先,对告警数据进行预处理,确定告警数据权值并压缩到Can-tree结构中;其次,应用增量关联规则挖掘算法对Can-tree进行挖掘,生成告警关联规则;最后,使用模式匹配的方法对实时告警信息进行预测,并对结果进行优化整理。实验结果表明,基于Can-tree的加权增量关联规则挖掘算法是高效的,利用前次挖掘的结果和信息提高了挖掘的效率,网络告警数据的权值分配方案能够合理地区分告警数据的重要程度,有助于将重要程度高的告警关联规则挖掘出来,并加快过时告警关联规则的淘汰,提高预测的准确度和精度。 展开更多
关键词 告警预测 通信网络 增量数据挖掘 加权关联规则挖掘 Can-tree算法
在线阅读 下载PDF
一种改进的PrefixSpan算法及其在Web用户行为模式挖掘中的应用 被引量:6
17
作者 姬浩博 王俊红 《计算机科学》 CSCD 北大核心 2016年第1期25-29,共5页
序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接... 序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究。实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高。 展开更多
关键词 序列模式挖掘 WEB日志挖掘 PREFIXSPAN算法
在线阅读 下载PDF
改进的PrefixSpan算法在Web挖掘中的应用 被引量:2
18
作者 谢清森 杨天奇 《科学技术与工程》 2009年第23期7176-7179,共4页
针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在... 针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在改进后运行效率比原来提高35%以上,更适用于Web挖掘。 展开更多
关键词 WEB挖掘 PREFIXSPAN算法 序列模式
在线阅读 下载PDF
基于项目的非邻近序列模式推荐算法 被引量:1
19
作者 李伟 王新房 刘妮 《计算机工程》 CAS CSCD 北大核心 2009年第16期65-67,70,共4页
针对推荐系统存在的稀疏性问题,提出将非邻近序列模式挖掘算法与基于项目的协作过滤推荐算法相结合的推荐方法,通过构造Markov概率的路径加权转移矩阵,计算资源被推荐的可能性,向用户进行推荐。结果证明,在数据稀疏的情况下,较传统的基... 针对推荐系统存在的稀疏性问题,提出将非邻近序列模式挖掘算法与基于项目的协作过滤推荐算法相结合的推荐方法,通过构造Markov概率的路径加权转移矩阵,计算资源被推荐的可能性,向用户进行推荐。结果证明,在数据稀疏的情况下,较传统的基于项目的协作过滤推荐算法,该算法能有效提高推荐系统的推荐质量。 展开更多
关键词 推荐系统 稀疏性问题 非邻近序列模式挖掘算法 基于项目的协作过滤 路径加权求和
在线阅读 下载PDF
基于改进序列模式挖掘算法的告警关联模型 被引量:2
20
作者 吕磊 刘家宇 +3 位作者 李琦 姚皓 李嘉周 张凤荔 《电讯技术》 北大核心 2023年第6期911-917,共7页
在电力故障发生时,会产生大量的电力故障告警信息数据,如何从电力故障告警信息中挖掘出可靠的关联规则,对后续电力的调度运维有着重要的影响。广义序列模式(Generalized Sequential Pattern,GSP)算法通过增加时间上的约束条件提高算法... 在电力故障发生时,会产生大量的电力故障告警信息数据,如何从电力故障告警信息中挖掘出可靠的关联规则,对后续电力的调度运维有着重要的影响。广义序列模式(Generalized Sequential Pattern,GSP)算法通过增加时间上的约束条件提高算法的效率,适合应用于电力故障告警信息挖掘的场景。针对GSP算法中的关键参数多和不同的参数组合影响算法的准确性和可靠性的问题,将遗传算法与GSP算法相结合,自适应地得到一组较好的参数,将参数代入GSP算法,从而得到更加可靠的关联规则,以此来解决在电力故障告警信息应用中很难为不同的数据集找到合适的参数组合的问题。通过实例验证,电力故障告警信息数据应用遗传算法结合GSP算法能够有效地得到更加准确和可靠的计算结果。 展开更多
关键词 电力故障告警 序列模式挖掘 广义序列模式(GSP)算法 遗传算法 关联规则
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部