期刊文献+
共找到83篇文章
< 1 2 5 >
每页显示 20 50 100
一个简单的Web日志挖掘系统 被引量:22
1
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 WEB日志挖掘 序列模式识别 SWLMS
在线阅读 下载PDF
基于组合服务执行信息的服务选取方法研究 被引量:18
2
作者 张明卫 魏伟杰 +2 位作者 张斌 张锡哲 朱志良 《计算机学报》 EI CSCD 北大核心 2008年第8期1398-1411,共14页
组合服务选取问题是服务计算领域的一个研究热点问题,已往的选取方法大多基于难以准确获取的服务QoS信息,且算法思路复杂.文中提出了一种基于组合服务执行信息的服务选取方法.该方法分为3个阶段:数据生成阶段、数据挖掘阶段和服务选取阶... 组合服务选取问题是服务计算领域的一个研究热点问题,已往的选取方法大多基于难以准确获取的服务QoS信息,且算法思路复杂.文中提出了一种基于组合服务执行信息的服务选取方法.该方法分为3个阶段:数据生成阶段、数据挖掘阶段和服务选取阶段,分别进行组合服务执行信息的记载和相关数据集的生成、路径分支关联规则和服务执行顺序序列模式的挖掘以及基于挖掘产生的知识模式进行服务选取.文中首先给出一种可以方便记载日志的服务组合系统架构;然后提出一种基于时间加权的算法模型,以有效地进行路径分支关联规则和顺序序列模式的挖掘;最后对文中的组合服务选取方法进行描述.实验结果表明:文中方法在选取出的组合服务健壮性方面要优于基于QoS的方法. 展开更多
关键词 组合服务 服务选取 关联规则 序列模式 数据挖掘
在线阅读 下载PDF
路由器日志序列模式挖掘 被引量:2
3
作者 庄军 郭平 +2 位作者 周杨 周劲 蔡日旭 《计算机科学》 CSCD 北大核心 2005年第11期179-181,共3页
随着网络技术的发展,人们对网络质量的要求也越来越高,作为网络传输中重要环节之一的路由器的工作状态的变化直接影响到网络运行质量。从路由器日志中挖掘出的知识既可用于评价网络质量,又可用于改善网络信息服务。本文分析了路由器日... 随着网络技术的发展,人们对网络质量的要求也越来越高,作为网络传输中重要环节之一的路由器的工作状态的变化直接影响到网络运行质量。从路由器日志中挖掘出的知识既可用于评价网络质量,又可用于改善网络信息服务。本文分析了路由器日志中一些常见信息,采用序列挖掘方法对日志进行了挖掘,并对挖掘结果进行了解释和分析。 展开更多
关键词 路由器日志 序列模式 数据挖掘 序列模式挖掘 路由器 日志 网络信息服务 网络技术 网络质量 运行质量
在线阅读 下载PDF
免预设间隔约束的对比序列模式高效挖掘 被引量:15
4
作者 王慧锋 段磊 +3 位作者 左劼 王文韬 李钟麒 唐常杰 《计算机学报》 EI CSCD 北大核心 2016年第10期1979-1991,共13页
对比序列模式在识别不同类别序列样本集合的特征上有着重要的作用.已有对比序列模式挖掘算法需要用户预设间隔约束.在不具备充分先验知识情况下,用户不易准确地预设恰当的间隔约束,进而导致不能发现有用的模式.对此,文中设计了带紧凑间... 对比序列模式在识别不同类别序列样本集合的特征上有着重要的作用.已有对比序列模式挖掘算法需要用户预设间隔约束.在不具备充分先验知识情况下,用户不易准确地预设恰当的间隔约束,进而导致不能发现有用的模式.对此,文中设计了带紧凑间隔约束的最小对比序列模式挖掘算法,实现免预设间隔约束,并对候选模式自动计算最适合的间隔约束.此外,设计了3种剪枝策略来提高算法的执行效率.通过蛋白质序列、DNA序列、行为序列数据集验证了提出的算法的有效性和高效率. 展开更多
关键词 对比序列模式 间隔约束 序列数据挖掘
在线阅读 下载PDF
数据挖掘技术在网络型异常入侵检测系统中的应用 被引量:15
5
作者 宋世杰 胡华平 +1 位作者 胡笑蕾 金士尧 《计算机应用》 CSCD 北大核心 2003年第12期20-23,共4页
网络型异常检测的关键问题在于建立正常模式,将当前的系统或用户行为与建立好的正常模式进行比较,判断其偏离程度。简单介绍了数据挖掘算法以及基于数据挖掘的入侵检测系统的分类,从不同分类的角度介绍了数据挖掘方法在入侵检测系统中... 网络型异常检测的关键问题在于建立正常模式,将当前的系统或用户行为与建立好的正常模式进行比较,判断其偏离程度。简单介绍了数据挖掘算法以及基于数据挖掘的入侵检测系统的分类,从不同分类的角度介绍了数据挖掘方法在入侵检测系统中的应用。重点对比了模式比较的各种方法,并且使用网络型异常检测方法验证收集的正常数据是否充足的问题。 展开更多
关键词 数据挖掘 异常检测 关联规则 序列模式
在线阅读 下载PDF
DNA序列数据挖掘技术 被引量:37
6
作者 朱扬勇 熊赟 《软件学报》 EI CSCD 北大核心 2007年第11期2766-2781,共16页
DNA序列数据是一类重要的生物数据.研究DNA序列数据解读其含义是后基因组时代的主要研究任务.数据挖掘是目前最有效的数据分析手段之一,用于发现大量数据所隐含的各种规律,也是生物信息学采用的主要数据分析技术.将数据挖掘技术用于DNA... DNA序列数据是一类重要的生物数据.研究DNA序列数据解读其含义是后基因组时代的主要研究任务.数据挖掘是目前最有效的数据分析手段之一,用于发现大量数据所隐含的各种规律,也是生物信息学采用的主要数据分析技术.将数据挖掘技术用于DNA序列数据分析,已得到了广泛关注和快速发展,并取得了许多研究成果.综述了DNA序列数据挖掘领域的研究状况和进展,提出了3个研究阶段:基于统计的挖掘方法应用阶段、一般化挖掘方法应用阶段和专门的DNA序列数据挖掘方法设计阶段.阐述了DNA序列数据挖掘的基础是序列相似性,评述了DNA序列数据挖掘领域所采用的关键技术,包括DNA序列模式、关联、聚类、分类和异常挖掘等,分析讨论了其相应的生物应用背景和意义.最后给出DNA序列数据挖掘进一步研究的热点问题,包括DNA序列数据新的存储和索引机制的设计、根据生物领域知识的数据挖掘新模型和算法的设计等. 展开更多
关键词 DNA序列 数据挖掘 生物信息学 序列模式 序列相似性
在线阅读 下载PDF
数据挖掘技术在网络型误用入侵检测系统中的应用 被引量:9
7
作者 宋世杰 胡华平 +1 位作者 胡笑蕾 金士尧 《计算机工程》 CAS CSCD 北大核心 2004年第16期126-127,175,共3页
重点描述了数据挖掘技术在网络型误用入侵检测中的应用,实现了从网络审计数据中挖掘关联规则和序列模式,选择和构建临时统计特征,最后使用RIPPER分类器建立了误用检测模型。
关键词 数据挖掘 误用检测 关联规则 序列模式
在线阅读 下载PDF
WEB日志挖掘及其实现 被引量:13
8
作者 胡建武 何贞铭 张贻权 《计算机工程与应用》 CSCD 北大核心 2004年第14期156-158,共3页
Web日志中积累了大量的有用信息,从Web日志中发现有用的信息是非常必要的。该文研究了Web日志挖掘的机理,提出了通过访问路径挖掘来分析用户浏览模式的方法,并实现了一种有效的访问路径模式挖掘算法。
关键词 数据挖掘 WEB日志 访问路径模式
在线阅读 下载PDF
WINEPI挖掘算法在入侵检测中的应用 被引量:11
9
作者 李永忠 孙彦 罗军生 《计算机工程》 CAS CSCD 北大核心 2006年第23期159-161,共3页
针对入侵检测系统的特点,将序列模式挖掘算法应用于入侵检测系统中。分析了WINEPI算法,并通过一个示例描述了数据挖掘的具体过程,讨论了挖掘结果的解释评估。
关键词 入侵检测 数据挖掘 序列模式
在线阅读 下载PDF
基于投影数据库的序列模式挖掘增量式更新算法 被引量:5
10
作者 陆介平 刘月波 +2 位作者 倪巍伟 陈耿 孙志挥 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第3期457-462,共6页
针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算... 针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法. 展开更多
关键词 序列模式 数据挖掘 投影数据库 增量式更新
在线阅读 下载PDF
Web日志挖掘中的用户序列模式识别 被引量:6
11
作者 李明星 衡萍 +1 位作者 董沛武 陈健 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第11期1570-1572,1602,共4页
为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的... 为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性. 展开更多
关键词 WEB日志挖掘 阈值 序列模式识别 IA^x算法
在线阅读 下载PDF
基于车牌识别流数据的车辆伴随模式发现方法 被引量:12
12
作者 朱美玲 刘晨 +1 位作者 王雄斌 韩燕波 《软件学报》 EI CSCD 北大核心 2017年第6期1498-1515,共18页
针对伴随车辆检测这一新兴的智能交通应用,在一种特殊的流式时空大数据——车牌识别流式大数据(ANPR)下,重新定义了Platoon伴随模式,提出PlatoonFinder算法,即时地在车牌识别数据流上挖掘Platoon伴随模式.主要贡献包括:第一,将Platoon... 针对伴随车辆检测这一新兴的智能交通应用,在一种特殊的流式时空大数据——车牌识别流式大数据(ANPR)下,重新定义了Platoon伴随模式,提出PlatoonFinder算法,即时地在车牌识别数据流上挖掘Platoon伴随模式.主要贡献包括:第一,将Platoon伴随模式发现问题映射为数据流上的带有时空约束的频繁序列挖掘问题,与传统频繁序列挖掘算法仅考虑序列元素之间位置关系不同,该算法能够在频繁序列挖掘的过程中有效处理序列元素之间复杂的时空约束关系;第二,该算法融入了伪投影等性能优化技术,针对数据流的特点进行了性能优化,能够有效应对车牌识别流式大数据的速率和规模,从而实现车辆Platoon伴随模式的即时发现.通过在真实车牌识别数据集上的实验分析表明:PlatoonFinder算法的平均延时显著低于经典的Aprior和PrefixSpan等频繁模式挖掘算法,也低于真实情况下交通摄像头的车牌识别最小时间间隔.因此,所提出的算法可以有效地发现伴随车辆组及其移动模式. 展开更多
关键词 流式时空大数据 大数据分析 伴随模式 频繁序列挖掘
在线阅读 下载PDF
城市居民时空行为序列模式挖掘方法 被引量:11
13
作者 李雄 马修军 +2 位作者 王晨星 迪丽娜尔.牙生 柴彦威 《地理与地理信息科学》 CSCD 北大核心 2009年第2期10-14,共5页
通过问卷调查获得北京市500个家庭的活动日志数据。运用序列比对方法对时空行为序列数据进行序列模式挖掘,对每类序列模式通过频繁模式挖掘出其中潜在有用的行为模式。试验结果表明,序列比对方法与频繁模式挖掘相结合在城市居民行为模... 通过问卷调查获得北京市500个家庭的活动日志数据。运用序列比对方法对时空行为序列数据进行序列模式挖掘,对每类序列模式通过频繁模式挖掘出其中潜在有用的行为模式。试验结果表明,序列比对方法与频繁模式挖掘相结合在城市居民行为模式分析中应用成功,其弥补了传统数据分析方法的不足,为复杂时空行为数据的分析提供了一种新视角。 展开更多
关键词 行为模式 序列比对 数据挖掘 时空数据获取
在线阅读 下载PDF
确定学习与基于数据的建模及控制 被引量:19
14
作者 王聪 陈填锐 刘腾飞 《自动化学报》 EI CSCD 北大核心 2009年第6期693-706,共14页
确定学习运用自适应控制和动力学系统的概念与方法,研究未知动态环境下的知识获取、表达、存储和利用等问题.针对产生周期或回归轨迹的连续非线性动态系统,确定学习可以对其未知系统动态进行局部准确建模,其基本要素包括:1)使用径向基函... 确定学习运用自适应控制和动力学系统的概念与方法,研究未知动态环境下的知识获取、表达、存储和利用等问题.针对产生周期或回归轨迹的连续非线性动态系统,确定学习可以对其未知系统动态进行局部准确建模,其基本要素包括:1)使用径向基函数(Radial basis function,RBF)神经网络;2)对于周期(或回归)状态轨迹满足部分持续激励条件;3)在周期(或回归)轨迹的邻域内实现对非线性系统动态的局部准确神经网络逼近(局部准确建模);4)所学的知识以时不变且空间分布的方式表达、以常值神经网络权值的方式存储,并可在动态环境下用于动态模式的快速识别或者闭环神经网络控制.本文针对离散动态系统,扩展了确定学习理论,提出一个根据时态数据序列对离散动态系统进行建模与控制的框架.首先,运用确定学习原理和离散系统的自适应辨识方法,实现对产生时态数据的离散非线性系统的未知动态进行局部准确的神经网络建模,并利用此建模结果对时态数据序列进行时不变表达.其次,提出时态数据序列的基于动力学的相似性定义,以及对离散动态系统产生的时态数据序列(亦可称为动态模式)进行快速识别方法.最后,针对离散非线性控制系统,实现了基于时态数据序列对控制系统动态的闭环辨识(局部准确建模).所学关于闭环动态的知识可用于基于模式的智能控制.本文表明确定学习可以为时态数据挖掘的研究提供新的途径,并为基于数据的建模与控制等问题提供新的研究思路. 展开更多
关键词 确定学习 时态数据序列 离散动态系统 基于数据的建模 部分持续激励条件 时态数据挖掘 动态模式识别 基于模式的控制
在线阅读 下载PDF
面向邮件网络事件检测的用户行为模式挖掘 被引量:9
15
作者 李全刚 时金桥 +1 位作者 秦志光 柳厅文 《计算机学报》 EI CSCD 北大核心 2014年第5期1135-1146,共12页
挖掘邮件网络通信中的用户行为模式并分析其演变过程对于检测数据泄漏、内部威胁等工作都有着重要指导意义.已有的邮件网络用户行为模式挖掘方法可大致分为两大类:基于邮件内容和基于网络结构.基于邮件内容的挖掘方法存在侵犯用户隐私... 挖掘邮件网络通信中的用户行为模式并分析其演变过程对于检测数据泄漏、内部威胁等工作都有着重要指导意义.已有的邮件网络用户行为模式挖掘方法可大致分为两大类:基于邮件内容和基于网络结构.基于邮件内容的挖掘方法存在侵犯用户隐私或者因加密导致无法获得邮件内容等诸多局限性;基于网络结构的挖掘方法常把邮件网络视为是一个完整的网络,而忽略了组织外部邮箱间通信信息存在的缺失,使得提取某些特征时出现偏差,从而会影响到结论的准确性.文中将邮件网络分为两部分:域内通信网络和有连接缺失的域外通信网络,分析了域内通信和域外通信信息完整性的差异,分别提取了其各自的结构特征和职能特征.通过引入模元的概念,将常见的二元对应关系(特征-模式)转化为三元对应关系(特征-模元-模式),并从模元的角度来对用户模式进行统一描述.文中的工作有助于对用户行为模式的理解与对比,同时又具有降维的作用.在Enron邮件数据集上的实验结果表明文中方法将用户行为模式更加简洁地表示出来,并且能够通过分析用户行为模式的变化来直观地定位事件的发生. 展开更多
关键词 行为模式挖掘 事件检测 非负矩阵分解 邮件网络 日志分析 数据挖掘 信息安全 网络安全
在线阅读 下载PDF
关于提取Web用户浏览行为特征的研究 被引量:5
16
作者 胡亚慧 赵红军 +1 位作者 鲁汉榕 王海杰 《计算机工程与设计》 CSCD 北大核心 2006年第18期3416-3418,共3页
当前,Web日志挖掘技术已成为实现网站个性化服务的研究热点。运用Markov模型来预测用户的浏览模式,从而提高站点访问率、为站点重组提供有利信息是该领域广泛采用的方法之一。但传统方法建立的Markov模型,存在着数据冗余复杂、模型庞大... 当前,Web日志挖掘技术已成为实现网站个性化服务的研究热点。运用Markov模型来预测用户的浏览模式,从而提高站点访问率、为站点重组提供有利信息是该领域广泛采用的方法之一。但传统方法建立的Markov模型,存在着数据冗余复杂、模型庞大繁琐等问题。针对这些问题,介绍了一种改进的Markov模型。其方法主要是在原有模型的基础之上,在数据清洗、用户会话识别过程中删除一些不予考虑的因素,大大简化了建立的Markov模型,提高了Web日志挖掘的效率。 展开更多
关键词 WEB日志挖掘 浏览行为 MARKOV模型 数据清洗 会话识别
在线阅读 下载PDF
用户行为异常检测在安全审计系统中的应用 被引量:13
17
作者 江伟 陈龙 王国胤 《计算机应用》 CSCD 北大核心 2006年第7期1637-1639,1642,共4页
提出一种基于数据挖掘的用户行为审计方法,通过对正常审计数据进行分类预处理获取其他传统方法容易遗漏的正常模式,结合使用关联规则以及序列模式挖掘技术对用户行为进行模式挖掘,根据模式相似度比较来检测用户行为的异常。将此方法应... 提出一种基于数据挖掘的用户行为审计方法,通过对正常审计数据进行分类预处理获取其他传统方法容易遗漏的正常模式,结合使用关联规则以及序列模式挖掘技术对用户行为进行模式挖掘,根据模式相似度比较来检测用户行为的异常。将此方法应用于实际的安全审计系统,得到了较好的效果。 展开更多
关键词 安全审计 用户行为模式 数据挖掘 关联规则 序列模式
在线阅读 下载PDF
时态数据挖掘研究进展 被引量:15
18
作者 张保稳 何华灿 《计算机科学》 CSCD 北大核心 2002年第2期124-126,103,共4页
在现实生活中,大量数据集之中的数据都带有时间特征.时态数据随处可见,遍及经济、气象、通信、医疗等等多个领域.股市每日(或月)指数、交换机的每小时的业务量、某一患者的脑电波和Web页的日访问量,这些都是比较常见的例子.对这些时态... 在现实生活中,大量数据集之中的数据都带有时间特征.时态数据随处可见,遍及经济、气象、通信、医疗等等多个领域.股市每日(或月)指数、交换机的每小时的业务量、某一患者的脑电波和Web页的日访问量,这些都是比较常见的例子.对这些时态数据进行分析,从中获取蕴含的系统演化规律,从而完成对系统的未来行为的预测,具有重要的价值和意义. 展开更多
关键词 时态数据挖掘 知识发现 数据库 数据挖掘 关联规则
在线阅读 下载PDF
序列模式挖掘中的隐私保护方法研究 被引量:4
19
作者 朱玉全 胡天寒 +1 位作者 陈耿 常鹏 《计算机应用研究》 CSCD 北大核心 2009年第7期2489-2491,共3页
目前,已提出了一些关联规则挖掘中的隐私保护方法,而对序列模式挖掘中隐私保护的研究却很少。为此,提出了一种有效的敏感序列隐藏算法CLSDA(current leasts equences delete algorithm),该算法对候选序列加权,在删除序列的过程中随时更... 目前,已提出了一些关联规则挖掘中的隐私保护方法,而对序列模式挖掘中隐私保护的研究却很少。为此,提出了一种有效的敏感序列隐藏算法CLSDA(current leasts equences delete algorithm),该算法对候选序列加权,在删除序列的过程中随时更新权值,使用贪心算法获得局部最优解,尽可能减少对原始数据库的改动。实验结果表明,与现有序列模式隐藏方法相比,算法CLSDA将具有更好的隐藏效果。 展开更多
关键词 数据挖掘 隐私保护 序列模式 敏感序列
在线阅读 下载PDF
一种基于拓扑信息的物流频繁路径挖掘算法 被引量:7
20
作者 杨俊瑶 蒙祖强 蒋亮 《计算机科学》 CSCD 北大核心 2015年第4期258-262,共5页
为了高效地从海量物流数据中获取频繁路径,根据物流网络及物流的特征设计了一种物流数据模型以及一种充分考虑了物流网络拓扑信息的频繁路径序列挖掘算法PMWTI(Path Mining With Topology Information)。在PMWTI中设计了一种用于候选路... 为了高效地从海量物流数据中获取频繁路径,根据物流网络及物流的特征设计了一种物流数据模型以及一种充分考虑了物流网络拓扑信息的频繁路径序列挖掘算法PMWTI(Path Mining With Topology Information)。在PMWTI中设计了一种用于候选路径序列深度剪枝的代价容忍度剪枝方法,该方法在利用Apriori性质剪枝的基础上进一步去除了部分不可能是频繁路径序列的候选路径序列,这在一定程度上缩减了候选路径序列规模,从而减少了对数据集的扫描。实验表明,相比没有采用该剪枝方法的同等算法,PMWTI具有更高的频繁路径挖掘效率。 展开更多
关键词 物流 频繁路径 序列模式 数据挖掘
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部