期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
Web日志中挖掘用户浏览模式的研究 被引量:34
1
作者 施建生 伍卫国 +2 位作者 陆丽娜 Yang Yiling 杨怡玲 《西安交通大学学报》 EI CAS CSCD 北大核心 2001年第6期621-624,共4页
研究了Web日志挖掘的机理 ,提出了使用频繁遍历路径作为用户浏览模式 ,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上 ,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法 ,该算法能够正确、快速地从Web... 研究了Web日志挖掘的机理 ,提出了使用频繁遍历路径作为用户浏览模式 ,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上 ,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法 ,该算法能够正确、快速地从Web日志中抽取频繁遍历路径 . 展开更多
关键词 数据挖掘 web挖掘 用户浏览模式
在线阅读 下载PDF
一个简单的Web日志挖掘系统 被引量:22
2
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 web日志挖掘 序列模式识别 SWLMS
在线阅读 下载PDF
一种基于有向树挖掘Web日志中最大频繁访问模式的方法 被引量:9
3
作者 詹宇斌 殷建平 +2 位作者 张玲 龙军 程杰仁 《计算机应用》 CSCD 北大核心 2006年第7期1662-1665,共4页
提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问... 提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问模式;使用频繁模式树连接分层的频繁弧克服了图结构数据挖掘算法中直接连接两个频繁模式树要判断连接条件的缺点,同时采用预剪枝策略,降低了算法的开销。实验表明,s-Tree算法具有可扩展性,运行效率比直接采用图结构数据挖掘算法要高。 展开更多
关键词 web使用挖掘 最大频繁访问模式 有向树 web日志
在线阅读 下载PDF
Web使用挖掘技术研究 被引量:37
4
作者 涂承胜 陆玉昌 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1177-1184,共8页
简要介绍了 WEB挖掘的基本概念及其分类 ,讨论了 Web使用挖掘的有关理论及其应用 .重点分析了 Web使用挖掘的主要研究对象和研究方法 ,包括 :挖掘的数据对象、数据的采集、数据预处理、模式发现、模式分析及其相关技术 .展望了
关键词 web挖掘 web网络使用挖掘 数据预处理 模式发现 模式分析
在线阅读 下载PDF
基于Web日志的用户访问模式挖掘 被引量:15
5
作者 王新 马万青 潘文林 《计算机工程与应用》 CSCD 北大核心 2006年第21期156-158,共3页
Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。
关键词 web日志挖掘 访问模式 粗糙集 聚类
在线阅读 下载PDF
Web使用挖掘技术研究综述 被引量:17
6
作者 陈健 印鉴 《计算机工程》 CAS CSCD 北大核心 2005年第9期4-6,共3页
Web使用挖掘就是利用数据挖掘技术从Web数据中发现用户使用模式的过程。该文介绍了Web使用挖掘的定义和背景知识,对Web使用挖掘的3个阶段:预处理,模式发现和模式分析进行详细的说明;深入研究了具体应用中的发展方向和所要解决的关键技术... Web使用挖掘就是利用数据挖掘技术从Web数据中发现用户使用模式的过程。该文介绍了Web使用挖掘的定义和背景知识,对Web使用挖掘的3个阶段:预处理,模式发现和模式分析进行详细的说明;深入研究了具体应用中的发展方向和所要解决的关键技术;对将来Web使用挖掘领域的研究问题作了展望。 展开更多
关键词 web使用挖掘 数据预处理 模式挖掘 模式分析 web应用
在线阅读 下载PDF
Web使用挖掘技术的分析与研究 被引量:23
7
作者 朱志国 邓贵仕 《计算机应用研究》 CSCD 北大核心 2008年第1期29-32,36,共5页
首先给出Web使用挖掘的定义和完整模型框架;然后对Web使用挖掘中主要步骤的最新研究进展状况作了详细的阐述和分析,其中包括数据采集、数据预处理、模式发现和模式分析;最后对未来的研究重点进行了展望。
关键词 web挖掘 web使用挖掘 数据预处理 模式发现 模式分析
在线阅读 下载PDF
WEB日志挖掘及其实现 被引量:13
8
作者 胡建武 何贞铭 张贻权 《计算机工程与应用》 CSCD 北大核心 2004年第14期156-158,共3页
Web日志中积累了大量的有用信息,从Web日志中发现有用的信息是非常必要的。该文研究了Web日志挖掘的机理,提出了通过访问路径挖掘来分析用户浏览模式的方法,并实现了一种有效的访问路径模式挖掘算法。
关键词 数据挖掘 web日志 访问路径模式
在线阅读 下载PDF
Web日志挖掘中数据预处理技术的研究 被引量:19
9
作者 马瑞民 李向云 《计算机工程与设计》 CSCD 北大核心 2007年第10期2358-2360,共3页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访... 在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。 展开更多
关键词 web日志挖掘 数据预处理 路径补充 访问序列 访问事务
在线阅读 下载PDF
Web使用挖掘中Apriori算法的改进研究 被引量:6
10
作者 许晓东 李柯 朱士瑞 《计算机工程与设计》 CSCD 北大核心 2010年第3期539-541,563,共4页
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法。改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间。将项集有序性引入到该数组上,减少了候选项... 分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法。改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间。将项集有序性引入到该数组上,减少了候选项集的个数。并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率。试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式。 展开更多
关键词 web挖掘 不规则数组 项集有序性 二进制 访问模式
在线阅读 下载PDF
关于提取Web用户浏览行为特征的研究 被引量:5
11
作者 胡亚慧 赵红军 +1 位作者 鲁汉榕 王海杰 《计算机工程与设计》 CSCD 北大核心 2006年第18期3416-3418,共3页
当前,Web日志挖掘技术已成为实现网站个性化服务的研究热点。运用Markov模型来预测用户的浏览模式,从而提高站点访问率、为站点重组提供有利信息是该领域广泛采用的方法之一。但传统方法建立的Markov模型,存在着数据冗余复杂、模型庞大... 当前,Web日志挖掘技术已成为实现网站个性化服务的研究热点。运用Markov模型来预测用户的浏览模式,从而提高站点访问率、为站点重组提供有利信息是该领域广泛采用的方法之一。但传统方法建立的Markov模型,存在着数据冗余复杂、模型庞大繁琐等问题。针对这些问题,介绍了一种改进的Markov模型。其方法主要是在原有模型的基础之上,在数据清洗、用户会话识别过程中删除一些不予考虑的因素,大大简化了建立的Markov模型,提高了Web日志挖掘的效率。 展开更多
关键词 web日志挖掘 浏览行为 MARKOV模型 数据清洗 会话识别
在线阅读 下载PDF
基于过滤器的Web访问模式挖掘 被引量:2
12
作者 佟强 周园春 +1 位作者 吴开超 阎保平 《计算机工程》 CAS CSCD 北大核心 2007年第6期59-61,共3页
针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算... 针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算法。目前该方法已经广泛地应用于科学数据库系统中。 展开更多
关键词 数据挖掘 web日志 访问模式 频集
在线阅读 下载PDF
Web日志与浏览行为结合下的用户浏览兴趣数据挖掘分析 被引量:8
13
作者 李珊 刘继超 邵芬红 《现代电子技术》 北大核心 2017年第5期22-25,共4页
针对用户浏览兴趣模式数据的收敛性和准确度不高的问题,提出一种基于Web日志与用户浏览行为结合的用户浏览兴趣模式数据挖掘模型。首先设计Web日志与用户浏览行为结合的用户浏览兴趣模式数据信息流模型,进行用户浏览兴趣模式的频繁项特... 针对用户浏览兴趣模式数据的收敛性和准确度不高的问题,提出一种基于Web日志与用户浏览行为结合的用户浏览兴趣模式数据挖掘模型。首先设计Web日志与用户浏览行为结合的用户浏览兴趣模式数据信息流模型,进行用户浏览兴趣模式的频繁项特征提取和Qo S预测;然后采用Web日志与用户浏览行为结合的行为调度模式自适应检索用户浏览网页的兴趣特征点,实现语义特征匹配,达到用户浏览兴趣模式数据挖掘的目的;最后通过仿真实验实现性能验证。结果表明,该方法的用户浏览兴趣特征点的匹配度高,数据挖掘精度得到提升,展示了优越性能。 展开更多
关键词 web日志 用户浏览行为 兴趣模式 数据挖掘
在线阅读 下载PDF
基于模糊聚类的Web浏览路径分析方法 被引量:3
14
作者 王勇 张伟 陈军 《计算机工程与设计》 CSCD 北大核心 2007年第6期1484-1485,F0003,共3页
在Web挖掘研究中,传统硬聚类技术常被用来分析网站浏览者对网页的浏览偏好。然而该方法只能将每一用户浏览路径归类到单一群组中,即事先假设每一浏览路径只包含单一种用户偏好,却忽略了同一用户浏览路径可能包含多个网页偏好。针对这种... 在Web挖掘研究中,传统硬聚类技术常被用来分析网站浏览者对网页的浏览偏好。然而该方法只能将每一用户浏览路径归类到单一群组中,即事先假设每一浏览路径只包含单一种用户偏好,却忽略了同一用户浏览路径可能包含多个网页偏好。针对这种情况,提出用模糊聚类技术取代传统的硬聚类技术以弥补不足,使聚类结果更符合实际浏览情况。 展开更多
关键词 数据挖掘 web挖掘 web浏览路径 模糊聚类 个性化
在线阅读 下载PDF
基于双Kohonen神经网络的Web用户访问模式挖掘算法 被引量:4
15
作者 段隆振 朱敏 王靓明 《计算机工程与科学》 CSCD 北大核心 2009年第9期95-98,共4页
本文根据Kohonen自组织特征映射神经网络中学习阶段的性质,运用双Kohonen神经网络组合成新的自组织训练挖掘模型,先使用粗调整训练,加快模型学习速度,紧接着使用微调整训练,提高模型学习精度。实验结果表明,本文提出的双Kohonen神经网... 本文根据Kohonen自组织特征映射神经网络中学习阶段的性质,运用双Kohonen神经网络组合成新的自组织训练挖掘模型,先使用粗调整训练,加快模型学习速度,紧接着使用微调整训练,提高模型学习精度。实验结果表明,本文提出的双Kohonen神经网络挖掘模型,相对于标准Kohonen神经网络在训练速度和收敛效果上都有一定程度的提高,改善了聚类效果,为挖掘用户的多种兴趣提供了一种可行的方法。 展开更多
关键词 web数据挖掘 用户访问模式 KOHONEN神经网络 学习率 邻域
在线阅读 下载PDF
Web访问序列模式挖掘算法的研究 被引量:2
16
作者 李陶深 王伟娜 陈庆峰 《计算机科学》 CSCD 北大核心 2013年第12期41-44,共4页
针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户... 针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户查找信息的质量和效率,以及对用户开展个性化的信息服务。实验和应用结果表明,提出的算法具有更好的执行效率,适用于Web日志挖掘,可用于构建智能化Web站点和解决个性化的信息服务问题。 展开更多
关键词 web访问 序列模式 数据挖掘 PREFIXSPAN算法 web日志挖掘
在线阅读 下载PDF
持久偏爱的Web用户访问路径信息挖掘方法 被引量:5
17
作者 朱志国 邓贵仕 《情报学报》 CSSCI 北大核心 2010年第2期208-214,共7页
现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘。本文力图从Web访问数据的历史演变过程中,发现新的知识——持久偏爱的Web用户访问路径PP-WAP。PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动... 现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘。本文力图从Web访问数据的历史演变过程中,发现新的知识——持久偏爱的Web用户访问路径PP-WAP。PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息。本文首先介绍了相关背景和PP-WAP的应用领域。接下来,利用无序树结构来表示历史WAS集合,同时给出了PP—WAP的定义和挖掘算法描述。最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析。 展开更多
关键词 数据挖掘 web访问路径 动态数据挖掘
在线阅读 下载PDF
一种基于粗糙集的Web用户访问规则获取方法 被引量:3
18
作者 张永 杨志勇 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期84-85,146,共3页
用户浏览模式获取是现阶段Web日志挖掘的主要目标之一。该文根据用户浏览的重要特征,提出了一种应用粗糙集理论获取规则的方法。选取重要特征作为条件属性并通过算法实现获取最终规则,实例分析效果良好。该方法的特点是只需要简单的数... 用户浏览模式获取是现阶段Web日志挖掘的主要目标之一。该文根据用户浏览的重要特征,提出了一种应用粗糙集理论获取规则的方法。选取重要特征作为条件属性并通过算法实现获取最终规则,实例分析效果良好。该方法的特点是只需要简单的数据预处理但可以获得简洁有效的访问模式。 展开更多
关键词 web访问模式 粗糙集 数据挖掘
在线阅读 下载PDF
一种基于改进的AprioriAll算法的Web路径模式挖掘 被引量:4
19
作者 司应硕 杨世平 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期172-175,共4页
对路径模式挖掘的原理做了详细的阐述,并且针对挖掘对象的特性,对AprioriAll算法中生成侯选序列的函数做了相应的改进。最后通过实例说明了改进的AprioriAll算法在路径模式挖掘中的有效性。
关键词 路径模式挖掘 web数据挖掘 大引用序列 AprioriAll算法
在线阅读 下载PDF
Web使用挖掘技术分析 被引量:4
20
作者 李超锋 卢炎生 《计算机科学》 CSCD 北大核心 2006年第2期220-222,共3页
介绍了一种 Web 挖掘的分类,包括 Web 内容挖掘、Web 结构挖掘和 Web 使用挖掘。讨论了 Web 使用挖掘过程的三个步骤,即数据获取与数据预处理、模式发现和模式分析,详细分析了每一个步骤中所使用的技术。指出了目前 Web 使用挖掘研究存... 介绍了一种 Web 挖掘的分类,包括 Web 内容挖掘、Web 结构挖掘和 Web 使用挖掘。讨论了 Web 使用挖掘过程的三个步骤,即数据获取与数据预处理、模式发现和模式分析,详细分析了每一个步骤中所使用的技术。指出了目前 Web 使用挖掘研究存在的不足,给出了 Web 使用挖掘未来的研究方向。 展开更多
关键词 web使用挖掘 数据预处理 模式发现.模式分析
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部