期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
Web日志挖掘中的数据预处理技术研究 被引量:62
1
作者 赵伟 何丕廉 +1 位作者 陈霞 谢振亮 《计算机应用》 CSCD 北大核心 2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词 数据挖掘 web日志挖掘 数据预处理
在线阅读 下载PDF
一个简单的Web日志挖掘系统 被引量:22
2
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 web日志挖掘 序列模式识别 SWLMS
在线阅读 下载PDF
Web日志挖掘技术进展 被引量:17
3
作者 陈新中 李岩 +2 位作者 杨炳儒 谢永红 张运涛 《系统工程与电子技术》 EI CSCD 北大核心 2003年第4期492-495,共4页
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方... 用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。 展开更多
关键词 AI 万维网 web挖掘 web日志挖掘
在线阅读 下载PDF
结合网站内容和结构进行的Web日志挖掘 被引量:9
4
作者 江宝林 申展 +2 位作者 张川 葛家翔 胡运发 《计算机工程》 CAS CSCD 北大核心 2004年第16期30-32,共3页
提出一种以聚类为基础的Web日志挖掘方法:从Web日志事务、Web站点内容和Web站点结构3个不同方面来聚类页面集合,并通过将用户的访问记录和页面聚集进行匹配和相关度计算,来预测用户感兴趣的页面。
关键词 web日志挖掘 web日志事务 访问模式 聚类
在线阅读 下载PDF
Web日志挖掘中数据预处理的研究 被引量:20
5
作者 赵红玲 宋瀚涛 +1 位作者 牛振东 刘桂山 《计算机应用研究》 CSCD 北大核心 2005年第6期67-69,共3页
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词 数据挖掘 web日志挖掘 数据预处理
在线阅读 下载PDF
Web日志挖掘中的数据预处理技术 被引量:22
6
作者 李燕 冯博琴 鲁晓锋 《计算机工程》 CAS CSCD 北大核心 2009年第22期44-46,49,共4页
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中... 数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。 展开更多
关键词 web日志挖掘 数据预处理 用户会话识别 路径补充
在线阅读 下载PDF
Web日志挖掘技术的研究与应用 被引量:21
7
作者 肖立英 李建华 谭立球 《计算机工程》 CAS CSCD 北大核心 2002年第7期276-277,284,共3页
介绍了目前世界上两种主要的日志挖掘技术基于事务和基于数据立方体。同时,提出了一个基于日志挖掘技术的应Web (Web)Web用,即用户自适应的站点,介绍了这一系统的实现方法和主要特色。
关键词 web日志挖掘 数据挖掘 数据库 数据立方体
在线阅读 下载PDF
基于Hadoop的Web日志挖掘 被引量:64
8
作者 程苗 陈华平 《计算机工程》 CAS CSCD 北大核心 2011年第11期37-39,共3页
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。... 基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。为进一步验证该平台的高效性,在该平台上利用改进后的算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,在集群中运用分布式算法处理大量的Web日志文件,可以明显提高Web数据挖掘的效率。 展开更多
关键词 云计算 Hadoop架构 Map/Reduce编程模式 web日志挖掘 遗传算法 偏爱访问路径
在线阅读 下载PDF
Web日志挖掘中的用户序列模式识别 被引量:6
9
作者 李明星 衡萍 +1 位作者 董沛武 陈健 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第11期1570-1572,1602,共4页
为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的... 为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性. 展开更多
关键词 web日志挖掘 阈值 序列模式识别 IA^x算法
在线阅读 下载PDF
一种适用于Web日志挖掘的关联规则发现算法 被引量:7
10
作者 栾汝朋 张倩 +2 位作者 张峻峰 于峰 刘新 《计算机应用与软件》 CSCD 北大核心 2013年第1期114-116,225,共4页
Apriori算法是一种经典的关联规则发现算法。针对Web日志挖掘的特点,在Apriori算法基础上给出一种适用于动态事务数据库挖掘的关联规则发现算法,并对比该算法与Apriori算法的区别。将该算法应用到网站的日志挖掘中,实验证明该算法的性... Apriori算法是一种经典的关联规则发现算法。针对Web日志挖掘的特点,在Apriori算法基础上给出一种适用于动态事务数据库挖掘的关联规则发现算法,并对比该算法与Apriori算法的区别。将该算法应用到网站的日志挖掘中,实验证明该算法的性能较原算法有一定的提高。 展开更多
关键词 web日志挖掘 关联分析 APRIORI算法
在线阅读 下载PDF
基于Web日志挖掘的网页推荐方法 被引量:4
11
作者 解男男 胡亮 +2 位作者 努尔布力 樊丽 印晓天 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2013年第2期267-272,共6页
针对传统单纯聚类算法实现网页推荐精确度欠缺的问题,提出一种基于Web日志挖掘的个性化网页推荐模型,并实现了相应的网页推荐算法,算法结合聚类分析和关联规则挖掘,能有效实现网页推荐.实验结果表明,在保障网页页面推荐覆盖率的条件下,... 针对传统单纯聚类算法实现网页推荐精确度欠缺的问题,提出一种基于Web日志挖掘的个性化网页推荐模型,并实现了相应的网页推荐算法,算法结合聚类分析和关联规则挖掘,能有效实现网页推荐.实验结果表明,在保障网页页面推荐覆盖率的条件下,该方法有较高的精确度、有效性和实用性. 展开更多
关键词 网页推荐 模糊聚类 关联规则挖掘 web日志挖掘
在线阅读 下载PDF
Web日志挖掘中数据预处理技术的研究 被引量:19
12
作者 马瑞民 李向云 《计算机工程与设计》 CSCD 北大核心 2007年第10期2358-2360,共3页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访... 在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。 展开更多
关键词 web日志挖掘 数据预处理 路径补充 访问序列 访问事务
在线阅读 下载PDF
基于Hadoop的并行PSO-kmeans算法实现Web日志挖掘 被引量:13
13
作者 马汉达 郝晓宇 马仁庆 《计算机科学》 CSCD 北大核心 2015年第S1期470-473,共4页
互联网技术的迅速发展,使得基于单一结点的Web日志挖掘变得十分困难,而Hadoop云平台的出现,为这类问题提供了新的解决方案。但传统的Web日志挖掘聚类k-means算法对初始聚类中心的选择敏感等缺点,容易影响聚类准确率。针对这个问题,提出... 互联网技术的迅速发展,使得基于单一结点的Web日志挖掘变得十分困难,而Hadoop云平台的出现,为这类问题提供了新的解决方案。但传统的Web日志挖掘聚类k-means算法对初始聚类中心的选择敏感等缺点,容易影响聚类准确率。针对这个问题,提出基于粒子群算法(PSO)的k-means算法,使得k-means算法不受初始聚类中心的影响,并且在Hadoop平台上实现了算法的MapReduce编程。实验结果证明:提出的改进算法,与传统的k-means算法相比,具有更高的聚类准确率;与串行单机算法相比,运行效率也有很大的提升。 展开更多
关键词 HADOOP K-MEANS PSO MAPREDUCE web日志挖掘
在线阅读 下载PDF
基于模糊聚类的Web日志挖掘 被引量:13
14
作者 李桂英 李吉桂 《计算机科学》 CSCD 北大核心 2004年第12期130-131,153,共3页
本文使用模糊聚类的方法对Web日志进行数据挖掘,实现用户聚类和页面聚类,并设计与实现了一个基于模糊聚类的Web日志挖掘系统。
关键词 web日志挖掘 行数据 页面 模糊聚类 用户 系统 设计
在线阅读 下载PDF
基于MapReduce的Web日志挖掘 被引量:15
15
作者 李彬 刘莉莉 《计算机工程与应用》 CSCD 2012年第22期95-98,共4页
针对单一CPU节点的Web数据挖掘系统在挖掘Web海量数据源时存在的计算瓶颈问题,利用云计算的分布式处理和虚拟化技术优势以及蚁群算法并行性的优点,设计一种基于Map/Reduce架构的Web日志挖掘算法。为进一步验证该算法的高效性,通过搭建Ha... 针对单一CPU节点的Web数据挖掘系统在挖掘Web海量数据源时存在的计算瓶颈问题,利用云计算的分布式处理和虚拟化技术优势以及蚁群算法并行性的优点,设计一种基于Map/Reduce架构的Web日志挖掘算法。为进一步验证该算法的高效性,通过搭建Hadoop平台,利用该算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,充分利用了集群系统的分布式计算能力处理大量的Web日志文件,可以大大地提高Web数据挖掘的效率。 展开更多
关键词 云计算 MAP/REDUCE HADOOP平台 web日志挖掘 蚁群算法
在线阅读 下载PDF
基于用户访问树的Web日志挖掘数据预处理 被引量:8
16
作者 刘加伶 范军 《计算机科学》 CSCD 北大核心 2009年第9期154-156,210,共4页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果。提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以... 在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果。提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理。 展开更多
关键词 web日志挖掘 数据预处理 用户识别 事务识别
在线阅读 下载PDF
Web日志挖掘在农业网站的应用 被引量:3
17
作者 赵文忠 张长利 房俊龙 《东北农业大学学报》 CAS CSCD 北大核心 2010年第8期135-140,共6页
在农业网站日志挖掘知识的基础上,重点对运行8年的东北农业大学农业专家在线网站进行Web日志挖掘研究,对运行以来积累的海量Web日志数据进行有效的预处理,并采用SAS数据挖掘模块对日志数据进行关联规则挖掘、链接分析,利用挖掘的结果对... 在农业网站日志挖掘知识的基础上,重点对运行8年的东北农业大学农业专家在线网站进行Web日志挖掘研究,对运行以来积累的海量Web日志数据进行有效的预处理,并采用SAS数据挖掘模块对日志数据进行关联规则挖掘、链接分析,利用挖掘的结果对网站信息构建合理性进行评估及改造,逐渐在个性化服务、改进系统性能、站点内容修改、商业智能等方面提供科学的理论基础,使之成为中国最大的农业免费咨询类网站,而且可以利用结论对其他农业信息系统的构建及运行等方面提供一定的借鉴作用,从而推动我国农业信息化进程。 展开更多
关键词 web日志挖掘 信息构建 农业网站 农业专家在线
在线阅读 下载PDF
基于SVM的Web日志挖掘及潜在客户发现 被引量:8
18
作者 过蓓蓓 方兆本 《管理工程学报》 CSSCI 北大核心 2010年第1期129-133,共5页
潜在的客户资源是商家未来的利润来源,发现了潜在的客户就可以制定相应的商业决策,并进行有针对性的客户关系管理。使用SVM方法对web日志文件进行挖掘,以发现站点访问者中潜在客户的共同行为模式,并将其分为不同级别的目标客户群。同时... 潜在的客户资源是商家未来的利润来源,发现了潜在的客户就可以制定相应的商业决策,并进行有针对性的客户关系管理。使用SVM方法对web日志文件进行挖掘,以发现站点访问者中潜在客户的共同行为模式,并将其分为不同级别的目标客户群。同时,通过试验4种不同比例的训练样本,研究了非对称数据对分类结果的影响,以期获得较优的模型。 展开更多
关键词 支持向量机 web日志挖掘 潜在客户
在线阅读 下载PDF
Web日志挖掘中数据预处理方法研究 被引量:3
19
作者 陈红丽 李春生 张明 《科学技术与工程》 北大核心 2012年第8期1928-1930,1935,共4页
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。分析了数据预处理的主要过程,并用站点首页结合动态时间阈值的方法对会话识别进行了改进。实验结果表明,改进后的会话识别方法能更有效地识别出用户的... 数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。分析了数据预处理的主要过程,并用站点首页结合动态时间阈值的方法对会话识别进行了改进。实验结果表明,改进后的会话识别方法能更有效地识别出用户的真实会话。 展开更多
关键词 数据预处理 会话识别 web日志挖掘
在线阅读 下载PDF
基于Web日志挖掘技术的农业信息网站构建 被引量:2
20
作者 孙福振 李艳 李业刚 《安徽农业科学》 CAS 北大核心 2009年第33期16676-16677,共2页
详细介绍了Web日志挖掘技术,并提出一个基于Web日志挖掘的应用模型,以期为指导农业信息网站的改进和构建提供科学指导。
关键词 web日志挖掘 农业网站 农业信息
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部