期刊文献+
共找到374篇文章
< 1 2 19 >
每页显示 20 50 100
基于Web-Log Mining的Web文档聚类 被引量:29
1
作者 苏中 马少平 +1 位作者 杨强 张宏江 《软件学报》 EI CSCD 北大核心 2002年第1期99-104,共6页
速度和效果是聚类算法面临的两大问题.DBSCAN(density based spatial clustering of applications with noise)是典型的基于密度的一种聚类方法,对于大型数据库的聚类实验显示了它在速度上的优越性.提出了一种基于密度的递归聚类算法(re... 速度和效果是聚类算法面临的两大问题.DBSCAN(density based spatial clustering of applications with noise)是典型的基于密度的一种聚类方法,对于大型数据库的聚类实验显示了它在速度上的优越性.提出了一种基于密度的递归聚类算法(recursive density based clustering algorithm,简称RDBC),此算法可以智能地、动态地修改其密度参数.RDBC是基于DBSCAN的一种改进算法,其运算复杂度和DBSCAN相同.通过在Web文档上的聚类实验,结果表明,RDBC不但保留了DBSCAN高速度的优点,而且聚类效果大大优于DBSCAN. 展开更多
关键词 数据库 聚类 数据挖掘 web 文档 web-Logmining
在线阅读 下载PDF
基于Web-Log Mining的N元预测模型 被引量:14
2
作者 苏中 马少平 +1 位作者 杨强 张宏江 《软件学报》 EI CSCD 北大核心 2002年第1期136-141,共6页
随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请... 随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请求进行预测.这种模型会选择性地对用户可预测的请求进行预测,从而大大提高了预测精度.实验证明,在自然语言中普遍适用的N元预测模型同样适用于网页预测.同时,采用了一种有效的简化手段,大大压缩了模型的大小,使得5元模型和传统的2元模型大小基本相同,而预测精度提高了1倍.该结果可以广泛地运用到Web上,包括网页的预发送、预取、推荐以及Web上的caching机制.试验是建立在真实的Web日志上的,该算法无论在预测精度上还是在可适用度上都优于以往的算法. 展开更多
关键词 数据挖掘 INTERNET web-Logmining N元预测模型 网页
在线阅读 下载PDF
Web挖掘研究 被引量:34
3
作者 陈新中 李岩 +1 位作者 谢永红 杨炳儒 《计算机工程与应用》 CSCD 北大核心 2002年第13期42-44,共3页
Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间,为数据挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先概述了数据挖掘的概念、挖掘算法及其主要应用领域,然后结合Web数... Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间,为数据挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先概述了数据挖掘的概念、挖掘算法及其主要应用领域,然后结合Web数据的多样性、丰富和动态的超链接信息以及Web用户访问信息,详细阐述了Web内容挖掘、Web结构挖掘和Web用户访问信息挖掘的概念、定义、主要的挖掘算法及最新研究进展,文章最后介绍了Web挖掘的研究方向和发展趋势。 展开更多
关键词 数据挖掘 web 数据库 INTERNET 信息服务
在线阅读 下载PDF
Web使用模式研究中的数据挖掘 被引量:55
4
作者 张娥 冯秋红 +1 位作者 宣慧玉 田增瑞 《计算机应用研究》 CSCD 北大核心 2001年第3期80-83,共4页
Web使用模式挖掘是利用Web使用数据的高级手段,是对Web使用数据的深层次分析,从而挖掘出有效的、新颖的、潜在的、有用的及最终可以理解的知识,以帮助管理决策。综述了Web使用模式的数据挖掘研究技术的内容、现状和研究的方向。
关键词 数据挖掘 事务数据库 web 用户访问模式 INTERNET
在线阅读 下载PDF
Web挖掘研究综述 被引量:49
5
作者 涂承胜 鲁明羽 陆玉昌 《计算机工程与应用》 CSCD 北大核心 2003年第10期90-93,共4页
论文介绍了Web挖掘的概念,指出了Web挖掘中存在的问题,给出了Web挖掘研究的三种分类:Web内容挖掘、Web结构挖掘、Web使用挖掘,针对每一种分类介绍了各自的研究对象、表示方法、处理方法、应用领域及最近的研究情况,同时展望了Web挖掘的... 论文介绍了Web挖掘的概念,指出了Web挖掘中存在的问题,给出了Web挖掘研究的三种分类:Web内容挖掘、Web结构挖掘、Web使用挖掘,针对每一种分类介绍了各自的研究对象、表示方法、处理方法、应用领域及最近的研究情况,同时展望了Web挖掘的未来研究方向。 展开更多
关键词 web INTERNET 搜索引擎 信息检索 数据库 数据处理 数据挖掘
在线阅读 下载PDF
Web使用信息挖掘综述 被引量:50
6
作者 郭岩 白硕 于满泉 《计算机科学》 CSCD 北大核心 2005年第1期1-7,共7页
Web使用信息挖掘可以帮助我们更好地理解Web和Web用户访问模式,这对于开发Web的最大经济潜力是非常关键的。一般来说,Web使用信息挖掘包含三个阶段:数据预处理,模式发现和模式分析。文章以这三个阶段为框架,分别介绍了数据预处理的技术... Web使用信息挖掘可以帮助我们更好地理解Web和Web用户访问模式,这对于开发Web的最大经济潜力是非常关键的。一般来说,Web使用信息挖掘包含三个阶段:数据预处理,模式发现和模式分析。文章以这三个阶段为框架,分别介绍了数据预处理的技术与困难,Web使用信息挖掘中常用的方法和算法,以及主要应用。 展开更多
关键词 数据挖掘 web挖掘 web使用信息挖掘 web用户访问模式 数据预处理 模式发现
在线阅读 下载PDF
Web大数据环境下的不一致跨源数据发现 被引量:24
7
作者 余伟 李石君 +4 位作者 杨莎 胡亚慧 刘晶 丁永刚 王骞 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期295-308,共14页
Web中不同数据源之间的数据不一致是一个普遍存在的问题,严重影响了互联网的可信度和质量.目前数据不一致的研究主要集中在传统数据库应用中,对于种类多样、结构复杂、快速变化、数量庞大的跨源Web大数据的一致性研究还很少.针对跨源We... Web中不同数据源之间的数据不一致是一个普遍存在的问题,严重影响了互联网的可信度和质量.目前数据不一致的研究主要集中在传统数据库应用中,对于种类多样、结构复杂、快速变化、数量庞大的跨源Web大数据的一致性研究还很少.针对跨源Web数据的多源异构特性和Web大数据的5V特征,将从站点结构、特征数据和知识规则3个方面建立统一数据抽取算法和Web对象数据模型;研究不同类型的Web数据不一致特征,建立不一致分类模型、一致性约束机制和不一致推理代数运算系统;从而在跨源Web数据一致性理论体系的基础上,实现通过约束规则检测、统计偏移分析的Web不一致数据自动发现方法,并结合这两种方法的特点,基于Hadoop MapReduce架构提出了基于层次概率判定的Web不一致数据的自动发现算法.该框架在Hadoop平台上对多个B2C电子商务大数据进行实验,并与传统架构和其他方法进行了比较,实验结果证明该方法具有良好的精确性和高效性. 展开更多
关键词 web大数据 web数据挖掘 数据一致性 web数据管理 数据质量评估 跨源数据分析
在线阅读 下载PDF
Web日志挖掘中的数据预处理的研究 被引量:57
8
作者 陆丽娜 杨怡玲 +1 位作者 管旭东 魏恒义 《计算机工程》 EI CAS CSCD 北大核心 2000年第4期66-67,72,共3页
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的... 为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。 展开更多
关键词 数据挖掘 web 日志挖掘 数据预处理 数据库
在线阅读 下载PDF
Web数据挖掘 被引量:120
9
作者 王实 高文 李锦涛 《计算机科学》 CSCD 北大核心 2000年第4期28-31,41,共5页
1 引言当前WWW正在深度和广度方面飞速地发展着,Internet也正在前所未有地改变我们的生活。WWW上的一些主要工作,例如Web站点设计、Web服务设计、Web站点的导航设计、电子商务等工作正变得越来越复杂和越来越繁重。从站点经营方来说,他... 1 引言当前WWW正在深度和广度方面飞速地发展着,Internet也正在前所未有地改变我们的生活。WWW上的一些主要工作,例如Web站点设计、Web服务设计、Web站点的导航设计、电子商务等工作正变得越来越复杂和越来越繁重。从站点经营方来说,他们需要好的自动辅助设计工具,可以根据用户的访问兴趣、访问频度、访问时间动态地调整页面结构,改进服务,开展有针对性的电子商务以更好地满足访问者的需求。从访问者来说,他们希望看到的是个性化的页面。 展开更多
关键词 电子商务 数据挖掘 数据库 web
在线阅读 下载PDF
Web日志挖掘中的数据预处理技术研究 被引量:62
10
作者 赵伟 何丕廉 +1 位作者 陈霞 谢振亮 《计算机应用》 CSCD 北大核心 2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词 数据挖掘 web日志挖掘 数据预处理
在线阅读 下载PDF
Web日志挖掘技术进展 被引量:17
11
作者 陈新中 李岩 +2 位作者 杨炳儒 谢永红 张运涛 《系统工程与电子技术》 EI CSCD 北大核心 2003年第4期492-495,共4页
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方... 用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。 展开更多
关键词 ai 万维网 web挖掘 web日志挖掘
在线阅读 下载PDF
Web使用挖掘:从Web数据中发现用户使用模式 被引量:21
12
作者 陈恩红 徐涌 王煦法 《计算机科学》 CSCD 北大核心 2001年第5期85-88,共4页
1. 引言 在Web(因特网)上进行交易具有简易、快速、高效等特点,基于Web的电子商务正以飞快的速度发展着.尤其是面向最终用户的B2C模式的电子商务,正面临着一场革命性的改变.最新的技术已能够追踪用户的浏览行为,这就使得商家有能力为每... 1. 引言 在Web(因特网)上进行交易具有简易、快速、高效等特点,基于Web的电子商务正以飞快的速度发展着.尤其是面向最终用户的B2C模式的电子商务,正面临着一场革命性的改变.最新的技术已能够追踪用户的浏览行为,这就使得商家有能力为每个用户定制个性化的产品,从而出现大规模定(mass customization)的现象.以上所描述的还只是Web使用挖掘(Web Usage Mining)的一种具体应用. 展开更多
关键词 web 数据库 知识发现 数据挖掘 用户使用模式
在线阅读 下载PDF
KDW综述:基于Web的数据挖掘 被引量:19
13
作者 恽爽 韩立新 +1 位作者 董浚 陈道蓄 《计算机工程》 CAS CSCD 北大核心 2003年第1期284-286,共3页
由于Web数据所具有的半结构化特征,基于Web的数据挖掘与传统的基于数据库的数据挖掘有许多不同之处。基于Web的数据挖掘主要包括3种数据挖掘任务:对Web内容的挖掘,对Web结构的挖掘和对Web访问的挖掘。该文综述了基于Web的数据挖掘技... 由于Web数据所具有的半结构化特征,基于Web的数据挖掘与传统的基于数据库的数据挖掘有许多不同之处。基于Web的数据挖掘主要包括3种数据挖掘任务:对Web内容的挖掘,对Web结构的挖掘和对Web访问的挖掘。该文综述了基于Web的数据挖掘技术,并介绍了国内在这个领域的研究现状。 展开更多
关键词 KDW web 数据挖掘 知识获取 半结构化数据 数据库
在线阅读 下载PDF
一种Web用户行为聚类算法 被引量:20
14
作者 业宁 李威 +1 位作者 梁作鹏 董逸生 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1364-1367,共4页
提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法... 提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 . 展开更多
关键词 web日志 数据挖掘 聚类 相似度
在线阅读 下载PDF
电子商务与Web数据挖掘 被引量:47
15
作者 邹显春 谢中 周彦晖 《计算机应用》 CSCD 北大核心 2001年第5期21-23,共3页
在电子商务中 ,运用数据挖掘技术对服务器上的日志文件等Web数据进行客户访问信息的Web数据挖掘 ,了解客户的访问行为 ,从而调整站点结构、市场策略等 ,使电子商务活动具有针对性。
关键词 电子商务 INTERNET web 数据挖掘 数据源
在线阅读 下载PDF
Web日志中挖掘用户浏览模式的研究 被引量:34
16
作者 施建生 伍卫国 +2 位作者 陆丽娜 Yang Yiling 杨怡玲 《西安交通大学学报》 EI CAS CSCD 北大核心 2001年第6期621-624,共4页
研究了Web日志挖掘的机理 ,提出了使用频繁遍历路径作为用户浏览模式 ,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上 ,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法 ,该算法能够正确、快速地从Web... 研究了Web日志挖掘的机理 ,提出了使用频繁遍历路径作为用户浏览模式 ,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上 ,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法 ,该算法能够正确、快速地从Web日志中抽取频繁遍历路径 . 展开更多
关键词 数据挖掘 web挖掘 用户浏览模式
在线阅读 下载PDF
Web数据挖掘中的增量挖掘 被引量:8
17
作者 何炎祥 陈 伟 +1 位作者 孔维强 张 戈 《计算机工程》 CAS CSCD 北大核心 2002年第4期67-69,共3页
为了高效及时地处理频繁新增的数据,在Web挖掘中引入增量挖掘的方法,并给出了一个Web关联规则增量挖掘的有效算法。
关键词 数据挖掘 web 增量挖掘 关联规则 数据库 INTERNET
在线阅读 下载PDF
一个简单的Web日志挖掘系统 被引量:22
18
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 web日志挖掘 序列模式识别 SWLMS
在线阅读 下载PDF
Web数据挖掘技术及实现 被引量:11
19
作者 王泽彬 金飞 +1 位作者 李夏 王冠 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第10期1403-1405,共3页
在介绍W eb数据挖掘的概念、内涵基础上,探讨了如何在web上用分类器对异构与非结构化数据源进行数据抽取(IE),并建立统一的XML数据格式,进而用Reporting Services和W eb显示控件等技术进行数据挖掘和处理.
关键词 web数据挖掘 REPORTING SERVICES技术 web显示控件
在线阅读 下载PDF
面向电子商务的Web挖掘系统模型研究与应用 被引量:10
20
作者 程筱胜 廖文和 +1 位作者 田宏 薛善良 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2004年第3期322-326,共5页
研究了电子商务和 Web挖掘技术 ,提出了面向电子商务的 Web挖掘系统模型 ,该模型包括数据采集层、数据处理层、数据存储层、模式发现层、模式分析利用层和客户层六个层次。详细研究了系统的数据采集、数据处理、数据存储以及模式发现、... 研究了电子商务和 Web挖掘技术 ,提出了面向电子商务的 Web挖掘系统模型 ,该模型包括数据采集层、数据处理层、数据存储层、模式发现层、模式分析利用层和客户层六个层次。详细研究了系统的数据采集、数据处理、数据存储以及模式发现、模式分析利用。基于该模型开发了面向电子商务的 Web挖掘应用系统 。 展开更多
关键词 电子商务 数据挖掘 web挖掘 数据模型
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部