摘要
Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间,为数据挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先概述了数据挖掘的概念、挖掘算法及其主要应用领域,然后结合Web数据的多样性、丰富和动态的超链接信息以及Web用户访问信息,详细阐述了Web内容挖掘、Web结构挖掘和Web用户访问信息挖掘的概念、定义、主要的挖掘算法及最新研究进展,文章最后介绍了Web挖掘的研究方向和发展趋势。
W it h the rapid development of Internet,the World Wide Web(WWW)has already becom e a huge global service center with widely -distributed and large quantities o f hidden information i.e.,a fertile area for data mining research.Taking thi s as a starting point ,this paper argues and introduces the definition,algorit hms and application of data mining technology in a summing-up way.Then,the c onception,definition,and main research course of current Web content mining ,Web structure mining and Web usage mining are introduced in conjunction with v ariety of Web data,rich and dynamic collection of hyperlink information and Web usage information.At the end,the trend and research course concerning the We b mining is concluded.
出处
《计算机工程与应用》
CSCD
北大核心
2002年第13期42-44,共3页
Computer Engineering and Applications
基金
国家自然科学基金重点项目(编号:698350010)
教育部科技重点项目(编号:教技司[2000]175)