-
题名Web搜索中的数据挖掘技术研究
被引量:4
- 1
-
-
作者
耿桦
李媛
朱炜
潘金贵
-
机构
南京大学计算机软件新技术国家重点实验室
南京大学多媒体技术研究所
-
出处
《计算机科学》
CSCD
北大核心
2005年第4期37-41,共5页
-
文摘
WWW已经成为世界上是大的分布式信息系统,如何快速有效地搜索用户所需的资源一直是研究热点。Web挖掘也已经成为数据挖掘中相对成熟的一个分支。本文针对Web资源搜索中利用的相关Web挖掘技术做一个综述。文章首先对目前流行的Web内容挖掘方面的常用技术进行了研究分析,然后着重研究了Web结构挖掘技术,介绍并评价了多种算法模型。接着介绍了用户使用的挖掘,并提出了Web内容挖掘技术,结构挖掘技术和用户使用挖掘相结合,应用于开发智能型搜索引擎的趋势。
-
关键词
数据挖掘技术
web搜索
分布式信息系统
web挖掘技术
web内容挖掘
web结构
研究热点
资源搜索
研究分析
算法模型
搜索引擎
WWW
用户
智能型
-
Keywords
web mining
Hyperlink
Hypertext
PageRank
HITS
Search engine
-
分类号
TP311.131
[自动化与计算机技术—计算机软件与理论]
F270.7
[经济管理—企业管理]
-
-
题名同构化信息温度与热点发现应用初探
- 2
-
-
作者
周启海
黄涛
张元新
吴红玉
-
机构
西南财经大学经济信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2007年第11期113-117,共5页
-
文摘
本文对信息在生活中的受关注程度进行研究,给出了一种度量信息重要性的标尺——同构化信息温度,并将它与计算机、互联网技术相结合,分别构造了单文本热点挖掘系统、文本数据库热点挖掘系统和Web网页热点挖掘系统模型框架。
-
关键词
同构化信息温度
单文本热点挖掘系统
文本数据库的热点挖掘系统
web网页热点挖掘系统
-
Keywords
Isomorphic information temperature, One text focus mining system, Text-base focus mining system, web page focus mining system
-
分类号
TP311.135
[自动化与计算机技术—计算机软件与理论]
-