-
题名“天网”目录导航服务研究
被引量:8
- 1
-
-
作者
冯是聪
单松巍
龚笔宏
张志刚
李晓明
-
机构
北京大学计算机科学技术系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第4期653-659,共7页
-
基金
国家"九七三"重点基础研究发展规化基金项目 (G19990 3 2 70 6)
-
文摘
为了提高搜索引擎的查准率 ,帮助用户快速地定位其感兴趣的网页 ,研究了如何在Spider式搜索引擎“天网”系统中提供目录导航服务 基本思想就是利用有指导的机器学习方法实现中文网页的自动分类 主要贡献有两点 :①搜集并建立了一个面向中文网页并且支持层次模型的大规模中文网页数据集 ,这是实现中文网页自动分类的前提和基础 ;②针对中文网页信息的自身特性以及CHI方法的固有缺陷 ,提出一种自动清除“噪音”的特征选取算法 ,并实现了一个能够处理海量中文网页的分类器 实验结果表明该分类器有较高的分类质量 。
-
关键词
搜索引擎
目录导航
web挖掘
中文网页分类
-
Keywords
search engine
directory navigation
web mining
chinese web page classification
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名中英文专业搜索引擎中数据采集加工的设计与实现
被引量:5
- 2
-
-
作者
刘峰
王秀坤
杨南海
马霖
-
机构
大连理工大学计算机系
-
出处
《计算机应用研究》
CSCD
北大核心
2004年第10期155-157,161,共4页
-
基金
国家科技部"973"预研基金资助项目(2001CCA00700)
-
文摘
阐述了一个中英文专业Web搜索引擎数据采集加工的通用设计与实现方法,并着重介绍了具体实现中一些关键技术问题的处理(以Java为例)。
-
关键词
搜索引擎
ROBOT
自动分类
特征提取
中文分词
-
Keywords
search engine
Robot
automatic classification
Feature Selection
chinese Segmentation
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名中文自动分类在搜索引擎中的应用研究
被引量:2
- 3
-
-
作者
李红宇
刘庆江
-
机构
哈尔滨师范大学阿城学院计算机与信息系
-
出处
《计算机科学》
CSCD
北大核心
2008年第5期292-293,297,共3页
-
文摘
为了提高搜索引擎的查准率,帮助用户快速地定位其感兴趣的网页,可应用中文网页自动分类技术,实现快速准确的搜索引擎系统,使其具有较高的查准率。
-
关键词
中文自动分类
搜索引擎
web挖掘
网页
-
Keywords
chinese automatic classification, search engine,web mining
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-