-
题名大规模中文搜索引擎的架构和设计技术
被引量:5
- 1
-
-
作者
王剑
邵志清
-
机构
华东理工大学计算机科学与工程系
-
出处
《计算机科学》
CSCD
北大核心
2002年第1期26-29,共4页
-
文摘
信息检索技术已经发展了多年.然而,随着WWw的发展,网络信息空前膨胀.据2000年2月份统计,可索引的网页己达到10亿,而且每天以几百万速度递增.2000年6月份,索引的网页达到20亿[1].
-
关键词
计算机网络
中文搜索引擎
设计
网页
信息检索
-
Keywords
Information retrieval, search engine, ranking of web pages , Index, Chinese segmentation
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
G354.4
[文化科学—情报学]
-
-
题名基于分块和净化的搜索引擎排序算法
被引量:1
- 2
-
-
作者
姜楚江
余轶军
-
机构
浙江省行政首脑机关信息中心
浙江省国税局
-
出处
《计算机工程与应用》
CSCD
2012年第1期173-175,179,共4页
-
基金
高等学校博士学科点专项科研基金(No.20020335020)
浙江省自然科学基金(No.M603230)
-
文摘
展开了对互联网搜索引擎结果集的智能排序研究,提出了一种基于扩展网页质量和VIPS分块算法的智能网页排序算法,并对结果进行净化处理以及查询优化。实验结果表明研究提出的新算法提高了推荐精度。
-
关键词
搜索引擎
排序算法
网页分块
净化处理
-
Keywords
search engine ranking algorithm web page segmentation purify
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-