-
题名词间相关性在Web检索中的新应用
被引量:3
- 1
-
-
作者
王树梅
金澎
-
机构
南京理工大学计算机科学和技术系
乐山师范学院计算机科学和技术系
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第21期112-113,共2页
-
文摘
首先分析了以往信息检索中利用词间相关性的局限性,针对Internet检索对象是Web页面,具有篇幅较小的特点犤2犦,提出“主题关键词集合”的概念,利用词间相关性,通过计算用户查询词集合与网页主题关键词集合之间的距离,对检索结果重新排序。
-
关键词
WEB
信息检索
搜索引擎
词间相关性
主题关键词
INTERNET
-
Keywords
Set'(TKS),with the explore of the word's relationship,through calculate distance between the user's query and TKS,re-sort the result list.Keywords :Information Retrieval,Search Engine,Relevance Between Words,Topic Keyword
-
分类号
G354.4
[文化科学—情报学]
TP393.4
[自动化与计算机技术—计算机应用技术]
-
-
题名搜索引擎中的网页加权索引
被引量:1
- 2
-
-
作者
王树梅
金澎
吴慧中
-
机构
南京理工大学计算机科学与技术系
乐山师范学院计算机科学和技术系
-
出处
《情报学报》
CSSCI
北大核心
2003年第5期557-560,共4页
-
文摘
如何对索引词加权是信息检索中的一个关键技术.本文针对搜索引擎检索的对象是Web页面这一特点,通过分析HTML标签的修饰功能,结合传统的tf * idf加权公式,对网页进行加权索引.实验证明对于精确匹配,在查全率较低时系统的查准率有较大的提高.
-
关键词
搜索引擎
信息检索
索引词加权
HTML
网页加权索引
检索效率
-
分类号
G354.4
[文化科学—情报学]
TP393.4
[自动化与计算机技术—计算机应用技术]
-