期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
DF还是IDF?主特征模型在Web信息检索中的使用 被引量:13
1
作者 张敏 马少平 宋睿华 《软件学报》 EI CSCD 北大核心 2005年第5期1012-1020,共9页
Web信息检索的难点之一就是简短、模糊的用户查询与存在大量冗余和噪声的文档之间的不匹配.对Web文档信息特征进行分析,提出Web文档主特征词、主特征域和主特征空间的概念,在该空间上使用文档频度DF(document frequency)信息而非传统意... Web信息检索的难点之一就是简短、模糊的用户查询与存在大量冗余和噪声的文档之间的不匹配.对Web文档信息特征进行分析,提出Web文档主特征词、主特征域和主特征空间的概念,在该空间上使用文档频度DF(document frequency)信息而非传统意义上的IDF(inverse document frequency)信息进行权值计算,并给出一个改进的相似度计算模型.使用该模型在10G和19G的两个大规模Web文档集合上进行了3组标准测试.比较实验表明,与传统IDF思想相比,在各项评价指标上,DF相关的主特征权值计算方法都能始终较大幅度地提高系统性能,最大达到18.6%的性能改善. 展开更多
关键词 WEB信息检索 主特征模型 权值计算 文档频度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部