期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Web搜索结果多层聚类方法研究 被引量:1
1
作者 庞观松 蒋盛益 +2 位作者 张黎莎 区雄发 赖旭明 《情报学报》 CSSCI 北大核心 2011年第5期464-470,共7页
为了便于用户浏览搜索引擎返回结果,本文提出了一种基于TFIDF新的文本相似度计算方法,并提出使用具有近似线性时间复杂度的增量聚类算法对文本进行多层聚类的策略。同时,提出了一种从多文本中提取关键词的策略:提取簇中的名词或名词短... 为了便于用户浏览搜索引擎返回结果,本文提出了一种基于TFIDF新的文本相似度计算方法,并提出使用具有近似线性时间复杂度的增量聚类算法对文本进行多层聚类的策略。同时,提出了一种从多文本中提取关键词的策略:提取簇中的名词或名词短语作为候选关键词,综合考虑每个候选关键词的词频、出现位置、长度和文本长度设置加权函数来计算其权重,不需要人工干预以及语料库的协助,自动提取权重最大的候选关键词作为类别关键词。在收集的百度、ODP语料以及公开测试的实验结果表明本文提出方法的有效性。 展开更多
关键词 文本聚类 多层聚类 类别关键词提取 加权函数
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部