期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
文本相似性度量中参数相关性与优化配置研究 被引量:11
1
作者 张祖平 徐昕 +1 位作者 龙军 袁鑫攀 《小型微型计算机系统》 CSCD 北大核心 2011年第5期983-988,共6页
针对文本相似性度量中的相似度阈值、准确率、召回率、shingle滑动窗口大小、shingle权重系数和文本属性等参数相互影响、关系复杂的问题,研究了这些参数之间的相关性,并结合实际应用需求,提出各参数可优化配置的建议,分析与设计了相似... 针对文本相似性度量中的相似度阈值、准确率、召回率、shingle滑动窗口大小、shingle权重系数和文本属性等参数相互影响、关系复杂的问题,研究了这些参数之间的相关性,并结合实际应用需求,提出各参数可优化配置的建议,分析与设计了相似度阈值可适应文本篇幅属性的相似性度量算法.通过某基金2009年的7378个项目申请书的比对分析,结果表明:提出的算法不但适用于大规模的文本集合,而且在短小的文本集合中进行相似性度量也具有很高的应用价值,其准确率和召回率均可高达95%以上. 展开更多
关键词 文本相似性度量 算法 邻接词组 参数相关性分析 召回率
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部