期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
文本相似性度量中参数相关性与优化配置研究
被引量:
11
1
作者
张祖平
徐昕
+1 位作者
龙军
袁鑫攀
《小型微型计算机系统》
CSCD
北大核心
2011年第5期983-988,共6页
针对文本相似性度量中的相似度阈值、准确率、召回率、shingle滑动窗口大小、shingle权重系数和文本属性等参数相互影响、关系复杂的问题,研究了这些参数之间的相关性,并结合实际应用需求,提出各参数可优化配置的建议,分析与设计了相似...
针对文本相似性度量中的相似度阈值、准确率、召回率、shingle滑动窗口大小、shingle权重系数和文本属性等参数相互影响、关系复杂的问题,研究了这些参数之间的相关性,并结合实际应用需求,提出各参数可优化配置的建议,分析与设计了相似度阈值可适应文本篇幅属性的相似性度量算法.通过某基金2009年的7378个项目申请书的比对分析,结果表明:提出的算法不但适用于大规模的文本集合,而且在短小的文本集合中进行相似性度量也具有很高的应用价值,其准确率和召回率均可高达95%以上.
展开更多
关键词
文本相似性度量
算法
邻接词组
参数相关性分析
召回率
在线阅读
下载PDF
职称材料
题名
文本相似性度量中参数相关性与优化配置研究
被引量:
11
1
作者
张祖平
徐昕
龙军
袁鑫攀
机构
中南大学信息科学与工程学院
出处
《小型微型计算机系统》
CSCD
北大核心
2011年第5期983-988,共6页
基金
国家自然科学基金项目(60873081
60970095
+1 种基金
M0921005)资助
湖南省自然(07JJ6122)资助
文摘
针对文本相似性度量中的相似度阈值、准确率、召回率、shingle滑动窗口大小、shingle权重系数和文本属性等参数相互影响、关系复杂的问题,研究了这些参数之间的相关性,并结合实际应用需求,提出各参数可优化配置的建议,分析与设计了相似度阈值可适应文本篇幅属性的相似性度量算法.通过某基金2009年的7378个项目申请书的比对分析,结果表明:提出的算法不但适用于大规模的文本集合,而且在短小的文本集合中进行相似性度量也具有很高的应用价值,其准确率和召回率均可高达95%以上.
关键词
文本相似性度量
算法
邻接词组
参数相关性分析
召回率
Keywords
text similarity measurement
algorithm
shingle
parameters correlation analysis
recall rate
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
文本相似性度量中参数相关性与优化配置研究
张祖平
徐昕
龙军
袁鑫攀
《小型微型计算机系统》
CSCD
北大核心
2011
11
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部