期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于统计学习框架的中文新词检测方法 被引量:10
1
作者 张海军 栾静 +1 位作者 李勇 齐向伟 《计算机科学》 CSCD 北大核心 2012年第2期232-235,共4页
新词自动检测是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来了巨大困难。提出一种新词检测的形式化描述模型,用以建立特征和新词检测结果之间的统计联系。在此基础上提出应用统计学习模型作为框架来整合不同类型的... 新词自动检测是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来了巨大困难。提出一种新词检测的形式化描述模型,用以建立特征和新词检测结果之间的统计联系。在此基础上提出应用统计学习模型作为框架来整合不同类型的可用特征,以充分发挥特征之间的组合作用,进一步改善新词检测效果。实验表明,统计框架方法的性能明显地优于特征的简单叠加,能有效提高新词检测效果,开放实验和封闭实验的F值分别为49.72%和69.83%,达到了目前的较好水平。 展开更多
关键词 统计框架 新词检测 重复模式 语言知识特征 统计特征
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部