期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
蒙古文原始语料统计建模研究 被引量:1
1
作者 白双成 《中文信息学报》 CSCD 北大核心 2017年第1期118-125,共8页
蒙古文字符编码与字形之间的多对多复杂转换关系及录入不规范等众多原因导致原始语料存在严重的拼写多样化现象和字形拼写错误,成为大数据处理瓶颈。该文以蒙古文输入法为例,利用大词库和形码生成器,将原本基于读音正确的词晶格最佳路... 蒙古文字符编码与字形之间的多对多复杂转换关系及录入不规范等众多原因导致原始语料存在严重的拼写多样化现象和字形拼写错误,成为大数据处理瓶颈。该文以蒙古文输入法为例,利用大词库和形码生成器,将原本基于读音正确的词晶格最佳路径搜索问题转换为基于形码词晶格路径搜索问题,很好地解决了原始文本统计建模问题。实验结果证明,该方法及字形归并的模型优化方法可显著提高输入效率,对所有蒙古文"音词转换"和"形词转换"研究都有广泛的参考价值。 展开更多
关键词 蒙古文原始文本 统计建模 读音错误 字形错误 智能输入
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部