期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于维基百科的未登录词译文挖掘 被引量:2
1
作者 孙常龙 洪宇 +2 位作者 葛运东 姚建民 朱巧明 《计算机研究与发展》 EI CSCD 北大核心 2011年第6期1067-1076,共10页
未登录词(out of vocabulary,OOV)的查询翻译是影响跨语言信息检索(cross-language information retrieval,CLIR)性能的关键因素之一.它根据维基百科(Wikipedia)的数据结构和语言特性,将译文环境划分为目标存在环境和目标缺失环境.针对... 未登录词(out of vocabulary,OOV)的查询翻译是影响跨语言信息检索(cross-language information retrieval,CLIR)性能的关键因素之一.它根据维基百科(Wikipedia)的数据结构和语言特性,将译文环境划分为目标存在环境和目标缺失环境.针对目标缺失环境下的译文挖掘难点,它采用频度变化信息和邻接信息实现候选单元抽取,并建立基于频度-距离模型、表层匹配模板和摘要得分模型的混合译文挖掘策略.实验将基于搜索引擎的未登录词挖掘技术作为baseline,并采用TOP1进行评测.实验验证基于维基百科的混合译文挖掘方法可达到0.6822的译文正确率,相对baseline取得6.98%的改进. 展开更多
关键词 未登录词 维基百科 跨语言信息检索 译文挖掘 目标缺失环境
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部