期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
汉语-印尼语平行语料自动对齐方法研究 被引量:6
1
作者 郑铿涛 林楠铠 +2 位作者 付颖雯 王连喜 蒋盛益 《广西师范大学学报(自然科学版)》 CAS 北大核心 2019年第1期89-97,共9页
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对... 双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对齐方法,并在此基础上采用基于置信区间的长度模型实现句子对齐,同时,为了快速提高汉语-印尼语平行语料库的构建效率,还提出了基于跨语言文档相似度的可比语料提取方法。实验结果表明,本文提出的平行语料对齐方法和可比语料提取方法的准确率较传统方法有显著的提高,说明本文提出方法是有效的、可行的。 展开更多
关键词 平行语料 语料库构建 可比语料 段落对齐 句对齐
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部