期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
领域专有平行语料库的敏捷构建方法
1
作者 李铭 张克亮 《厦门大学学报(自然科学版)》 北大核心 2025年第4期586-596,共11页
[目的]针对领域平行语料库数量不足,构建困难的问题,研究能够敏捷构建满足垂直领域模型训练要求的领域平行语料库的方法.[方法]在构建的通用大规模跨领域平行语料库的基础上提出了领域专有平行语料库的自动构建方法.该方法结合语言学理... [目的]针对领域平行语料库数量不足,构建困难的问题,研究能够敏捷构建满足垂直领域模型训练要求的领域平行语料库的方法.[方法]在构建的通用大规模跨领域平行语料库的基础上提出了领域专有平行语料库的自动构建方法.该方法结合语言学理论概念层次网络与词向量模型构建目标领域核心词汇,并依此抽取目标领域平行句对,从而实现领域专有平行语料库敏捷构建.[结果]以军事领域为例,进行领域专有平行语料库构建与领域机器翻译的测试结果表明:相较于使用关键词对比、预训练模型与语言大模型等方法,本文方法所构建的领域平行语料库具有更高的F_(1)值.使用该方法生成语料所训练的机器翻译模型在该领域的翻译结果相比于上述方法与商业翻译引擎具有更高的双语互译评估(BLEU)值.[结论]本文所提方法能够有效复用现有的高质量开源语料资源,并在数小时之内完成最贴合目标领域的平行语料库的构建,从而提升领域机器翻译的效果. 展开更多
关键词 领域专有平行语料库 概念层次网络 句对抽取算法 语义距离计算
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部