期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融入置信度的文本图像翻译研究
1
作者 伍凌辉 马聪 +3 位作者 周玉 韩旭 赵阳 张亚萍 《中文信息学报》 CSCD 北大核心 2024年第12期64-73,共10页
文本图像翻译旨在将嵌在图像中的源端语言文本翻译成目标语言。文本图像翻译系统通常由相互独立的光学字符识别(Optical Character Recognition,OCR)和机器翻译(Machine Translation,MT)模型级联组成。OCR模型将文本图像识别成转录文本... 文本图像翻译旨在将嵌在图像中的源端语言文本翻译成目标语言。文本图像翻译系统通常由相互独立的光学字符识别(Optical Character Recognition,OCR)和机器翻译(Machine Translation,MT)模型级联组成。OCR模型将文本图像识别成转录文本,MT模型将转录文本翻译成目标语言。由于OCR模型转录文本存在噪声,而MT模型对噪声文本表现不佳,文本图像翻译系统性能远不如纯文本机器翻译系统。为缓解噪声文本带来的问题,鲁棒性机器翻译主要采用以下两种方法:(1)使用合成噪声文本,以模拟OCR转录带来的噪声;(2)利用干净文本和噪声文本的对比学习,拉近噪声文本和干净文本的分布。未能考虑以下问题:(1)忽视来自OCR模型的置信度信息,未能考虑OCR和MT系统的有效融合;(2)仅采用合成噪声,类型单一,无法覆盖实际噪声类型;(3)仅采用句子粒度的粗粒度对比损失,忽略细粒度的词的对比信息。为解决上述问题,该文提出一种融合置信度信息的文本图像翻译方法,充分利用转录文本中每个字符输出的概率分布,得到每个词的置信度信息,使级联式文本图像翻译系统中的OCR模型和机器翻译模型产生更有效的融合;同时针对OCR转录文本的噪声特点,设计了一种能提供词粒度的对比信息的监督文本,进一步提升模型性能。实验表明,该文所提方法在中译英以及英中文本图像翻译任务上相较于传统的管道式模型得到了显著提升。 展开更多
关键词 置信度 文本图像翻译 鲁棒性神经机器翻译
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部