-
题名基于多类型词信息引导的汉越跨语言摘要生成方法
- 1
-
-
作者
贾伟强
张勇丙
高盛祥
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《计算机应用与软件》
北大核心
2025年第7期161-166,260,共7页
-
基金
国家自然科学基金项目(61972186,U21B2027,61732005)
云南高新技术产业发展项目(201606)
+2 种基金
云南省重大科技专项计划项目(202002AD080001-5,202103AA080015)
云南省基础研究计划项目(202001AS070014)
云南省学术和技术带头人后备人才项目(202105AC160018)。
-
文摘
任务大多依赖于机器翻译,而越南语这类低资源语种翻译效果不佳,汉越跨语言摘要面临着数据稀缺下双语语义对齐困难的问题。针对该问题,提出一种基于多类型词信息引导的汉越跨语言摘要生成方法。利用显式的关键词信息引导对源文本重要信息的编码;利用外部汉越双语概率词典中的词对齐信息,引导编解码器对关键信息的双语对齐;基于指针-生成网络,将两类词信息应用于越南语摘要的生成任务。在构建的汉越跨语言摘要数据集上的实验结果表明,该模型可以有效提升跨语言摘要生成的质量。
-
关键词
多类型词信息
外部知识
词对齐
关键词引导
跨语言摘要
-
Keywords
Multi-type word information
External knowledge
Word alignment
Keyword guidance
Cross-lingual summarization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-