摘要
跨语言摘要能将一种语言的文本总结为另一种语言的摘要,旨在帮助人们快速准确地获取陌生语言文本的关键信息.目前,针对该研究的全面综述工作十分稀缺.因此,本文回顾跨语言摘要的研究发展,在全面调研和深入分析的基础上,从研究方法、数据集、评价方法以及未来方向等4个方面对跨语言摘要的研究工作展开综述.首先,全面梳理了现有跨语言摘要方法,概括为“先翻译后摘要”、“先摘要后翻译”、间接学习方法、辅助学习方法以及特征增强方法等5大类,并进行了优缺点分析.其次,归纳和分析了跨语言摘要数据集的构建方法,并对现有数据集进行了详尽整理.然后,系统地总结和分析了跨语言摘要评价方法.最后,进一步讨论了未来研究方向.
Cross-lingual summarization can convert texts in one language into summaries in another language,aiming to help people quickly and effectively obtain key information of texts in unfamiliar languages.At present,the comprehensive overview of this research is scarce.Therefore,by reviewing the development of cross-lingual summarization,and on the basis of comprehensive investigation and in-depth analysis,this paper summarizes works of cross-lingual summarization from four aspects:method,dataset,evaluation and future research direction.Firstly,this paper comprehensively combs the existing cross-lingual summarization methods,which are summarized into five categories:translation before summarization,summarization before translation,indirect learning,assisted learning and feature enhancement,and analyzes their pros and cons.Secondly,this paper summarizes and analyzes the dataset construction methods of cross-lingual summarization,and makes a comprehensive arrangement of the existing datasets.Then,this paper systematically summarizes and analyzes the evaluation methods of cross-lingual summarization.Finally,the future research direction is further discussed.
作者
潘航宇
席耀一
陈宇飞
曹蓉
南煜
PAN Hang-yu;XI Yao-yi;CHEN Yu-fei;CAO Rong;NAN Yu(Strategic Support Force Information Engineering University,Zhengzhou 450001,China)
出处
《小型微型计算机系统》
CSCD
北大核心
2023年第8期1616-1628,共13页
Journal of Chinese Computer Systems
基金
国家社会科学基金项目(19CXW027)资助。
关键词
跨语言摘要
方法模型
数据集
评价方法
未来研究方向
cross-lingual summarization
method
dataset
evaluation
future research direction
作者简介
潘航宇,男,1997年生,硕士研究生,研究方向为自然语言处理,E-mail:pan.hangyu@hotmail.com;席耀一,男,1987年生,博士,副教授,研究方向为大数据与人工智能;陈宇飞,女,1991年生,博士研究生,研究方向为自然语言处理和深度学习;曹蓉,女,1984年生,博士,讲师,研究方向为语言智能处理;南煜,女,1978年生,硕士,副教授,研究方向为大数据分析。