-
题名面向语言学习者的跨语言反馈评语生成方法
- 1
-
-
作者
安纪元
朱琳
杨尔弘
-
机构
北京语言大学国家语言资源监测与研究平面媒体中心
北京语言大学信息科学学院
-
出处
《中文信息学报》
北大核心
2025年第7期148-161,共14页
-
基金
国家语委科研项目(ZDA145-17)
教育部人文社会科学研究一般项目(23YJCZH264)
+1 种基金
北京语言大学梧桐创新平台(中央高校基本科研业务费专项资金)项目(21PT04)
北京语言大学研究生创新基金(中央高校基本科研业务费专项资金)项目(24YCX069)。
-
文摘
反馈评语生成是近年来自然语言处理研究的一个热点任务,旨在为语言学习者的作文提供纠偏及解释性的评价,以帮助学习者理解并内化语言规则,从而提高写作水平。现有研究主要聚焦于单一语言的反馈评语生成,忽略了非母语学习者可能面临的理解障碍,以及评语中存在陌生语言知识等问题。该文提出了一种新的跨语言反馈评语生成(CLFCG)任务,其目的是为汉语母语者学习英语提供汉语的反馈评语。首先,通过构建首个英-汉跨语言反馈评语数据集,探索了大语言模型(如GPT-4)和预训练语言模型(如mBART、mT5)在该任务上的性能,并针对预训练语言模型,分析了修正编辑、线索词语和语法术语等附加信息对反馈评语生成效果的影响。其次,该文提出了一种基于大语言模型的评估方法,以更加准确地评估反馈评语生成效果。实验结果显示,基于微调的预训练语言模型能够更好地对齐人类教师的评语,但其生成的准确性略逊于采用少样本学习策略的GPT-4模型。最后,该文对实验结果进行了深入讨论和分析,以期为跨语言反馈评语生成任务提供更多思路和见解。
-
关键词
智能辅助语言学习
反馈评语生成
跨语言文本生成
预训练语言模型
大语言模型
-
Keywords
intelligent computer-assisted language learning
feedback comment generation
cross-lingual text generation
pretrained language models
large language model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-