-
题名基于话头话体共享结构信息的机器阅读理解研究
- 1
-
-
作者
韩玉蛟
罗智勇
张明明
赵志琳
张青
-
机构
北京语言大学信息科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2024年第5期32-40,共9页
-
基金
国家自然科学基金(62076037)。
-
文摘
机器阅读理解(Machine Reading Comprehension,MRC)任务旨在让机器回答给定上下文的问题来测试机器理解自然语言的能力。目前,基于大规模预训练语言模型的神经机器阅读理解模型已经取得重要进展,但在涉及答案要素、线索要素和问题要素跨标点句、远距离关联时,答案抽取的准确率还有待提升。该文通过篇章内话头话体结构分析,建立标点句间远距离关联关系,补全共享缺失成分,辅助机器阅读理解答案抽取;设计和实现融合话头话体结构信息的机器阅读理解模型,在公开数据集CMRC2018上的实验结果表明,模型的F 1值相对于基线模型提升2.4%,EM值提升6%。
-
关键词
机器阅读理解
话头话体结构分析
注意力机制
预训练语言模型
-
Keywords
machine reading comprehension
naming-telling structure
attention
pretraining language model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-