-
题名基于浅层语义树核的阅读理解答案句抽取
被引量:14
- 1
-
-
作者
张志昌
张宇
刘挺
李生
-
机构
哈尔滨工业大学计算机学院信息检索研究室
-
出处
《中文信息学报》
CSCD
北大核心
2008年第1期80-86,共7页
-
基金
国家自然科学基金资助项目(60435020
60675034)
国家863项目(2006AA01Z145)
-
文摘
阅读理解系统是通过对一篇自然语言文本的分析理解,对用户根据该文本所提的问题,自动抽取或者生成答案。本文提出一种利用浅层语义信息的英文阅读理解抽取方法,首先将问题和所有候选句的语义角色标注结果表示成树状结构,用树核(tree kernel)的方法计算问题和每个候选句之间的语义结构相似度,将该相似度值和词袋方法获得的词匹配数融合在一起,选择具有最高分值的候选句作为最终的答案句。在Remedia测试语料上,本文方法取得43.3%的HumSent准确率。
-
关键词
计算机应用
中文信息处理
阅读理解
答案句抽取
浅层语义
树核
-
Keywords
computer application
Chinese information processing
reading comprehension
answer sentence extraction
shallow semantic
tree kernel
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于框架语义的高考语文阅读理解答案句抽取
被引量:8
- 2
-
-
作者
李国臣
刘姝林
杨陟卓
李茹
张虎
钱揖丽
-
机构
山西大学计算机与信息技术学院
太原工业学院计算机工程系
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2016年第6期164-172,共9页
-
基金
国家863计划(2015AA015407)
国家自然科学基金(61373082
+5 种基金
61502287
61673248)
山西省科技基础条件平台建设项目(2014091004-0103)
山西省回国留学人员科研资助项目(2013-015)
中国民航大学信息安全测评中心开放课题基金(CAAC-ISECCA-201402)
山西省高校科技创新项目(201505)
-
文摘
高考语文阅读理解问答相对普通阅读理解问答难度更大,问句抽象表述的理解需要更深层的语言分析技术,答案候选句抽取更注重与问句的关联分析,答案候选句排序更注重答案句之间的语义相关性。为此,该文提出借助框架语义匹配和框架语义关系抽取答案候选句,在排序时引入流形排序模型,通过答案句之间的框架语义相关度将排序分数进行传播,最终选取分数较高的Top-4作为答案句。在北京近12年高考语文阅读理解问答题上的准确率与召回率分别达到了53.65%与79.06%。
-
关键词
高考语文
阅读理解
框架语义
答案句抽取
流形排序
-
Keywords
College Entrance Examination on Chinese
reading comprehension
frame semantic
answers sentences extraction
Manifold-ranking
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于CFN和篇章主题的概括型问答题的解答
被引量:3
- 3
-
-
作者
杨陟卓
李春转
张虎
钱揖丽
李茹
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2020年第12期73-81,共9页
-
基金
国家重点研发计划(2018YFB1005103)
国家自然科学基金(61772324)。
-
文摘
相对于普通阅读理解,高考语文阅读理解难度更大,问句更加抽象,答案候选句的抽取除了注重与问句的相似性分析,还注重对材料内容以及作者的观点的概括归纳。因此该文提出了利用汉语框架网(Chinese FrameNet)抽取与问句语义相似的候选句的方法,通过识别篇章主题(段落主题句和作者观点句),生成与问句相关的内容要点以及作者的观点态度,最终选取top 6作为答案句。在近12年北京市高考真题上进行测试,召回率达到了68.69%,验证了该方法的有效性。
-
关键词
概括型问答题
框架语义
篇章主题
答案句抽取
-
Keywords
general-problems
frame semantic
discourse topic
answer sentence extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于异构图神经网络的高考阅读理解问答研究
- 4
-
-
作者
杨陟卓
李沫谦
张虎
李茹
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2023年第5期101-111,共11页
-
基金
国家重点研发计划项目(2018YFB1005103)
山西省基础研究计划项目面上基金(20210302123469)
国家自然科学基金(62176145)。
-
文摘
机器阅读理解是自然语言处理领域的核心任务,高考阅读理解自动问答是近年来阅读理解任务中的重要挑战。由于高考题难度较大,同时高考阅读理解问答的数据集较少,导致传统的方法答题效果欠佳。基于此,该文提出一种基于异构图神经网络的答案句抽取模型,将丰富的节点(句子节点、词语节点)和节点之间的关系(框架关系、篇章主题关系)引入图神经网络模型中,问句不仅可以通过中继词语节点与候选句节点进行交互,还可以通过框架语义和篇章主题关系与候选节点进行相互更新。不同类型的语义节点和多维度的语义关系可以帮助模型更好地对信息进行筛选、理解和推理。模型在北京高考语文真题上进行测试,实验结果表明,基于图神经网络的问答模型答题效果优于基线模型,F1值达到了78.08%,验证了该方法的有效性。
-
关键词
阅读理解问答
答案句抽取
异构图神经网络
框架语义
篇章主题
-
Keywords
reading comprehension QA
answer sentence extraction
heterogeneous graph neural network
frame semantics
discoursetopic
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-