-
题名基于句法结构特征分析及分类技术的答案提取算法
被引量:24
- 1
-
-
作者
胡宝顺
王大玲
于戈
马婷
-
机构
东北大学软件学院计算机科学与技术系
东北大学信息科学与工程学院计算机软件与理论研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2008年第4期662-676,共15页
-
基金
国家自然科学基金(60573090)资助~~
-
文摘
由于中文自然语言处理的特点和困难以及相应的语言处理基础资源的相对缺乏,使得国外一些成熟技术和研究成果不能直接应用到中文问答系统中.为此,针对中文事实型问答系统,提出一种新的基于句法结构特征分析及分类技术的答案提取算法,该方法将答案提取问题看成是候选答案的分类问题,即将候选答案分类为正确和错误两类.首先,该方法根据与问题类型所对应的候选答案的类型信息,从文本片断中提取出候选答案及其在句子中的简单特征和句法结构特征;然后利用这些特征训练分类器;最后用训练得到的分类器判别候选答案是否为正确答案.针对中文事实性问题,该方法与目前典型的基于模式匹配的中文答案提取算法相比,准确率提升6.2%,MRR提升9.7%.
-
关键词
句法依存分析
分类
答案提取
中文问答系统
事实性问题
-
Keywords
syntax dependency parsing
classification
answer extraction
Chinese Question Answering(QA) system
factoid questions
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-