-
题名基于网络的中文问答系统及信息抽取算法研究
被引量:46
- 1
-
-
作者
崔桓
蔡东风
苗雪雷
-
机构
沈阳航空工业学院自然语言处理实验室
-
出处
《中文信息学报》
CSCD
北大核心
2004年第3期24-31,共8页
-
文摘
问答系统 (QuestionAnsweringSystem)能用准确、简洁的答案回答用户用自然语言提出的问题。目前多数问答系统利用大规模文本作为抽取答案的知识库 ,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源 ,对于回答简短、基于事实的问题非常有效。本文对基于网络的问答系统研究现状作了简要的介绍 ,分析了网络信息的特点。我们提出了一种基于语句相似度计算的答案抽取方法 ,在此基础上实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源 ,从而节省了下载、分析网络源文本的时间。实验结果表明该系统对人名、数量及时间类型的问题效果显著 ,对测试问题集的MRR值达到 0 5 1。
-
关键词
计算机应用
中文信息处理
问答系统
句子相似度
信息抽取
-
Keywords
computer application
Chinese information processing
question answering system
sentence similarity
information extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进的VSM的词义排歧策略
- 2
-
-
作者
赵晨光
蔡东风
-
机构
沈阳航空工业学院电子信息工程学院
沈阳航空工业学院自然语言处理实验室
-
出处
《计算机应用》
CSCD
北大核心
2010年第6期1671-1672,1693,共3页
-
文摘
为了提高词义排歧的准确率,提出了一种基于改进的向量空间模型(VSM)的词义排歧策略,该模型在提取特征向量的基础上,考虑了语法、词形、语义等因素,计算语境相似度,并引入搭配约束,改进了算法的效果,在开放测试环境下,词义标注正确率可达到80%以上。实验结果表明,该方法对语境信息的描述更加全面,有利于进一步的语义分析。
-
关键词
向量空间模型
词义排歧
语境相似度
特征向量
词语搭配
-
Keywords
Vector Space Model (VSM)
word disambiguation
context similarity
character vector
word collocation
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-