-
题名基于语言现象的文本蕴涵识别
被引量:4
- 1
-
-
作者
任函
冯文贺
刘茂福
万菁
-
机构
广东外语外贸大学语言工程与计算实验室
武汉大学湖北语言与智能信息处理研究基地
武汉科技大学计算机学院
广东外语外贸大学词典研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2017年第1期184-191,共8页
-
基金
国家自然科学基金(61402341)
国家社会科学基金(11&ZD189)
+3 种基金
华中师范大学中央高校基本科研业务费教育科学专项资助(ccnu16JYKX014)
教育部人文社科项目(13YJC740022)
河南高校哲社基础研究重大项目(2015-JCZD-022)
广东外语外贸大学语言工程与计算实验室2016年招标课题(LEC2016ZBKT002)
-
文摘
该文提出一种基于语言现象的文本蕴涵识别方法,该方法建立了一个语言现象识别和整体推理判断的联合分类模型,目的是对两个高度相关的任务进行统一学习,避免管道模型的错误传播问题并提升系统精度。针对语言现象识别,设计了22个专用特征和20个通用特征;为提高随机森林的泛化能力,提出一种基于特征选择的随机森林生成算法。实验结果表明,基于随机森林的联合分类模型能够有效识别语言现象和总体蕴涵关系。
-
关键词
文本蕴涵识别
语言现象
随机森林
-
Keywords
recognizing textual entailment
language phenomena
random forest
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于知识话题模型的文本蕴涵识别
被引量:4
- 2
-
-
作者
任函
盛雅琦
冯文贺
刘茂福
-
机构
湖北工业大学计算机学院
武汉大学湖北省语言与智能信息处理研究基地
武汉大学计算机学院
武汉科技大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2015年第6期119-126,共8页
-
基金
国家自然科学基金(61402341
61173062
+2 种基金
61373108)
国家社会科学基金重大项目(11&ZD189)
中国博士后科学基金(2013M540594)
-
文摘
该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若即若文本T蕴涵假设H,说明T和H具有相似的话题分布,反之说明T和H不具有相似的话题分布。基于此,我们将T和H的蕴涵识别问题转化为相关话题的生成过程,同时将文本推理知识融入到抽样过程,由此建立一个面向文本蕴涵识别的话题模型。实验结果表明基于知识话题模型在一定程度上改进了文本蕴涵识别系统的性能。
-
关键词
文本蕴涵识别
话题模型
蕴涵分类
推理知识
-
Keywords
recognizing textual entailment
topic models entailment classification
inference knowledge
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于协同训练的文本蕴含识别
被引量:1
- 3
-
-
作者
任函
万菁
吴泓缈
冯文贺
-
机构
武汉大学外国语言文学学院
武汉大学湖北省语言与智能信息处理研究基地
武汉大学计算机学院
-
出处
《中文信息学报》
CSCD
北大核心
2014年第6期114-119,共6页
-
基金
国家自然科学基金(61402341
61373108
+3 种基金
61173062)
中国博士后科学基金(2014M552073
2013M540594)
中央高校基本科研业务费专项资金(2012GSP017)
-
文摘
针对文本蕴含的训练数据不足的问题,该文提出了基于协同训练的文本蕴含识别方法。该方法利用少量已标注的蕴含数据和大量未标注数据进行协同训练。为此,该文利用改写视图和评估视图,从结构和非结构两个角度考察蕴含关系,并将语义树核分类器和基于统计特征的分类器应用于两个视图,同时利用协同训练的结果训练一个综合分类器,用于对新数据进行预测。实验表明,基于协同训练的蕴含识别方法能在少量训练数据的情况下获得较好的识别性能。
-
关键词
文本蕴含识别
协同训练
语义树核
-
Keywords
recognizing textual entailment
co-training
semantic tree kernel
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-