-
题名音乐领域典型事件抽取方法研究
被引量:24
- 1
-
-
作者
丁效
宋凡
秦兵
刘挺
-
机构
哈尔滨工业大学计算机学院
-
出处
《中文信息学报》
CSCD
北大核心
2011年第2期15-20,共6页
-
基金
国家自然科学基金资助项目(60975055,60803093)
国家863计划资助项目(2008AA01Z144)
高等学校博士学科点专项科研基金资助课题(2007021346)
-
文摘
事件抽取是信息抽取领域一个重要的研究方向。该文从音乐领域的事件抽取出发,通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,然后采用基于关键词与触发词相结合的过滤方法简化了事件类型的识别过程。在事件元素识别中,该文采用了基于最大熵的事件元素识别方法。在该文构建的语料库下,最终事件类型识别的平均F值达到82.82%,事件元素识别的平均F值达到75.79%。
-
关键词
事件抽取
事件类型发现
事件类型识别
事件元素识别
-
Keywords
event extraction
event type detection
event type recognition
event argument recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于中心语匹配的共指消解
被引量:5
- 2
-
-
作者
张牧宇
黎耀炳
秦兵
刘挺
-
机构
哈尔滨工业大学计算机学院信息检索研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2011年第3期3-8,共6页
-
基金
国家自然科学基金资助项目(60975055)
国家863计划探索类专题资助项目(2008AA01Z144)
-
文摘
共指消解是自然语言处理的核心任务之一。在传统机器学习方法使用的平面特征基础上,该文提出一种利用中心语信息的新方法。该方法首先引进一种基于简单平面特征的实例匹配算法用于共指消解。在此基础上,又引入了先行语与照应语的中心语字符串作为新特征,并提出一种竞争模式对将中心语约束融合进实例匹配算法,提升了消解效果。该方法与其他只使用平面特征的传统机器学习方法相比,能充分地利用每一个训练实例的特征信息,进一步融合中心语字符串特征使消解效果更加准确。
-
关键词
中心语匹配
实例匹配
共指消解
-
Keywords
head match
instance match
coreference resolution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于话题和修辞识别的阅读理解why型问题回答
被引量:9
- 3
-
-
作者
张志昌
张宇
刘挺
李生
-
机构
哈尔滨工业大学计算机学院信息检索研究中心
西北师范大学数学与信息科学学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第2期216-223,共8页
-
基金
国家"八六三"高技术研究发展计划基金项目(2006AA01Z145)
国家自然科学基金项目(60736044
60675034)
-
文摘
针对阅读理解问答中的why型问题,提出基于问题话题和话题间因果修辞关系识别的答案句抽取方法.抽取时利用机器学习方法,选择可识别出对应问题话题的句子特征、问题话题与句子上下文之间因果关系特征,对篇章内的句子按照成为答案句的概率进行排序.对应问题话题的句子识别利用基于idf和语义角色的相似度;因果修辞关系的识别利用线索短语、特定语义角色、从文档集中挖掘的词间蕴含的因果关系概率信息、句子上下文的位置与表达形式.Remedia语料上的实验结果表明,该方法明显提高了why型问题回答的性能.
-
关键词
why型问题
话题
修辞关系
答案抽取
阅读理解
-
Keywords
why-question
topic
rhetorical relation
answer extraction
reading comprehension
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-