-
题名多种语义特征在突发事件新闻中的共指消解研究
被引量:3
- 1
-
-
作者
庞宁
杨尔弘
-
机构
太原科技大学应用科学学院
北京语言大学国家语言资源监测与研究中心平面媒体语言分中心
-
出处
《中文信息学报》
CSCD
北大核心
2014年第1期26-32,共7页
-
基金
山西省自然科学基金(2012011011-4)
-
文摘
提高突发事件应对的关键在于快速地收集和提取相关新闻报道中的有用信息,共指消解是信息提取研究的重要子任务。该文采用最大熵模型对汉语突发事件新闻报道中的共指现象进行消解,综合对比了语义类特征、语义角色特征,以及基于维基百科的语义相关特征,重定向特征及上下文特征在测试集上的效果。实验结果表明,除单纯使用语义角色特征会使系统F值下降1.31%以外,其余各种语义知识对共指消解模型的结果均有所提高。
-
关键词
中文信息处理
突发事件
共指消解
语义特征
最大熵模型
-
Keywords
Chinese information processing
paroxysmal event
coreference resolution
semantic features
maximumentropy model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名事件信息结构分析
被引量:6
- 2
-
-
作者
杨尔弘
曾青青
李婷婷
-
机构
北京语言大学国家语言资源监测与研究中心平面媒体语言分中心
首都体育学院国际教育学院
-
出处
《中文信息学报》
CSCD
北大核心
2012年第3期92-97,共6页
-
基金
国家社科基金资助项目(06YY047)
-
文摘
该文通过考察事件词在文本篇章结构中的分布方式,指出突发事件新闻报道文本中包含主线信息链和副线信息链。主线信息链中包含了文本的事件信息,是事件信息提取重点考虑的文本内容部分;副线信息链则由文本结构中的"评价"、"背景"以及"情节"部分的细节信息等组成,是事件信息提取时可以忽略的文本内容部分。事件信息的结构可以进一步分解为前核心事件链、核心事件链、次生事件链和后次生事件链。该文通过定义事件词,以其为触发,探索了事件信息结构的识别与获取,并借助《知网》(HowNet)提高了事件词对信息刻画的有效性和区分度。
-
关键词
事件词
事件信息结构
主线信息链
副线信息链
-
Keywords
event word
event information structure
the main information chain
the second information chain
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-