-
题名基于多层次特征集成的中文实体指代识别
被引量:1
- 1
-
-
作者
张海雷
曹菲菲
陈文亮
任飞亮
王会珍
朱靖波
-
机构
东北大学自然语言处理实验室
-
出处
《中文信息学报》
CSCD
北大核心
2007年第5期126-130,共5页
-
基金
国家自然科学基金资助项目(60473140)
国家863高科技计划资助项目(2006AA01Z154)
+1 种基金
国家教育部新世纪优秀人才计划资助项目(NCET-05-0287)
国家985工程计划资助项目(985-2-DB-C03)
-
文摘
实体指代识别(Entity Mention Detection,EMD)是识别文本中对实体的指代(Mention)的任务,包括专名、普通名词、代词指代的识别。本文提出一种基于多层次特征集成的中文实体指代识别方法,利用条件随机场模型的特征集成能力,综合使用字符、拼音、词及词性、各类专名列表、频次统计等各层次特征提高识别性能。本文利用流水线框架,分三个阶段标注实体指代的各项信息。基于本方法的指代识别系统参加了2007年自动内容抽取(ACE07)中文EMD评测,系统的ACE Value值名列第二。
-
关键词
计算机应用
中文信息处理
实体指代识别
多任务标注
条件随机场模型
ACE评测
-
Keywords
computer applicatiopn
Chinese information processing
entity mention detection
mutil-task labeling conditional random fields
ACE evaluation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于虚结点方法的在线实体指代项识别
- 2
-
-
作者
俞一乘
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第4期192-194,219,共4页
-
文摘
在自然语言处理中,实体指代项识别通常被看作是序列标注任务进行处理。而实体指代项又是由多个连续的序列标注子任务组成的。这些子任务包括切分识别、实体识别和指代项识别。传统的管道方法经常会导致每步间的错误向下传递。级联方式的联合模型会带来大量的标记。虚结点方法同时规避了上面两个方法的缺点。系统采用虚结点的在线联合模型,不仅减少了训练时间,性能也比普通的在线联合模型要好。
-
关键词
实体指代识别
虚结点
级联
-
Keywords
Entity mention recognition Virtual node Cascade
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-