期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合概念对齐信息的中文AMR语料库的构建 被引量:22
1
作者 李斌 闻媛 +3 位作者 宋丽 卜丽君 曲维光 薛念文 《中文信息学报》 CSCD 北大核心 2017年第6期93-102,共10页
作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,目前已经建立了较大规模的英文语料库。然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料标注质量受到影响,同时中文尚无较大规模的... 作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,目前已经建立了较大规模的英文语料库。然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料标注质量受到影响,同时中文尚无较大规模的AMR语料库。该文介绍了中文AMR语料库的构建工作,针对汉语特点调整了AMR的标注体系,增加对复句关系的标注,提出了融合概念对齐的一体化标注方案,解决了中英文输入法频繁切换的问题,增加了错别字纠正和未标注词高亮功能,提高了标注效率。然后,从CTB中选取了6 923句进行人工标注,形成中文AMR语料库,统计得到图和环的比例分别为48%和1%,以及利用对齐信息才能获取的非投影句的比例32%,为中文AMR的理论和自动分析研究奠定基础。 展开更多
关键词 抽象语义表示 语义图 句子语义 语言知识库
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部