期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向时政新闻文本的事件标注语料库构建 被引量:1
1
作者 王瑞民 叶娅娟 +2 位作者 张坤丽 昝红英 韩英杰 《郑州大学学报(理学版)》 CAS 北大核心 2023年第2期25-32,共8页
在现有的新闻领域标注语料库研究的基础上,结合时政新闻文本的特点,构建了面向时政新闻文本的事件标注语料库(event annotation corpus for current political news,EACPN)。EACPN从事件元素、人物角色及事件子类别等多个层面对21455篇... 在现有的新闻领域标注语料库研究的基础上,结合时政新闻文本的特点,构建了面向时政新闻文本的事件标注语料库(event annotation corpus for current political news,EACPN)。EACPN从事件元素、人物角色及事件子类别等多个层面对21455篇时政新闻进行标注,涵盖了128523个事件元素和17919个子类别,整体标注一致性达到85.9%。所构建的EACPN为今后的时政新闻文本事件抽取研究和事件知识图谱构建提供了数据基础。 展开更多
关键词 时政新闻文本 事件标注 语料库 事件抽取
在线阅读 下载PDF
糖尿病电子病历实体及关系标注语料库构建 被引量:1
2
作者 叶娅娟 胡斌 +1 位作者 张坤丽 昝红英 《中文信息学报》 CSCD 北大核心 2023年第12期17-25,共9页
电子病历是医疗信息的重要来源,包含大量与医疗相关的领域知识。该文从糖尿病电子病历文本入手,在调研了国内外已有的电子病历语料库的基础上,参考I2B2实体及关系分类,建立了糖尿病电子病历实体及实体关系分类体系,并制定了标注规范。... 电子病历是医疗信息的重要来源,包含大量与医疗相关的领域知识。该文从糖尿病电子病历文本入手,在调研了国内外已有的电子病历语料库的基础上,参考I2B2实体及关系分类,建立了糖尿病电子病历实体及实体关系分类体系,并制定了标注规范。利用实体及关系标注平台,进行了实体及关系预标注及多轮人工校对工作,形成了糖尿病电子病历实体及关系标注语料库(Diabetes Electronic Medical Record entity and relation Corpus, DEMRC)。DEMRC共包含8 899个实体、456个实体修饰及16 564个关系,对其进行一致性评价和分析,发现实体及关系标注一致性达到了0.854 2和0.941 6。针对实体识别和实体关系抽取任务,分别采用基于迁移学习的BiLSTM-CRF模型和RoBERTa模型进行初步实验,并对语料库中的各类实体及关系进行评估,为后续糖尿病电子病历实体识别、关系抽取研究及糖尿病知识图谱构建打下基础。 展开更多
关键词 糖尿病 电子病历 实体及关系标注体系 语料库构建
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部