-
题名基于多源数据的中文产科知识图谱构建
被引量:5
- 1
-
-
作者
张坤丽
胡晨馨
宋玉
昝红英
赵悦淑
储文艳
-
机构
郑州大学信息工程学院
郑州中业科技股份有限公司
郑州大学第三附属医院
郑州大学外国语与国际关系学院
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2023年第1期8-14,共7页
-
基金
国家重点研发计划项目(2017YFB1002101)
国家社科基金重大项目(17ZDA138)
+1 种基金
国家自然科学基金项目(62006211)
河南省科技攻关项目(192102210260)。
-
文摘
以产科专业叙词表、临床路径和诊疗规范等为数据来源构建了中文产科知识图谱(Chinese obstetric knowledge graph,COKG)。以产科疾病为核心,依据术语标准及已有主题词表,确立了概念分类体系及关系描述体系,形成了COKG模式层;在Bi-LSTM-CRF和PCNN模型的基础上,通过医学专家的指导对多来源的200余万字非结构化文本进行人工校对,并对多源数据进行知识融合,形成了COKG数据层。所构建的COKG包括2343种疾病、15249个实体关系,可以为医疗问答系统和智能辅助诊疗等应用提供结构化的知识支持。
-
关键词
知识图谱
产科
命名实体识别
关系抽取
知识融合
-
Keywords
knowledge graph
obstetric
named entity recognition
relation extraction
knowledge fusion
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名融入篇章信息的文学作品命名实体识别
被引量:1
- 2
-
-
作者
贾玉祥
晁睿
昝红英
窦华溢
曹帅
徐硕
-
机构
郑州大学计算机与人工智能学院
郑州中业科技股份有限公司
-
出处
《中文信息学报》
CSCD
北大核心
2023年第11期100-109,共10页
-
基金
国家重点研究发展计划(2017YFB1002101)
国家社会科学基金(18ZDA295,17ZDA318)
+1 种基金
国家自然科学基金(62006211)
中国博士后科学基金(2019TQ0286,2020M682349)。
-
文摘
命名实体识别是文学作品智能分析的基础性工作,当前文学领域命名实体识别的研究还较薄弱,一个主要原因是缺乏标注语料。该文从金庸小说入手,对两部小说180余万字进行了命名实体的标注,共标注4类实体,共计5万多个。针对小说文本的特点,该文提出融入篇章信息的命名实体识别模型,引入篇章字典保存汉字的历史状态,利用可信度计算融合BiGRU-CRF与Transformer模型。实验结果表明,利用篇章信息有效提升了命名实体识别的效果。最后,该文还探讨了命名实体识别在小说社会网络构建中的应用。
-
关键词
文学作品
命名实体识别
篇章信息
-
Keywords
literary text
named entity recognition
document level information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-