-
题名融合标签知识的中文医学命名实体识别
被引量:2
- 1
-
-
作者
尹宝生
周澎
-
机构
沈阳航空航天大学人机智能研究中心
-
出处
《计算机科学》
CSCD
北大核心
2024年第S01期128-134,共7页
-
基金
辽宁省教育厅项目(LJKMZ20220536)。
-
文摘
医学领域命名实体识别是信息抽取任务重要的研究内容之一,其训练数据主要来源于临床实验数据、健康档案、电子病历等非结构化文本,然而标注这些数据需要专业人员耗费大量人力、物力和时间资源。在缺乏大规模医学训练数据的情况下,医学领域命名实体识别模型很容易出现识别错误的情况。为解决这一难题,文中提出了一种融合标签知识的中文医学命名实体识别方法,即通过专业领域词典获得文本标签的释义后,分别将文本、标签及标签释义编码,基于自适应融合机制进行融合,有效平衡特征提取模块和语义增强模块的信息流,从而提高模型性能。其核心思想在于医学实体标签是通过总结归纳大量医学数据得到的,而标签释义是对标签进行科学解释和说明的结果,模型融入这些蕴含了丰富的医学领域内的先验知识,可以使其更准确地理解实体在医学领域中的语义并提升其识别效果。实验结果表明,该方法在中文医学实体抽取数据集(CMeEE-V2)3个基线模型上分别取得了0.71%,0.53%和1.17%的提升,并且为小样本场景下的实体识别提供了一个有效的解决方案。
-
关键词
中文医学命名实体识别
标签知识
先验知识
自适应融合机制
小样本
-
Keywords
Chinese medical named entity recognition
Label knowledge
Prior knowledge
Adaptive fusion mechanism
Few shot
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名位置标签增强的中文医学命名实体级联识别
- 2
-
-
作者
王旭阳
赵丽婕
张继远
-
机构
兰州理工大学计算机与通信学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第2期121-128,共8页
-
基金
国家自然科学基金(62161019)。
-
文摘
针对一般领域的命名实体识别方法不能直接用于中文医学专业实体的识别,现有的相关研究只专注于英文文本和扁平结构的医学实体识别等问题,通过对专业领域实体识别方法的研究,结合中文医学实体的特点提出了一种面向中文医学实体的级联识别方法。将每个字符元素相对于实体的位置标签嵌入模型,并结合中文医学实体跨度内不同元素的重要程度进行实体的融合表示。通过序列标注方法检测字符的位置标签,利用字符的位置信息指导候选实体生成,并进行实体语义分类。模型在CMeEE和CCKS2018数据集以及中文糖尿病科研文献数据集上分别进行扁平实体、嵌套实体和不连续性长实体的识别实验。实验结果表明,该方法能够有效地识别中文医学文本中不同结构的实体。
-
关键词
中文医学命名实体
位置标签嵌入
结合元素重要程度的实体融合表示
级联识别
线性结构
-
Keywords
Chinese medical named entity
positional label embedding
entity fusion representation combining element importance
cascade recognition
linear structure
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-