-
题名融入拼音与词性特征的中文电子病历命名实体识别
被引量:4
- 1
-
-
作者
陆鑫涛
孙丽萍
凌晨
童子龙
刘佳霖
汤其宇
-
机构
上海健康医学院医疗器械学院
上海理工大学健康科学与工程学院
复旦大学信息科学与工程学院
海军军医大学第三附属医院信息科
-
出处
《小型微型计算机系统》
北大核心
2025年第2期330-338,共9页
-
基金
科技创新2030-“新一代人工智能”重大项目(2020AAA0109300)资助。
-
文摘
中文电子病历结构复杂,且相较英文具有更多的一字多音与一音多义现象,给命名实体识别任务带来了挑战.随着技术的成熟,当前主流的基于字形特征的命名实体识别方法难以获得较大提升,因此本文提出一种融入拼音与词性特征的中文电子病历命名实体识别方法,利用BERT预训练模型获取医学文本的动态向量表示,借助中文拼音特征对电子病历文本进行深度挖掘,并提取词性特征对拼音特征的不确定性加以约束.此外,对于这3种类型的特征,本文采用缩放点积注意力模块进行融合.在医疗领域数据集CCKS2018、CCKS2019,通用领域数据集Weibo上,F1值分别达到了98.66、87.25、73.41,相较基准模型BERT-BiLSTM-CRF分别提升了1.01、2.10、6.51.实验结果表明,与当前众多现有模型相比,本文方法展现出了更优越的性能,本研究为中文电子病历命名实体识别提供了新的思路.
-
关键词
命名实体识别
中文电子病历
注意力机制
特征融合
数据挖掘
-
Keywords
named entity recognition
Chinese electronic health records
attention mechanism
feature fusion
data mining
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-