-
题名基于自注意力机制与词汇增强的中文医学命名实体识别
被引量:1
- 1
-
-
作者
罗歆然
李天瑞
贾真
-
机构
西南交通大学计算机与人工智能学院
-
出处
《计算机应用》
CSCD
北大核心
2024年第2期385-392,共8页
-
基金
国家自然科学基金资助项目(62276218,62272398,62176221)。
-
文摘
针对中文医学文本实体嵌套导致的单词边界识别困难问题以及现有栅格结构集成词汇特征所面临的语义信息损失严重的情况,提出一种用于中文医学命名实体识别(MNER)的自适应词汇信息增强模型。首先,利用双向长短期记忆(BiLSTM)网络编码字符序列的上下文信息并捕捉较长距离的依赖关系;然后,对字符序列中每个字符的潜在单词信息进行字词对建模,采用自注意力机制实现不同单词之间的内部交互;最后,通过基于双线性注意力机制的词汇适配器将词汇信息集成到文本序列中的每个字符中,有效增强语义信息的同时充分利用单词丰富的边界信息,并抑制相关性低的单词。实验结果表明,所提模型与基于字符的基线模型相比,平均F1值分别提升了1.37~2.38个百分点,并在结合BERT后取得了最优的效果。
-
关键词
医学命名实体识别
中文医学文本
词汇适配器
自注意力机制
双向长短期记忆网络
-
Keywords
Medical Named Entity Recognition(MNER)
Chinese medical text
lexicon adapter
self-attention mechanism
Bi-directional Long Short-Term Memory(BiLSTM)network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-