-
题名基于字词融合和注意力机制的兽药文本命名实体识别
- 1
-
-
作者
颜士军
朱红梅
王雅童
张亮
-
机构
山东农业大学信息科学与工程学院
东方电子集团有限公司信息中心
-
出处
《中国农机化学报》
北大核心
2025年第3期336-342,352,共8页
-
基金
国家重点研发计划政府间/港澳台重点专项(2019YFE0103800)
山东省自然科学基金面上项目(ZR2022MG070)。
-
文摘
针对兽药领域信息专业性强、关联性强、局部特征明显和一词多义的特点,以及主流的命名实体识别模型未充分利用词汇信息的问题,提出一种基于字词融合和注意力机制的兽药文本命名实体识别模型。首先,将BERT预训练模型得到的字向量和Word2vec得到的词向量融合。然后,在双向长短期记忆网络中提取全局上下文特征的基础上加入多头自注意力机制挖掘序列的局部特征。最后,通过条件随机场获得最佳标签序列来完成实体识别任务。在兽药文本数据集上进行多组对比试验,结果表明,该模型识别的准确率、召回率和F 1值分别为94.73%、95.29%和95.01%,性能均优于对比模型。
-
关键词
兽药文本
命名实体识别
字词融合
多头自注意力机制
-
Keywords
veterinary drug text
named entity recognition
character and word fusion
multi-head self-attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-