-
题名基于预训练模型和双向二维卷积的命名实体识别算法
- 1
-
-
作者
林楠
刘志慧
杨聪
-
机构
郑州大学网络空间安全学院
-
出处
《计算机科学》
北大核心
2025年第S1期218-223,共6页
-
基金
河南省高等学校重点科研项目(22A520042)
郑州市协同创新重大专项(20XTZ06013)。
-
文摘
针对命名实体识别在处理嵌套结构时语义信息逐层减弱的问题,提出了一种基于预训练模型和双向二维卷积的命名实体识别算法BAM-TDNN。该算法首先通过四词嵌入策略即BERT、距离、局部和注意力嵌入,来提取语句中的不同层次语义特征,将多个层次的语义特征转换为二维语义表示,以更好地捕捉嵌套结构之间的语义信息;其次,采用Bi-TDNN模型学习语句中实体的长距离语义依赖关系,扩展跨度表示的感受野,提取嵌套实体间更准确的语义信息,更好地理解嵌套实体之间的语义关联。通过在4个公共数据集上进行评估,实验结果表明,所提出的命名实体识别算法在多个实体识别数据集上均取得了良好的性能。BAM-TDNN在ACE2005数据集上的精确率、召回率和F1值分别为86.83%,87.93%和86.83%,在GENIA数据集上的精确率、召回率和F1值分别为86.52%,82.37%和84.36%,在CoNLL2003数据集上的精确率、召回率和F1值分别为92.24%,93.72%和91.97%等。
-
关键词
命名实体识别
四词嵌入策略
BERT
Bi-TDNN
-
Keywords
Named entity recognition
Four-word embedding strategy
BERT
Bi-TDNN
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-