-
题名多尺度语义收敛差分算子的命名实体识别方法
- 1
-
-
作者
杨采薇
陈艳平
秦永彬
黄瑞章
-
机构
贵州大学文本计算与认知智能教育部工程研究中心
贵州大学公共大数据国家重点实验室
贵州大学计算机科学与技术学院
-
出处
《中文信息学报》
北大核心
2025年第6期99-109,118,共12页
-
基金
国家自然科学基金(62166007)
贵州省科技支撑计划项目(黔科合支撑[2022]一般277)。
-
文摘
平面化句子表示是将传统的一维句子向量映射到二维的语义平面,其中每个单元代表了一个跨度,并与邻近的单元共享上下文语义,这会导致具有真实语义的跨度单元存在语义扩散到相邻单元导致语义混淆的问题。基于此,该文提出多尺度语义收敛差分算子的命名实体识别方法。首先利用预训练模型将句子表示为包含上下文信息的字符嵌入向量;其次通过多头双仿射将字符嵌入向量映射为平面化句子表示,平面化句子表示中的每个单元代表所包含的跨度信息;然后,采用差分信息来表征跨度单元的上下文语义突变及细节特征,从而聚合语义强度和梯度信息;最后,通过解码器识别实体类型。该模型在嵌套实体ACE2005英文、中文数据集和扁平实体CoNLL2003数据集上进行实验,F_(1)值分别达到了86.85%,89.43%和93.05%。实验结果表明,与其他现有主流模型相比,该模型能更好地识别命名实体。
-
关键词
命名实体识别
平面化句子表示
差分卷积
收敛实体语义
-
Keywords
named entity recognition
planarized sentence representation
differential convolution
convergent entity semantics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-