-
题名基于多尺度边框融合的实体语义增强方法
- 1
-
-
作者
吴灿
陈艳平
扈应
黄瑞章
秦永彬
-
机构
文本计算与认知智能教育部工程研究中心(贵州大学)
公共大数据国家重点实验室(贵州大学)
贵州大学计算机科学与技术学院
-
出处
《计算机研究与发展》
北大核心
2025年第12期2983-2992,共10页
-
基金
贵州省重大科技专项项目([2024]003)
国家自然科学基金项目(62066007,62066008)
国家重点研发计划项目(2023YFC3304500)。
-
文摘
命名实体识别(named entity recognition,NER)是自然语言处理中的一项传统任务.基于跨度分类的方法是用来解决嵌套命名实体识别的主流方法.该方法通常是拼接实体边界的表示来获得跨度.然而,长实体容易导致2个实体边界之间的语义关联被弱化,并且单一尺度的跨度无法完整地捕捉实体在不同上下文中的表现.对此提出了一种基于多尺度边框融合的实体语义增强方法.该方法将跨度表示为带有边界位置信息的边框.首先,将通过融合不同尺度实体特征得到多尺度边框以增强边框中的语义特征,使边框的上下文依赖性更强.然后,通过基于位置权重的注意力机制进一步细化边框的边界位置使得边框信息更准确.最后,同时预测边框的实体类别和相对于真实实体的位置偏移量,有效支持嵌套命名实体的识别和定位.该方法在ACE2004英文数据集、ACE2005英文数据集和Weibo中文数据集上分别取得了88.63%,88.53%,73.86%的F1值,证明了模型的有效性.
-
关键词
命名实体识别
跨度分类
多尺度边框融合
实体语义增强
位置权重注意力机制
-
Keywords
named entity recognition
span classification
multi-scale boxes fusion
entity semantic enhancement
position-weighted attention mechanism
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-