-
题名基于分解式模糊跨度的小样本命名实体识别
- 1
-
-
作者
曾碧卿
钟广彬
温志庆
-
机构
华南师范大学软件学院
季华实验室智能机器人工程研究中心
-
出处
《计算机应用》
北大核心
2025年第5期1504-1510,共7页
-
基金
国家自然科学基金资助项目(62076103)
广东省基础与应用基础研究基金资助项目(2021A1515011171)
+1 种基金
广州市基础研究计划基础与应用基础研究项目(202102080282)
佛山市重点领域科技攻关项目(2020001006807)。
-
文摘
小样本命名实体识别(few-shot NER)旨在基于少量标记数据识别文本中的实体跨度和类型。近年来,基于跨度的度量学习虽然取得了不错的效果,但仍然存在2个问题:一是少量的候选跨度可能导致原型偏离群组的中心;二是与类别无关的跨度检测器可能会产生一些非实体跨度。为了解决以上问题,提出一种用于few-shot NER的融合模糊跨度的分解式模型DFSM(Decomposed Fuzzy Span Model)。在跨度检测阶段,为学习明确的实体边界信息且不受标记级别的标签依赖影响,DFSM采用全局边界矩阵检测候选跨度;而在跨度分类阶段,为增加可训练的每种实体类型的候选跨度数量,提出一种模糊跨度策略,以调整候选跨度的边界范围。同时,设计一种原型对比学习以优化基于跨度的语义表示空间。此外,为消除非实体噪声数据的干扰,引入原型边界学习以扩大非实体跨度与原型的距离。在Few-NERD和CrossNER数据集上的实验结果显示:与基线模型TadNER相比,在Few-NERD Inter设置中,DFSM的平均F1值提升了8.52个百分点,尤其是在Inter 10 way 5~10-shot设置中,DFSM的平均F1值提升了10.39个百分点,这表明DFSM对于细粒度实体类型具有更强的识别能力;与基线模型DecomMeta相比,在CrossNER 1-shot和5-shot设置中,DFSM的平均F1值分别提升了3.32和1.09个百分点,这表明DFSM在跨领域低资源场景下具有良好的泛化能力。
-
关键词
命名实体识别
小样本学习
原型网络
全局边界矩阵
模糊跨度
-
Keywords
Named Entity Recognition(NER)
few-shot learning
prototypical network
global boundary matrix
fuzzy span
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-