期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于分解式模糊跨度的小样本命名实体识别
1
作者 曾碧卿 钟广彬 温志庆 《计算机应用》 北大核心 2025年第5期1504-1510,共7页
小样本命名实体识别(few-shot NER)旨在基于少量标记数据识别文本中的实体跨度和类型。近年来,基于跨度的度量学习虽然取得了不错的效果,但仍然存在2个问题:一是少量的候选跨度可能导致原型偏离群组的中心;二是与类别无关的跨度检测器... 小样本命名实体识别(few-shot NER)旨在基于少量标记数据识别文本中的实体跨度和类型。近年来,基于跨度的度量学习虽然取得了不错的效果,但仍然存在2个问题:一是少量的候选跨度可能导致原型偏离群组的中心;二是与类别无关的跨度检测器可能会产生一些非实体跨度。为了解决以上问题,提出一种用于few-shot NER的融合模糊跨度的分解式模型DFSM(Decomposed Fuzzy Span Model)。在跨度检测阶段,为学习明确的实体边界信息且不受标记级别的标签依赖影响,DFSM采用全局边界矩阵检测候选跨度;而在跨度分类阶段,为增加可训练的每种实体类型的候选跨度数量,提出一种模糊跨度策略,以调整候选跨度的边界范围。同时,设计一种原型对比学习以优化基于跨度的语义表示空间。此外,为消除非实体噪声数据的干扰,引入原型边界学习以扩大非实体跨度与原型的距离。在Few-NERD和CrossNER数据集上的实验结果显示:与基线模型TadNER相比,在Few-NERD Inter设置中,DFSM的平均F1值提升了8.52个百分点,尤其是在Inter 10 way 5~10-shot设置中,DFSM的平均F1值提升了10.39个百分点,这表明DFSM对于细粒度实体类型具有更强的识别能力;与基线模型DecomMeta相比,在CrossNER 1-shot和5-shot设置中,DFSM的平均F1值分别提升了3.32和1.09个百分点,这表明DFSM在跨领域低资源场景下具有良好的泛化能力。 展开更多
关键词 命名实体识别 小样本学习 原型网络 全局边界矩阵 模糊跨度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部