-
题名基于对比学习的半监督命名实体识别
- 1
-
-
作者
徐世琤
祁瑞艳
李龙杰
马笠恭
马志新
-
机构
兰州大学信息科学与工程学院
兰州市公安局
-
出处
《兰州大学学报(自然科学版)》
北大核心
2025年第5期634-642,共9页
-
基金
甘肃省科技计划项目(23YFGA0005,21ZD8RA008)。
-
文摘
针对命名实体识别(NER)模型对大规模标注数据的过分依赖,以及半监督学习中忽略低置信度复杂样本的问题,提出一种新的半监督NER框架(CUPL),以充分利用包括不可靠样本在内的所有伪标签数据.CUPL模型对未标注数据实施数据增强,基于概率分布对预测得到的伪标签样本进行分类,区分出可靠与不可靠样本,通过构建正例对(原始样本与可靠样本)和负例对(原始样本与不可靠样本),计算样本对之间的相似性,以增强正例对的一致性并减少负例对的一致性,进而提升模型区分不同样本的能力.CUPL模型在CoNLL2003、GermEval 2014和GSNews Data数据集上的性能超过现有技术,验证了其在NER任务中的有效性.
-
关键词
命名实体识别
对比学习
数据增强
半监督学习
-
Keywords
named entity recognition
contrastive learning
data augmentation
semi-supervised learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-