-
题名开放世界下带有分布内和分布外噪声的长尾学习
- 1
-
-
作者
郑金鹏
李绍园
朱晓林
黄圣君
陈松灿
王康侃
-
机构
南京航空航天大学计算机科学与技术学院模式分析与机器智能工业和信息化部重点实验室
南京大学计算机软件新技术全国重点实验室
江苏省产品质量监督检验研究院
南京理工大学计算机科学与工程学院
-
出处
《南京航空航天大学学报(自然科学版)》
北大核心
2025年第5期842-851,共10页
-
基金
中央高校基本科研业务费专项资金(NS2024059)
国家自然科学基金(62376126)。
-
文摘
在训练深度神经网络时,实际应用数据常存在长尾类别分布、分布内噪声和分布外噪声等偏差。现有方法多单独解决类别不平衡或含噪声标签问题,很少同时考虑两者,尤其是两种噪声并存时。本文提出不平衡噪声标签校准(Imbalanced noisy label calibration,INLC)方法,用模型一致性预测筛选分布外样本并赋予均匀标签,增强模型对其检测能力;对分布内样本,利用Jensen-Shannon散度区分噪声,减少干净样本误分类,尤其针对尾部类别;引入额外语义分类器,缓解伪标签对多数类的偏向性以应对类别不平衡;采用基于强数据增强的一致性正则化方法提升模型泛化性能。在模拟和真实数据集上的实验表明,INLC显著减轻了标签噪声和类别不平衡的影响,分类准确率较优异基线方法提高2%以上。
-
关键词
长尾学习
开放世界
分布内和分布外噪声
伪标签
不平衡
-
Keywords
long-tailed learing
open world
in-and out-of-distribution noisy
pseudo-labels
imbalance
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-