-
题名噪声标签回归的泛化误差估计及过滤算法
- 1
-
-
作者
姜高霞
李政莹
王文剑
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《小型微型计算机系统》
北大核心
2025年第1期72-80,共9页
-
基金
国家自然科学基金项目(62276161,U21A20513,62076154,61906113)资助
山西省重点研发计划项目(202202020101003,202302010101007)资助。
-
文摘
当回归数据中存在数值型标签噪声时,传统泛化误差估计方法不再适用,回归模型的泛化性能缺乏保障.本文提出一种面向标签噪声的回归模型泛化误差估计方法,并设计了自适应高斯核噪声估计与样本召回过滤(adaptive Gaussian kernel noise estimator and sample recall filtering, AGKSRF)算法.在所提Craven-Wahba(CW)泛化误差估计的基础上,提出一种CW样本选择框架.基于最大后验估计思想和自适应近邻方法,提出标签噪声的自适应高斯核(adaptive Gaussian kernel, AGK)估计方法.结合所提框架,AGKSRF首先过滤大噪声样本,同时考虑到初次过滤时可能有部分干净样本被误删,AGKSRF根据模型在过滤样本上的误差对样本进行召回再过滤.标准数据集上的实验结果表明,AGKSRF降低模型误差的能力提升了6~51个百分点.AGKSRF还可以识别年龄估计数据上的错误标签.因此,AGKSRF算法可以有效提升数据质量.
-
关键词
噪声标签回归
泛化误差估计
自适应高斯核估计
样本召回过滤
-
Keywords
regression with noisy labels
generalization error estimation
adaptive Gaussian kernel estimator
sample recall filtering
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-