-
题名DRO框架下不平衡分类损失函数重加权优化
被引量:1
- 1
-
-
作者
李佳静
林耿
-
机构
福建师范大学数学与统计学院
闽江学院计算机与大数据学院
-
出处
《计算机应用研究》
北大核心
2025年第8期2428-2436,共9页
-
基金
福建省自然科学基金资助项目(2024J011180)。
-
文摘
在不平衡数据的多分类任务中,由于类别分布存在数量差异,分类器的决策边界往往偏向多数类别,从而导致模型难以实现准确分类。现有研究主要关注于数据平衡策略和损失函数的结构调整,忽视了样本标签可能存在标注错误或噪声,标签信息的不确定性会进一步增加分类的难度。为解决这一问题,提出了一种名为加权标签分布稳健(weighted label distributionally robust Kullback-Leibler,WLDR-KL)的损失函数。该损失利用先验信息和标签权重显式地调整模型对少数类别的关注度,通过优化最不利的集合下的预测分布来应对数据标签不确定性下的不平衡分类任务。此外,利用Monte Carlo模拟提出了一种不平衡数据集的仿真方法,以更全面地评估各损失函数在不同类别和不同数量差异水平下的表现。在多组模拟数据集、UCI和Kaggle数据集上的实验结果表明,所提出的方法在处理不平衡数据时表现良好,并且在top-k准确率、F_(1)值、精度、召回率上均实现了一定程度的提升,为解决不平衡分类问题提供了一种有效的方法。
-
关键词
不平衡分类
数据标签不确定性
加权标签分布稳健损失
-
Keywords
multi-class imbalanced task
data label uncertainty
weighted labeled distribution robust loss
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-