-
题名受同轴对称抛物线约束的少数类样本合成方法
- 1
-
-
作者
朱宸敏
余粟
-
机构
上海工程技术大学电子电气工程学院
上海工程技术大学信息化办公室
-
出处
《计算机工程》
北大核心
2025年第5期196-205,共10页
-
基金
国家科技支撑计划(2015BAF10B00)
上海市科委科研计划(17511110204)。
-
文摘
线性插值是过采样技术中常见的样本合成方法,缺点是线性合成区域容易提高不同类别样本间的重叠度并降低采样结果的随机性,难以提升针对不平衡样本集的分类能力。为此,提出受同轴对称抛物线约束的样本合成方法。首先,建立一种自适应加权策略,通过危险度因子与相似度因子为少数类样本赋予权值,该权值能够决定采样过程中的样本合成方向及合成范围;然后,根据少数类样本与对应的样本权值构造一对同轴对称抛物线,并将这对抛物线相交得到的闭区域作为非线性的样本合成区域;最后,在引入新样本时通过该新样本近邻域内巴氏系数的变化情况判断此次采样是否能够有效避免入侵其他类别样本的分布区域,从而提高采样质量。在UCI机器学习库的6个公共样本集上实验结果表明,当C4.5作为分类器时,集成后的过采样方法与原始采样方法相比,精确率提高7.85百分点,召回率提高2.87百分点,G-means提高2.00百分点。
-
关键词
线性插值
抛物线
自适应加权
非线性合成区域
巴氏系数
-
Keywords
linear interpolation
parabolas
adaptive weighting
nonlinear synthesis region
Bhattacharyya coefficient
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-