期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
受同轴对称抛物线约束的少数类样本合成方法
1
作者 朱宸敏 余粟 《计算机工程》 北大核心 2025年第5期196-205,共10页
线性插值是过采样技术中常见的样本合成方法,缺点是线性合成区域容易提高不同类别样本间的重叠度并降低采样结果的随机性,难以提升针对不平衡样本集的分类能力。为此,提出受同轴对称抛物线约束的样本合成方法。首先,建立一种自适应加权... 线性插值是过采样技术中常见的样本合成方法,缺点是线性合成区域容易提高不同类别样本间的重叠度并降低采样结果的随机性,难以提升针对不平衡样本集的分类能力。为此,提出受同轴对称抛物线约束的样本合成方法。首先,建立一种自适应加权策略,通过危险度因子与相似度因子为少数类样本赋予权值,该权值能够决定采样过程中的样本合成方向及合成范围;然后,根据少数类样本与对应的样本权值构造一对同轴对称抛物线,并将这对抛物线相交得到的闭区域作为非线性的样本合成区域;最后,在引入新样本时通过该新样本近邻域内巴氏系数的变化情况判断此次采样是否能够有效避免入侵其他类别样本的分布区域,从而提高采样质量。在UCI机器学习库的6个公共样本集上实验结果表明,当C4.5作为分类器时,集成后的过采样方法与原始采样方法相比,精确率提高7.85百分点,召回率提高2.87百分点,G-means提高2.00百分点。 展开更多
关键词 线性插值 抛物线 自适应加权 非线性合成区域 巴氏系数
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部