-
题名使用NGN算法改进不平衡数值数据的研究
- 1
-
-
作者
邢长征
郑鑫
梁浚锋
-
机构
辽宁工程技术大学电子与信息工程学院
-
出处
《计算机应用研究》
北大核心
2025年第6期1755-1761,共7页
-
基金
辽宁省教育厅重点资助项目(LJ212410147003)
国家重点研发计划资助项目(2018YFB402900)。
-
文摘
在少数类样本极少的情况下,传统过采样方法难以增加样本数量。为此提出了一种数值生成网络(NGN)算法。该算法将生成器生成的数据作为噪声添加到原始的少数类样本数据中合成新数据,直至达到平衡。生成器采用四层全连接网络,结合低结构和高结构特征生成方法提升数据生成质量和多样性。针对极少数类样本,NGN生成新样本后,与原始少数类数据合并后进行聚类,将聚类后的簇内达到平衡,减小噪声对数据的影响。在6个不平衡数据集上,采用4种算法增加少数类样本使数据集达到平衡,再对所有的数据集使用4种方法分类。实验结果表明,NGN能够增加一定的少数类数量,能够帮助分类模型学习更多少数类的特征,提高分类性能。
-
关键词
数值生成网络
生成器
噪声
极少数类
平衡
-
Keywords
numerical generator network(NGN)
generator
noise
extremely scarce minority class
balance
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
-