-
题名结合朴素贝叶斯和欧氏距离的二类非均衡数据集成方法
被引量:5
- 1
-
-
作者
王磊
赵磊
郑宝玉
-
机构
南京邮电大学信号处理与传输研究院
东南大学移动通信国家重点实验室
-
出处
《信号处理》
CSCD
北大核心
2017年第4期528-532,共5页
-
基金
国家自然科学基金(61271240
61671253)
+3 种基金
江苏省高校自然科学基金重大项目(16KJA510004)
江苏省优势学科发展计划
东南大学移动通信国家重点实验室开放研究基金(2016D01)
南京邮电大学宽带无线通信与传感网技术教育部重点实验室开放研究基金(NYKL201509)
-
文摘
随着数据挖掘技术的发展,传统集成方法中的集成规则,例如Max rule,Min rule,Product rule,以及Sum rule,已经不能满足现实中对于二类非均衡数据分类正确率的需要。因此本文提出了基于朴素贝叶斯和欧氏距离的二类非均衡数据集成方法。该集成方法是以朴素贝叶斯为基分类器,其集成规则通过引入测试数据与训练数据之间的欧式距离以及训练数据中多数类与少数类之间的关系,在空间距离上加强了最终的分类结果与原始训练数据之间的关联性。实验结果表明,该集成方法在处理二类非均衡数据时,Area Under roc Curve(AUC)值与现存的集成方法相比显著提高,从而具有更好的分类性能。因此,本文方法在处理二类非均衡数据时具有明显优势。
-
关键词
二类非均衡数据
集成方法
欧氏距离
朴素贝叶斯
-
Keywords
binary imbalanced data
ensemble methods
Euclidean distance
Naive Bayes
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-