-
题名一种提高非平衡数据集PSVM分类精度的方法
被引量:1
- 1
-
-
作者
曾凡仔
裘正定
-
机构
北京交通大学信息科学研究所
-
出处
《铁道学报》
EI
CAS
CSCD
北大核心
2004年第2期124-127,共4页
-
文摘
邻近支撑向量机(PSVM)是一种比较快捷分类器,然而当它用于非平衡样本集时,PSVM过拟合样本点数较多的一类,而低估样本点数较少的错分误差,因此导致了PSVM比较低的整体分类性能。为此,提出了一种改进算法,算法通过在求解分类平面时,只考虑错分样本造成误差,同时根据两类的错分样本数自适应的惩罚或奖励错分误差来消除两类样本点数差对整体分类性能的影响。实验结果验证了本文提出的改进算法的有效性。
-
关键词
邻近支撑向量机
拟牛顿算法
非平衡数据集分类
错分样本
-
Keywords
proximal support vector machine
DFP algorithm
unbalanced dataset classification
misclassification
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于影响函数的k-近邻分类
被引量:3
- 2
-
-
作者
职为梅
张婷
范明
-
机构
郑州大学信息工程学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2015年第7期1626-1632,共7页
-
基金
国家自然科学基金(61170223)
河南省教育厅科学技术研究重点项目(14A520016)资助课题
-
文摘
分类是一种监督学习方法,通过在训练数据集学习模型判定未知样本的类标号。与传统的分类思想不同,该文从影响函数的角度理解分类,即从训练样本集对未知样本的影响来判定未知样本的类标号。首先介绍基于影响函数分类的思想;其次给出影响函数的定义,设计3种影响函数;最后基于这3种影响函数,提出基于影响函数的k-近邻(k NN)分类方法。并将该方法应用到非平衡数据集分类中。在18个UCI数据集上的实验结果表明,基于影响函数的k-近邻分类方法的分类性能好于传统的k-近邻分类方法,且对非平衡数据集分类有效。
-
关键词
数据挖掘
监督学习
非平衡数据集分类
影响函数
K-近邻
-
Keywords
Data mining
Supervised learning
Classification of imbalanced data sets
Influence function
k-Nearest Neighbor (kNN)
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-