基于广义特征值的最接近支持向量机(Proximal Support Vector Machine via Generalized Eigenvalues,GEPSVM)是一种新的具有与SVM性能相当的两分类方法,通过求解广义特征值来获得两个彼此不平行的拟合两类样本的超平面.其决策是将测试...基于广义特征值的最接近支持向量机(Proximal Support Vector Machine via Generalized Eigenvalues,GEPSVM)是一种新的具有与SVM性能相当的两分类方法,通过求解广义特征值来获得两个彼此不平行的拟合两类样本的超平面.其决策是将测试样本归为距其最近的超平面所在的类.然而,该规则在某些情形会导致较差的分类结果.对此,在GEPSVM基础上,通过在类拟合超平面上寻找一个包含了所有训练样本投影的局部凸区域,来决定样本的类别.该局部方法不仅具有较GEPSVM更优的分类性能,同时还衍生出了求解超平面上凸壳的简单且易于核化的新算法.最后在人工和UCI数据集上获得了验证.展开更多
当两类样本分布存在差异时,最接近支持向量机(Proximal Support Vector Machine,PSVM)等最小二乘类分类器分类结果将出现偏差,不能实现最小错误率分类.本文在分析PSVM等价广义特征值分解模型基础上,提出了一种改善原PSVM分类决策面的优...当两类样本分布存在差异时,最接近支持向量机(Proximal Support Vector Machine,PSVM)等最小二乘类分类器分类结果将出现偏差,不能实现最小错误率分类.本文在分析PSVM等价广义特征值分解模型基础上,提出了一种改善原PSVM分类决策面的优化样本分布PSVM,其基本思想是通过引入最大化正确分类样本距决策面距离,同时最小化错误分类样本距决策面距离的优化样本分布正则化项,构造优化样本分布PSVM的广义特征值分解模型.通过人工数据集和UCI数据集的10个数据子集上的对比实验,验证了该改进分类模型能够有效调整决策边界,从而获得更好的分类效果.展开更多
局部化广义特征值最接近支持向量机(Localized GEPSVM,LGEPSVM)是从广义特征值最接近支持向量机(GEPSVM:Proximal Support Vector Machine via Generalized Eigenvalues)衍生而来,其原理是在GEPSVM通过求解广义特征值获得两个彼此不平...局部化广义特征值最接近支持向量机(Localized GEPSVM,LGEPSVM)是从广义特征值最接近支持向量机(GEPSVM:Proximal Support Vector Machine via Generalized Eigenvalues)衍生而来,其原理是在GEPSVM通过求解广义特征值获得两个彼此不平行的超平面的基础上,分别求解两个超平面的凸壳,修改GEPSVM的分类判据为将测试样本归为距其最近凸壳所属的那一类.分析和实验表明,LGEPSVM较之GEPSVM具有更高的分类精度.然而,由于LGEPSVM在训练和分类过程中都涉及凸壳计算问题,因而费时较多.为了缓解这一问题,本文提出的基于马氏度量的最小椭圆凸壳算法MLGEPSVM(LGEPSVM based on Mahalanobis Metric),即分类时只需要判断样本与对应椭圆凸壳的距离.较之LGEPSVM和GEPSVM,MLGEPSVM具有如下几个特点:(1)给出了马氏度量下的椭圆凸壳计算方法,(2)分类速度更快,(3)更低的存储空间,每类样本仅需存储椭圆凸壳(可通过中心和协方差表示),而不是所有的凸壳顶点.在人工和标准数据集上的实验,验证了MLGEPSVM的上述性能.展开更多
文摘基于广义特征值的最接近支持向量机(Proximal Support Vector Machine via Generalized Eigenvalues,GEPSVM)是一种新的具有与SVM性能相当的两分类方法,通过求解广义特征值来获得两个彼此不平行的拟合两类样本的超平面.其决策是将测试样本归为距其最近的超平面所在的类.然而,该规则在某些情形会导致较差的分类结果.对此,在GEPSVM基础上,通过在类拟合超平面上寻找一个包含了所有训练样本投影的局部凸区域,来决定样本的类别.该局部方法不仅具有较GEPSVM更优的分类性能,同时还衍生出了求解超平面上凸壳的简单且易于核化的新算法.最后在人工和UCI数据集上获得了验证.
文摘当两类样本分布存在差异时,最接近支持向量机(Proximal Support Vector Machine,PSVM)等最小二乘类分类器分类结果将出现偏差,不能实现最小错误率分类.本文在分析PSVM等价广义特征值分解模型基础上,提出了一种改善原PSVM分类决策面的优化样本分布PSVM,其基本思想是通过引入最大化正确分类样本距决策面距离,同时最小化错误分类样本距决策面距离的优化样本分布正则化项,构造优化样本分布PSVM的广义特征值分解模型.通过人工数据集和UCI数据集的10个数据子集上的对比实验,验证了该改进分类模型能够有效调整决策边界,从而获得更好的分类效果.
文摘局部化广义特征值最接近支持向量机(Localized GEPSVM,LGEPSVM)是从广义特征值最接近支持向量机(GEPSVM:Proximal Support Vector Machine via Generalized Eigenvalues)衍生而来,其原理是在GEPSVM通过求解广义特征值获得两个彼此不平行的超平面的基础上,分别求解两个超平面的凸壳,修改GEPSVM的分类判据为将测试样本归为距其最近凸壳所属的那一类.分析和实验表明,LGEPSVM较之GEPSVM具有更高的分类精度.然而,由于LGEPSVM在训练和分类过程中都涉及凸壳计算问题,因而费时较多.为了缓解这一问题,本文提出的基于马氏度量的最小椭圆凸壳算法MLGEPSVM(LGEPSVM based on Mahalanobis Metric),即分类时只需要判断样本与对应椭圆凸壳的距离.较之LGEPSVM和GEPSVM,MLGEPSVM具有如下几个特点:(1)给出了马氏度量下的椭圆凸壳计算方法,(2)分类速度更快,(3)更低的存储空间,每类样本仅需存储椭圆凸壳(可通过中心和协方差表示),而不是所有的凸壳顶点.在人工和标准数据集上的实验,验证了MLGEPSVM的上述性能.