-
题名针对大规模训练集的支持向量机的学习策略
被引量:53
- 1
-
-
作者
李红莲
王春花
袁保宗
朱占辉
-
机构
北京交通大学信息科学研究所
北京三星通信技术研究所
河北建设集团有限公司
-
出处
《计算机学报》
EI
CSCD
北大核心
2004年第5期715-719,共5页
-
基金
国家自然科学重点基金 (697893 0 1)
国家"九七三"重点基础研究发展规划项目基金 (G19980 3 0 5 0 11)资助
-
文摘
当训练集的规模很大特别是支持向量很多时 ,支持向量机的学习过程需要占用大量的内存 ,寻优速度非常缓慢 ,这给实际应用带来了很大的麻烦 .该文提出了一种针对大规模样本集的学习策略 :首先用一个小规模的样本集训练得到一个初始的分类器 ,然后用这个分类器对大规模训练集进行修剪 ,修剪后得到一个规模很小的约减集 ,再用这个约减集进行训练得到最终的分类器 .实验表明 ,采用这种学习策略不仅大幅降低了学习的代价 ,而且这样获得的分类器的分类精度完全可以与直接通过大规模样本集训练得到的分类器的分类精度相媲美 ,甚至更优 ,同时分类速度也得到大幅提高 .
-
关键词
支持向量机
学习策略
大规模训练集
分类器
-
Keywords
support vector machines
pruning
large training set
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名应用快速多分类SVM的航空发动机故障诊断方法
被引量:20
- 2
-
-
作者
徐启华
师军
耿帅
-
机构
淮海工学院电子工程学院
西北工业大学第
-
出处
《推进技术》
EI
CAS
CSCD
北大核心
2012年第6期961-967,共7页
-
文摘
提出了一种新的快速多分类SVM算法,用于解决大样本情况下航空发动机的多类故障诊断问题。首先,选用层次支持向量机(H-SVM)来实现多类分类,用各类数据中心代表该类数据,通过自组织特征映射神经网络(SOFM)进行聚类,把类中心之间距离较近的数据归为同一个子类进行训练,得到H-SVM层次结构。其次,在训练H-SVM中的二元分类器时,应用相对边界向量(RBV)代替全部训练样本,在保持分类精度几乎不变的条件下大幅度减少了训练样本数,使训练时间明显缩短;同时,由于支持向量的数量减小,分类时间也相应缩短。在分类数据混迭较为严重的情况下,新算法先剔除混迭的异类数据,再计算RBV,并且把与计算的RBV距离小于一定数值的样本都选择来训练SVM,保证了RBV的合理性,防止了关键数据的丢失,有效提高了分类精度。针对一个航空涡喷发动机5类复合故障的分类进行了实例仿真,总的故障分类正确率达到91.2%,二元SVM的训练时间最多只有原来的16.20%;当训练样本总数达到7500的大规模情况下,根据本算法,约减后的样本数量只有原来的3.05%。仿真结果表明,提出的算法有效、可靠,容易实现。
-
关键词
航空发动机
支持向量机
故障诊断
大规模训练集
样本约减
神经网络
-
Keywords
Aero-engine
Support vector machines
Fault diagnosis
Large-scale training set
Sample pruning
Neu- ral networks
-
分类号
V263.6
[航空宇航科学与技术—航空宇航制造工程]
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于多层聚类的多分类SVM快速学习方法
被引量:8
- 3
-
-
作者
张春艳
倪世宏
张鹏
查翔
-
机构
空军工程大学航空航天工程学院
-
出处
《计算机工程与设计》
北大核心
2017年第2期522-527,共6页
-
文摘
针对SVM大规模多类样本学习效率较低的问题,提出一种基于多层聚类的多分类SVM快速学习方法。采用自下而上的方式构建二叉树层次结构,根据所得层次结构,对每个节点对应的样本进行学习。学习时对训练样本进行首次聚类得到若干类簇,对其中只有一类样本的类簇提取中心点;对有两类样本的类簇,根据其混合度,对其正负类样本设定不同的聚类数,进行二次聚类,提取所得类簇中心点。整合上述步骤中提取的中心点作为约简后的样本,学习并得到子分类器。仿真结果表明,基于多层聚类的多分类SVM快速学习方法能够在保证较高分类准确率的前提下,大幅约简训练样本,有效提高学习效率。
-
关键词
支持向量机
大规模训练集
多分类
多层聚类
二叉树
-
Keywords
SVM
large scale training set
multi-classification
multi-clustering
binary-tree
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于壳向量和中心向量的支持向量机
被引量:3
- 4
-
-
作者
薛贞霞
刘三阳
齐小刚
-
机构
西安电子科技大学理学院
河南科技大学理学院
-
出处
《数据采集与处理》
CSCD
北大核心
2009年第3期328-334,共7页
-
基金
国家自然科学基金(60674108
60705004)资助项目
河南省科技厅科技计划(082102210091)资助项目
-
文摘
针对支持向量机(Support vector machines,SVMs)中大规模样本集训练速度慢且分类精度易受野点影响的问题,提出一个基于样本几何信息的支持向量机算法。其基本步骤是,首先分别求取每类样本点的壳向量和中心向量,然后将求出的壳向量作为新的训练集进行标准的SVM训练得到超平面的法向量,最后利用中心向量来更新法向量从而减少野点的影响得到最终的分类嚣。实验表明,采用这种学习策略,不仅加快了训练速度,而且在一般情况下也提高了分类精度。
-
关键词
支持向量机
大规模训练集
壳向量
中心向量
-
Keywords
support vector machines
large scale training set
hull vectors
center vectors
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名UCM算法及其在电子政务网页分类系统中的应用
- 5
-
-
作者
李恒锐
万杨亮
周继华
-
机构
电子科技大学计算机科学与工程学院
[
重庆金美通信有限责任公司
-
出处
《计算机应用与软件》
CSCD
北大核心
2013年第1期213-215,共3页
-
文摘
针对大规模训练集的网页分类问题提出UCM(UC and SVM)分类方法。UCM算法结合了支持向量机SVM(Support Vector Machine)与无监督聚类UC(Unsupervised Clustering)的特点,使网页分类既有较高的准确率,又有较快的分类速度。在训练阶段,UCM算法利用UC方法形成聚类中心;在分类阶段,UCM算法计算待分类网页与正例中心及反例中心的距离,若距离差较大,用UC分类,否则用SVM分类。在电子政务网页分类系统中的应用表明,UCM网页分类算法在准确率方面远高于UC,略高于SVM;在分类速度上,UCM介于UC和SVM二者之间,远大于SVM。
-
关键词
支持向量机
聚类
大规模训练集
网页分类系统
电子政务
-
Keywords
SVM Clustering Large training set Webpage classification system E-government
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-