基于度量学习的邻域k凸包集成方法被引量：2

Neighbor k-convex-hull ensemble method based on metric learning

在线阅读下载PDF

导出

摘要 k局部凸包分类方法通过改进k近邻算法在处理小样本问题时的决策边界而显著提高分类性能,k子凸包分类方法通过克服k凸包分类对类数和样本环状分布的敏感性而改善了分类性能。但是,该方法仍然对样本距离度量方法敏感,并且在k邻域内不同类的样本数经常严重失衡,导致分类性能下降。针对上述问题,文章提出了一种邻域k凸包分类方法,并通过引入距离度量学习和集成学习技术来提高算法对样本空间度量的鲁棒性。大量实验表明,文中提出的基于度量学习的邻域k凸包集成方法具有显著的分类性能优势。 The k-local convex distance nearest neighbor classifier（CKNN） corrects the decision bounda- ry of kNN when the amount of the training data is small, thus improving the performance of kNN. The k sub-convex-hull classifier（kCH） weakens the sensitivity of CKNN to the number of classes and the ring structure of samples distribution, hence improves the classification performance. But this method is still sensitive to the distance metric. Moreover, different types of samples in k nearest neighbors of a test instance are often seriously imbalanced, which leads to the decline of classification performance. In this paper, a neighbor k-convex-hull classifier（NCH） is proposed to address these problems. The robustness of the neighbor k-convex-hull classifier is improved by the techniques of metric learning and ensemble learning. Experimental results show that the proposed neighbor k-con- vex-hull classifier ensemble method, which is based on metric learning, is significantly superior to some state-of-the-art nearest neighbor classifiers.

作者牟廉明

机构地区内江师范学院四川省高等学校数值仿真重点实验室

出处《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心 2013年第2期171-175,共5页 Journal of Hefei University of Technology：Natural Science

基金国家自然科学基金资助项目(10872085) 四川省科技厅应用基础研究基金资助项目(07JY029-125) 四川省教育厅重大培育资助项目(07ZZ016) 内江师范学院自然科学重点基金资助项目(12NJZ03)

关键词邻域k凸包度量学习 K近邻集成学习 neighbor k-convex-hull metric learning k-nearest neighbor ensemble learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介牟廉明（1971-），男，重庆万州人，内江师范学院副教授．

引文网络
相关文献

参考文献10

1Tan S. An effective refinement strategy for KNN text classiffer[J].Expert Systems with Applications,2006.290-298.
2张浩,谢飞.基于语义关联的文本分类研究[J].合肥工业大学学报（自然科学版）,2011,34(10):1501-1504. 被引量：4
3周晓飞,姜文瀚,杨静宇.l_1范数最近邻凸包分类器在人脸识别中的应用[J].计算机科学,2007,34(4):234-235. 被引量：5
4Vincent P,Bengio Y. K-local hyperplane and convex distance nearest neighbor algorithms[A].2001.985-992.
5牟廉明.k子凸包分类方法[J].山西大学学报（自然科学版）,2011,34(3):374-380. 被引量：5
6Weinberger K,Blitzer J,Saul L. Distance metric learning for large margin nearest neighbor classification[A].2006.1473-1480.
7Zhou Z H. Ensemble learning[M].Beilin:Springer-Verlag,2009.270-273.
8Zhou Z H,Yu Y. Ensembling local learners through multimodal perturbation[J].IEEE Transactions on Systems Man and Cybernetics-Part B:Cybernetics,2005,(04):725-735.
9琚旭,王浩,姚宏亮.基于Boosting的支持向量机组合分类器[J].合肥工业大学学报（自然科学版）,2006,29(10):1220-1222. 被引量：7
10Asuncion A. UCI machine learning repository[DB/OL].http://www.ics.uci.edu/～mlearn/MLRepository.html,2012.

二级参考文献32

1李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：96
2张剑,李春平.基于WordNet概念向量空间模型的文本分类[J].计算机工程与应用,2006,42(4):174-178. 被引量：16
3苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：391
4张文良,黄亚楼,倪维健.一种基于聚类的文本特征选择方法[J].计算机应用,2007,27(1):205-206. 被引量：10
5Yang Y, Lin X. A re-examination of text categorization methods [C]//The 22 nd Annual ACM SIGIR Conf on Reaearch and Development in Information Retrieval. New York: ACM Press, 1999 : 42- 49.
6Salton G,Wong A,Yang C S. On the specification of term values in automatic indexing [J]. Journal of Documenta- tion, 1973,29(4) : 351- 372.
7Yang Y. A comparative study on feature selection in text categorization [C]//Proceeding of the Fourteenth Interna- tional Conference on Machine Learning (ICML 97), 1997 : 412-420.
8Grzegorz K, Daniel M, Kevin K. Cognates can improve sta- tistical translation models [C]//Proeeedings of HLT- NAACL 2003: Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics, 2003:46-48.
9VapnikVN.统计学习理论的本质[M].北京：清华大学出版社,2000..
10Dietterich T G.Machine learning research:Four current directions[J].AI Magazine,1997,18(4):97-136.

共引文献17

1花小朋,王欢,兰少华.Boosting算法在入侵检测中的应用[J].通信技术,2007,40(9):64-66.
2王刚,周激流,何坤,杨柱中,吴俊强,朗方年.动态视频人脸考勤方法研究与实现[J].计算机科学,2008,35(4):294-296. 被引量：1
3刘全金,李颖新.Boosting算法在基因表达谱样本分类中的应用[J].计算机工程与应用,2008,44(14):228-230. 被引量：2
4姜文瀚,周晓飞,杨静宇.核子类凸包选样的核最近邻凸包分类器[J].计算机科学,2008,35(7):166-169.
5李亚军,刘晓霞,陈平.改进的AdaBoost算法与SVM的组合分类器[J].计算机工程与应用,2008,44(32):140-142. 被引量：8
6朱敏觉,朱宁波,袁异.一种多分类器集成的手写体汉字识别方法[J].计算机工程与科学,2009,31(4):36-39. 被引量：4
7贾凝.支持向量机模型在统计学上的应用研究[J].统计与决策,2010,26(13):159-161.
8牛永洁,常浩.基于Boosting与SVM的入侵检测技术[J].信息技术,2010,34(12):92-93. 被引量：1
9廖开际,杨彬彬.基于加权语义网的文本相似度计算的研究[J].情报杂志,2012,31(7):182-186. 被引量：10
10牟廉明.选择性自适应k子凸包分类方法[J].南京大学学报（自然科学版）,2013,49(4):411-417. 被引量：2

同被引文献9

1牟廉明.k子凸包分类方法[J].山西大学学报（自然科学版）,2011,34(3):374-380. 被引量：5
2赵岩,赵慧娟.数据挖掘理论与技术[J].福建电脑,2006,22(2):54-54. 被引量：14
3李波.数据仓库与联机分析处理(OLAP)技术[J].北京广播学院学报（自然科学版）,2005,12(4):66-69. 被引量：4
4Michael J.A;Berry Gordon S.Linoff.数据挖掘技术:市场营销、销售与客户关系管理领域应用[J],2006(07).
5周晓飞,姜文瀚,杨静宇.基于子空间样本选择的最近凸包分类器[J].计算机工程,2008,34(12):167-168. 被引量：7
6张莉.数据挖掘技术及应用现状[J].中国石油大学胜利学院学报,2008,22(2):34-35. 被引量：7
7牟廉明.选择性自适应k子凸包分类方法[J].南京大学学报（自然科学版）,2013,49(4):411-417. 被引量：2
8刘绍毓,周杰,李弼程,席耀一,唐浩浩.基于多分类SVM-KNN的实体关系抽取方法[J].数据采集与处理,2015,30(1):202-210. 被引量：21
9邹永祥,吴宗亮.一种广义不可分的支持向量机算法[J].数据采集与处理,2015,30(2):434-440. 被引量：6

引证文献2

1郭佳.浅析数据挖掘在高校教育实习评定中的应用[J].计算机光盘软件与应用,2013,16(18):215-217.
2牟廉明,刘好斌.基于特征选择的相对k子凸包分类方法[J].数据采集与处理,2017,32(5):1005-1011.

1詹德川,周志华.基于集成的流形学习可视化[J].计算机研究与发展,2005,42(9):1533-1537. 被引量：24
2武妍,王守觉.基于多层感知机和RBF转换函数的混合神经网络[J].计算机工程,2006,32(6):25-27. 被引量：2
3程凤伟.一种基于决策树的SVM算法[J].太原学院学报（自然科学版）,2017,35(1):33-36. 被引量：3
4沈媛媛,严严,王菡子.有监督的距离度量学习算法研究进展[J].自动化学报,2014,40(12):2673-2686. 被引量：25
5章东平,徐丽园.距离度量学习的摄像网络中行人重识别[J].中国计量大学学报,2016,27(4):424-428. 被引量：1
6陈开志,乐承沛,钟尚平.融合距离度量学习和SVM的图像匹配算法[J].小型微型计算机系统,2015,36(6):1353-1357. 被引量：9
7逯波,段晓东,王存睿,李泽东.基于多图像组信息的人脸识别研究[J].大连民族大学学报,2017,19(1):71-75.
8罗会兰,王威,王慧.一种基于集成学习技术的图像分割算法的研究[J].江西理工大学学报,2012,33(3):56-61. 被引量：2
9吴荣军,彭国华,罗卫民,叶正麟.四次带参Bzier曲线的形状分析[J].计算机辅助设计与图形学学报,2009,21(6):725-729. 被引量：12
10胥玲芳,王丽珍,夏勇.澜沧江数据仓库中空间度量的物化选取[J].计算机工程与应用,2004,40(18):178-180.

合肥工业大学学报（自然科学版）

2013年第2期

浏览历史

内容加载中请稍等...

基于度量学习的邻域k凸包集成方法被引量：2

参考文献10

二级参考文献32

共引文献17

同被引文献9

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于度量学习的邻域k凸包集成方法 被引量：2

参考文献10

二级参考文献32

共引文献17

同被引文献9

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于度量学习的邻域k凸包集成方法被引量：2