摘要
传统多余物微粒材质识别算法在判断金属和非金属微粒时,误判现象比较严重。本文将参数优化的梯度提升决策树算法(Gradient boosting decision tree,GBDT)应用于多余物材质识别。特征选择方面,在原有的脉冲面积、脉冲左右对称度、脉冲上下对称度、脉冲持续时间、脉冲上升占比、能量密度、脉冲占比、波峰系数、面积占比、频谱质心、均方频率、方差、过零点率和均方根差14个特征基础上,利用小波变换提取出了能量系数作为新的特征值,并建立新的样本特征集。然后结合机器学习方法训练得到基于GBDT多余物材质识别模型。为了使分类器性能达到最优,对其进行超参数调优。采用贝叶斯优化库中的分布式异步超参数优化模块(Hyperopt),并结合树形窗密度评估器(Parzen)可以获得模型的最佳优化参数。经过与K近邻(K-nearest neighbor classification,KNN)和支持向量机分类模型(Support vector machine,SVM)进行对比,结果表明,采用参数优化的GBDT算法对金属和非金属微粒具有很好的识别效果,能够有效提高其分类性能。
Traditional algorithms for recognizing the material of loose particles have serious misjudgments when judging metals and non-metals.The parameter-optimized gradient boosting decision tree algorithm(GBDT)was applied to the recognition of redundant materials.In terms of feature selection,based on original 14 features of the original pulse area,pulse left-right symmetry,pulse up-and-down symmetry,pulse duration,pulse rise percentage,energy density,pulse percentage,crest factor,area percentage,spectral centroid,mean square frequency,variance,zero-crossing rate,and root mean square error,wavelet transform was used to extract the energy coefficient as a new feature value,and a new sample feature set was established,and then combined with machine learning methods to train a GBDT-based redundant material recognition model.In order to optimize the performance of the classifier,hyperparameter tuning was performed on it.The Hyperopt tool optimized by Bayesian was used,combined with the tree-shaped Parzen estimator to obtain the most suitable parameters.The results indicate that the parameter-optimized GBDT algorithm has a good recognition effect on metal and non-metal particles,and can improve the classification performance effectively by comparing with KNN and support vector machine classification models.
作者
吕冰泽
王国涛
汪国强
李硕
Lü Bingze;WANG Guotao;WANG Guoqiang;LI Shuo(College of Electronic Engineering,Heilongjiang University,Harbin 150080,China;Electrical and Electronic Reliability Research Institute,Harbin Institute of Technology,Harbin 150001,China)
出处
《黑龙江大学自然科学学报》
CAS
2021年第6期748-756,共9页
Journal of Natural Science of Heilongjiang University
基金
国家自然科学基金资助项目(31570492)。
作者简介
通讯作者:汪国强(1963-),男,黑龙江大学电子工程学院教授,电子工程学院副院长。黑龙江省科技厅和哈尔滨市科技局科技开发项目评审和验收专家。1985年、1988年,分别获得黑龙江大学本科与硕士学位,2006年,获东北大学控制理论与控制工程博士学位。2000年,转到黑龙江大学电子工程学院电子信息工程专业工作。2003年~2004年,受学校委派,到英国布拉德福德大学进修访问1年。作为初始成员,参与申报“信号与信息处理”二级硕士学科学位点,2004年,学位点获批,开始招收硕士研究生。目前,已培养的全日制学术硕士和专业硕士研究生近40人,非全日制专业硕士研究生15人。主讲研究生课程:专业外语、传感器和信号调节和微弱信号检测等。主要从事视频图像处理、行为态势检测、信号检测与故障诊断等方面的研究工作。参与国家科技部“973”项目1项,国家基金项目1项,黑龙江省科技厅项目1项。在Hyperspectral Band Selection Based on Adaptive Neighborhood Grouping and Local Structure Correlation等SCI期刊和核心期刊发表文章40余篇。获得第四届全球智能控制与自动化大会优秀论文奖1项,获得黑龙江省科学技术进步一等奖1项和哈尔滨市科学技术进步一等奖1项,获得黑龙江省人力资源和社会保障厅省级留学回国人员科技项目优秀项目1项。编写教材2部,E-mail:wangguoqiang@hlju.edu.cn。