-
题名基于核马氏聚类的中红外光谱异常样本检测方法研究
- 1
-
-
作者
胡瑞
李玉军
焦尚彬
孙鹏程
吴晨岩
-
机构
西安理工大学自动化与信息工程学院
陕西省复杂系统控制与智能信息处理重点实验室
-
出处
《光谱学与光谱分析》
北大核心
2025年第10期2816-2821,共6页
-
基金
国家自然科学基金项目(62371388)资助。
-
文摘
在烷烃类混合气体红外光谱定量分析中,人工标定样本制备流程复杂(需精确调控多组分气体浓度、环境温度及气体压力等参数),操作偏差容易导致光谱数据与标定浓度的偏离,产生异常样本。传统单一异常检测方法难以有效处理高维、非线性数据中的复杂异常模式。针对此问题,提出一种将核马氏距离(KMD)和K-means聚类协同的混合异常检测框架,创新性地将核化特征映射与动态密度聚类相结合,克服了在高维样本场景下的矩阵奇异问题及局部异常敏感度不足的缺陷。利用核马氏距离(KMD)构建非线性高维特征空间,通过协方差矩阵量化光谱-浓度映射关系异常度,设置95%置信度阈值(χ^(2)_{0.95})筛选潜在异常候选样本。结合K-means算法,将训练集划分为7个优化子簇(依据肘部法则确定),并通过测试样本到最近质心距离的标准差设置动态阈值剔除异常样本。最终通过逻辑与(AND)机制实现双阈值联合决策。实验采用德国Bruker Tensor27光谱仪采集938组样本(波长2.5~25μm,分辨率4 cm^(-1)),以甲烷、乙烷组分气体为重点分析对象。通过偏最小二乘(PLS)回归模型验证,与传统马氏距离(MD)方法对比。结果表明,剔除异常样本后,甲烷浓度预测相对误差(MRE)从38.29%降至18.77%,较MD方法(30.44%)多降低11.52个百分点;乙烷MRE从54.51%降至26.03%,较MD方法(39.42%)多降低13.39个百分点,模型分析准确度均提高了50%以上。本研究所提出的方法不仅在理论上突破了高维空间中异常检测的瓶颈,亦在实际应用中证明了其在复杂气体混合物红外光谱定量分析中的有效性。相比传统方法,核马氏距离与K-means聚类的混合检测框架在应对非线性和多维数据时表现出显著的鲁棒性。该方法为烷烃类混合气体红外光谱定量分析中的异常数据清洗提供了一种可靠有效的解决方案。
-
关键词
中红外光谱
核马氏距离
K-MEANS聚类
异常检测
-
Keywords
Mid-infrared spectroscopy
Kernel Mahalanobis distance(KMD)
K-means clustering
Anomaly detection
-
分类号
O657.33
[理学—分析化学]
-