-
题名基于Voigt函数的拉曼光谱样本数据增强方法
- 1
-
-
作者
卜子川
刘继红
任凯利
刘驰
张家庚
严学文
-
机构
西安邮电大学电子工程学院
-
出处
《光谱学与光谱分析》
北大核心
2025年第9期2502-2510,共9页
-
基金
国家自然科学基金项目(62305268)资助。
-
文摘
拉曼光谱技术在现代分析化学和物理化学领域扮演着重要角色,尤其在揭示物质结构和性质方面提供了重要信息。近年来,深度学习和人工智能技术的发展为拉曼光谱分析提供了新方向,并且在光谱分类和识别中表现优异,但深度学习模型性能高度依赖数据规模与质量,而拉曼光谱数据的采集比较耗时并且类型单一,无法满足模型的训练需要,因此需要通过数据增强技术来实现训练数据的扩增。针对以上问题,提出了一种基于Voigt函数的拉曼光谱样本数据增强方法,通过对光谱中的谱峰使用Voigt函数进行拟合,然后将每个拟合峰在指定范围内随机进行左右平移和幅值变化,最后将所有拟合峰线性叠加,从而达到增强数据集的目的。本文将该方法与常用的三种拉曼光谱数据增强方法(加噪法、偏移法和左右平移法)在一组少样本多类别的拉曼光谱数据下进行对比,通过结构相似度(SSIM)和PCA总解释方差占比两种评价指标,评估了不同方法生成的增强光谱的质量,并分别在K近邻(KNN)、支持向量机(SVM)和一维卷积神经网络(1D-CNN)三种分类模型中进行训练和测试,以评估模型的分类性能和泛化能力。结果表明:Voigt函数法得到的拉曼增强光谱在两种评价指标中表现优异,且在由增强数据集所训练的分类模型中,验证集和原始数据集在加噪法、偏移法和Voigt函数法的三种分类模型中的准确率均为100%,而左右平移法的分类模型表现较差,其准确率分别为99.80%和96.35%(KNN)、98.75%和100%(SVM)以及94.89%和98.54%(1D-CNN)。在模拟生成的异常数据中,由常用方法增强数据训练的模型都存在对某种异常数据性能较差的情况,而由Voigt函数法增强数据训练的模型在各种异常数据中性能均表现优秀。综上所述,基于Voigt函数的拉曼光谱样本数据增强方法能够有效地提升增强样本的多样性,训练的模型具有良好的泛化能力及鲁棒性,适用于需要高异常数据处理能力和高泛化能力的场景,在拉曼光谱分析技术领域具有一定的应用价值。
-
关键词
拉曼光谱
数据增强
深度学习
一维卷积神经网络
Voigt函数
-
Keywords
Raman spectroscopy
Data augmentation
Deep learning
One-dimensional convolutional neural network
Voigt function
-
分类号
O657.3
[理学—分析化学]
-