-
题名光谱数据增强方法及其应用进展
- 1
-
-
作者
唐磊
茅晔辉
蔡婧
刘恒钦
闵红
安雅睿
刘曙
-
机构
上海理工大学材料与化学学院
上海海关工业品与原材料检测技术中心
-
出处
《分析测试学报》
北大核心
2025年第6期1227-1236,共10页
-
基金
海关总署科技项目(2024HK186)。
-
文摘
随着机器学习在光谱分析中的深入应用,模型训练面临数据样本稀缺、类别分布失衡等挑战,制约模型的泛化性能并引发过拟合风险。该文综述了2017年以来国内外公开文献,将光谱数据增强方法归纳为非深度学习数据增强方法和深度学习数据增强方法两大类,揭示了其从浅层数据扩充向深度生成建模的演进趋势。非深度学习的数据增强方法通过光谱变换和光谱合成来实现数据扩展,凭借其计算效率优势,在工业过程监控、中药材溯源及药物与食品质量检测等小样本场景中展现出良好的适用性。深度生成模型主要为生成对抗网络(GAN)及其衍生方法和改进型自编码器(AE)。GAN通过对抗博弈机制生成与原始数据具有结构相似性和分布一致性的增强样本,在医疗影像诊断、精准农业和材料分类等高精度建模场景广泛应用;改进型AE通过潜在空间表征学习捕获数据本质特征,其生成数据既保持原始分布特性又具备特征鲁棒性,在化学物质鉴定和土壤成分检测等高维数据处理任务中优势显著。该综述指出了现有数据增强方法的局限性,并对未来发展方向进行了探讨。
-
关键词
数据增强
光谱分析
深度学习
生成对抗网络
变分自编码器
-
Keywords
data augmentation
spectral analysis
deep learning
generate adversarial network
variational autoencoder
-
分类号
O433
[机械工程—光学工程]
N37
[自然科学总论]
-