-
题名基于MAML改进的少样本声音事件检测算法
- 1
-
-
作者
陈豪杰
杨锐
潘善亮
-
机构
宁波大学信息科学与工程学院
-
出处
《数据采集与处理》
北大核心
2025年第3期741-753,共13页
-
基金
宁波市重点研发计划(2022Z189)。
-
文摘
基于深度学习的声音事件检测模型通常需要大量带标注的数据从头进行训练,但是受到数据访问权限、使用许可以及罕见个例样本稀缺等因素制约,获取特定任务的数据成本高昂。为应对声音事件检测中的少样本挑战,本文在与模型无关的元学习(Model-agnostic meta learning,MAML)基础上提出一种模型无关且梯度平衡的元学习算法。该算法利用大量N-way K-shot任务训练模型,使其具备快速学习的能力,仅需少次梯度更新即可在N-way K-shot目标任务中识别未见声音事件。在外循环阶段,多梯度下降算法被用于估计动态损失平衡因子,促使模型关注训练难度更高的少样本任务,从而增强模型的共享表示。本文还融入数据增强和标签平滑,进一步降低少样本引起的过拟合。实验结果表明,该算法在ESC50、NSynth以及DCASE2020三个数据集的5-way 1-shot设定中分别达到73.56%、82.86%以及57.48%准确率,相较于改进前的MAML算法相对准确率提升10%左右。
-
关键词
少样本学习
声音事件检测
元学习
跨任务模型训练
-
Keywords
few-shot learning
sound event detection
meta-learning
cross-task model training
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-