-
题名面向合成语音检测的弹性正交权重修正连续学习算法
- 1
-
-
作者
张晓辉
易江燕
陶建华
周俊佐
-
机构
中国科学院自动化研究所
北京交通大学计算机与信息技术学院
清华大学自动化系
-
出处
《计算机研究与发展》
北大核心
2025年第2期336-345,共10页
-
基金
国家重点研发计划项目(2020AAA0140003)
国家自然科学基金项目(61831022,U21B2010,61901473,62006223,2101553)。
-
文摘
目前,深度学习在合成语音检测领域取得了巨大的成功.然而,通常情况下,深度模型可以在与训练集分布相似的测试集上取得高准确率,但在跨数据集的情境下,其准确率却会显著下降.为了提高模型在新数据集上的泛化能力,通常需要对其进行微调,但这会导致模型遭受灾难性遗忘.灾难性遗忘指的是模型在新数据上的训练会损害其从旧数据中获得的知识,导致对旧数据的识别性能下降.目前,克服灾难性遗忘的主要算法之一是连续学习.面向合成语音检测提出了一种连续学习算法——弹性正交权重修正(elastic orthogonal weight modification,EOWM),用于克服灾难性遗忘.该算法通过修正模型在学习新知识时的参数更新方向和更新幅度,以减少对已学知识的损害.具体来说,该算法在模型学习新知识时要求参数的更新方向与旧任务的数据分布正交,并同时限制对旧任务中重要参数的更新幅度.在合成语音检测领域的跨数据集实验中,算法取得了良好的效果.与微调相比,该算法在旧数据集上的等错误率(equal error rate,EER)从7.334%降低至0.821%,相对下降了90%;在新数据集上的等错误率从0.513%降低至0.315%,相对下降了40%.
-
关键词
合成语音检测
连续学习
弹性正交权重修正
预训练模型
深度神经网络
-
Keywords
synthetic speech detection
continual learning
elastic orthogonal weight modification
pre-trained model
deep neural network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-