-
题名利用全局-局部特征依赖的反欺骗说话人验证系统
- 1
-
-
作者
张嘉琳
任庆桦
毛启容
-
机构
江苏大学计算机科学与通信工程学院
江苏省大数据泛在感知与智能农业应用工程研究中心(江苏大学)
-
出处
《计算机应用》
北大核心
2025年第1期308-317,共10页
-
基金
国家自然科学基金面上项目(62176106)
江苏大学应急管理学院专项科研项目(KY-A-01)。
-
文摘
针对现有卷积模型为主的反欺骗说话人验证系统捕获全局特征依赖不理想的问题,提出一种利用全局-局部特征依赖的反欺骗说话人验证系统。首先,对于欺骗语音检测模块,设计两种滤波器组合方式对原始语音进行滤波,并通过对频率子带的掩蔽实现样本扩充;其次,提出多维全局注意力机制,通过对信道维度、频率维度和时间维度分别进行池化,获得每个维度的全局依赖关系,并将全局信息通过加权的方式与原始特征相融合;最后,在说话人验证部分引入统计金字塔池化时延神经网络(SPD-TDNN),在获取多尺度时频特征的同时计算特征的标准差,并加入全局信息。实验结果表明,与集成时频图卷积(AASIST)模型相比,在ASVspoof2019数据集上提出的欺骗语音检测系统将等错误率(EER)降低了65.4%;与单独的金字塔池化说话人验证系统相比,提出的反欺骗说话人验证系统将欺骗感知说话人验证等错误率降低了约97.8%。以上验证了所提两个模块借助全局特征依赖能实现更好的分类效果。
-
关键词
说话人验证
数据增强
频率掩蔽
注意力机制
欺骗语音检测
-
Keywords
speaker verification
data augmentation
frequency masking
attention mechanism
speech spoofing detection
-
分类号
TN912.34
[电子电信—通信与信息系统]
-