-
题名通道残差融合和时频注意力的说话人验证
- 1
-
-
作者
涂振华
赵腊生
毛嘉莹
-
机构
大连大学先进设计与智能计算省部共建教育部重点实验室
-
出处
《应用声学》
2025年第5期1232-1241,共10页
-
基金
辽宁省教育厅基本科研项目(LJKMZ20221838)
111计划项目(D23006)
大连市科技创新基金计划项目(2023JJ11CG002)。
-
文摘
近些年基于深度神经网络的说话人验证模型取得了显著的进展。然而,先前工作在融合频域局部特征方面仍存在局限,未能充分利用特征间的互补性,并且缺乏针对长时上下文的高效建模方法。为了解决上述的问题,提出了一种基于通道残差融合和时频注意力的说话人验证模型,采用注意力融合机制自动调整不同通道间局部特征的融合权值,增强模型对局部特征的表达能力。并且提出了一种时频混合通道注意力机制,对更远距离的帧间关系进行建模,提升了模型对长时上下文信息的捕获能力。通过在CN-Celeb数据集上进行的实验结果表明,在等错误率和最小检验代价两个指标上均优于对比模型,证明了该模型在不同说话人语境中的有效性。
-
关键词
说话人验证
神经网络
通道残差融合
通道注意力
-
Keywords
Speaker verification
Neural network
Channel residual fusion
Channel attention
-
分类号
TN912.34
[电子电信]
-