-
题名基于ERes-ECAM的动物声纹识别
被引量:2
- 1
-
-
作者
侯卫民
孙艺菲
刘峻滔
-
机构
河北科技大学信息科学与工程学院
-
出处
《无线电通信技术》
北大核心
2024年第4期789-798,共10页
-
基金
河北省省级科技计划项目(20355901D,21355901D)。
-
文摘
声纹识别技术不仅在人类身份验证领域广泛应用,在动物种类识别方面也取得一定进展。现有模型存在特征表达能力不足的问题,同时,在保证性能的前提下,模型的时间复杂度和推理速度有待优化。提出用于发声动物嵌入学习的改进的残差块连接改进的上下文感知掩蔽(Enhanced Res2block connected Enhanced Context Aware Masking, ERes-ECAM)新型架构,采用了稠密连接的时延神经网络(Densely-connected Time Delay Neural Network, D-TDNN)作为骨干,为了解决模糊不相关噪声问题的同时能够提取更多有效的关键信息,在D-TDNN层中采用多粒度池化方法的改进的上下文感知掩蔽(Enhanced Context Aware Masking, ECAM)模块,前端连接残差模块,通过局部特征融合(Local Feature Fusion, LFF)的方式,将残差块内提取的特征进行融合来提取局部信息,提升了声纹验证系统的准确性和鲁棒性。在Anim-Celeb和Pig-Celeb两个测试集中分别实验,实验结果表明,所提架构的等错误率(Equal Error Rate, EER)分别达到6.88%和7.24%,同时,对动物种类和猪只种类识别准确率达到了93.12%和92.76%。
-
关键词
深度学习
声纹识别
上下文感知掩码
局部特征融合
动物种类识别
-
Keywords
deep learning
voiceprint recognition
context aware masking
LFF
animal species recognition
-
分类号
TN912.34
[电子电信—通信与信息系统]
-