-
题名基于CNN-SVM性别组合分类的单通道语音分离
被引量:2
- 1
-
-
作者
孙林慧
张蒙
梁文清
-
机构
南京邮电大学通信与信息工程学院
-
出处
《信号处理》
CSCD
北大核心
2022年第12期2519-2531,共13页
-
基金
国家自然科学基金(61901227)
中国国家留学基金资助(202008320043)。
-
文摘
实际语音分离时,混合语音的说话人性别组合相关信息往往是未知的。若直接在普适的模型上进行分离,语音分离效果欠佳。为了更好地进行语音分离,本文提出一种基于卷积神经网络-支持向量机(CNN-SVM)的性别组合判别模型,来确定混合语音的两个说话人是男-男、男-女还是女-女组合,以便选用相应性别组合的分离模型进行语音分离。为了弥补传统单一特征表征性别组合信息不足的问题,本文提出一种挖掘深度融合特征的策略,使分类特征包含更多性别组合类别的信息。本文的基于CNN-SVM性别组合分类的单通道语音分离方法,首先使用卷积神经网络挖掘梅尔频率倒谱系数和滤波器组特征的深度特征,融合这两种深度特征作为性别组合的分类特征,然后利用支持向量机对混合语音性别组合进行识别,最后选择对应性别组合的深度神经网络/卷积神经网络(DNN/CNN)模型进行语音分离。实验结果表明,与传统的单一特征相比,本文所提的深度融合特征可以有效提高混合语音性别组合的识别率;本文所提的语音分离方法在主观语音质量评估(PESQ)、短时客观可懂度(STOI)、信号失真比(SDR)指标上均优于普适的语音分离模型。
-
关键词
性别组合识别
卷积神经网络-支持向量机
单通道语音分离
深度特征
-
Keywords
gender combination recognition
convolutional neural network-support vector machine
single-channel speech separation
deep feature
-
分类号
TN912.3
[电子电信—通信与信息系统]
-