-
题名基于模型的单通道语音分离综述
被引量:4
- 1
-
-
作者
杨海滨
张军
-
机构
国防科学技术大学信息系统与管理学院
-
出处
《计算机应用研究》
CSCD
北大核心
2010年第11期4025-4031,共7页
-
文摘
语音分离是实现机器听觉的一个重要而基础性的任务,单通道语音分离是语音分离中最为困难的问题。讨论了基于模型的单通道语音分离方法,对说话人依赖的、说话人选择的和说话人独立的三类单通道语音分离问题展开分析,并指出当前方法存在的问题和影响算法性能的关键因素。最后对基于模型的单通道语音分离研究发展方向进行了展望。
-
关键词
单通道语音分离
基于模型
说话人依赖
说话人选择
说话人独立
-
Keywords
single-channel speech separation
model-based
speaker-dependent
speaker-selection
speaker-independent
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于CNN-SVM性别组合分类的单通道语音分离
被引量:2
- 2
-
-
作者
孙林慧
张蒙
梁文清
-
机构
南京邮电大学通信与信息工程学院
-
出处
《信号处理》
CSCD
北大核心
2022年第12期2519-2531,共13页
-
基金
国家自然科学基金(61901227)
中国国家留学基金资助(202008320043)。
-
文摘
实际语音分离时,混合语音的说话人性别组合相关信息往往是未知的。若直接在普适的模型上进行分离,语音分离效果欠佳。为了更好地进行语音分离,本文提出一种基于卷积神经网络-支持向量机(CNN-SVM)的性别组合判别模型,来确定混合语音的两个说话人是男-男、男-女还是女-女组合,以便选用相应性别组合的分离模型进行语音分离。为了弥补传统单一特征表征性别组合信息不足的问题,本文提出一种挖掘深度融合特征的策略,使分类特征包含更多性别组合类别的信息。本文的基于CNN-SVM性别组合分类的单通道语音分离方法,首先使用卷积神经网络挖掘梅尔频率倒谱系数和滤波器组特征的深度特征,融合这两种深度特征作为性别组合的分类特征,然后利用支持向量机对混合语音性别组合进行识别,最后选择对应性别组合的深度神经网络/卷积神经网络(DNN/CNN)模型进行语音分离。实验结果表明,与传统的单一特征相比,本文所提的深度融合特征可以有效提高混合语音性别组合的识别率;本文所提的语音分离方法在主观语音质量评估(PESQ)、短时客观可懂度(STOI)、信号失真比(SDR)指标上均优于普适的语音分离模型。
-
关键词
性别组合识别
卷积神经网络-支持向量机
单通道语音分离
深度特征
-
Keywords
gender combination recognition
convolutional neural network-support vector machine
single-channel speech separation
deep feature
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于强约束字典联合深度神经网络的单通道语音分离
被引量:1
- 3
-
-
作者
孙林慧
袁硕
张蒙
梁文清
步云怡
-
机构
南京邮电大学通信与信息工程学院
-
出处
《南京邮电大学学报(自然科学版)》
北大核心
2023年第2期1-10,共10页
-
基金
国家自然科学基金(61901227,62071242)资助项目。
-
文摘
针对基于字典学习语音分离方法的“交叉投影”问题,提出了强约束的优化函数,不仅抑制重构信号和目标信号的误差,约束干净信号在联合字典上的误差,而且抑制干净信号在其他字典上的投影并限制字典间的原子相关性。此外,为了进一步提高两个相似信号的分离效果,提出基于强约束字典联合深度神经网络的单通道语音分离方法,首先利用强约束字典实现目标与干扰语音的初步分离,然后通过联合约束利用深度神经网络实现语音与干扰语音交叉投影残余的分离。实验结果表明,与其他优秀单通道语音分离方法相比,该算法有效提升了语音分离系统的性能。
-
关键词
单通道语音分离
字典学习
深度神经网络
损失函数
语音增强
-
Keywords
single⁃channel speech separation
dictionary learning
deep neural network
loss function
speech enhancement
-
分类号
TN912.3
[电子电信—通信与信息系统]
-