-
题名基于双路径循环神经网络的单通道语音增强
被引量:12
- 1
-
-
作者
王志杰
张学良
-
机构
内蒙古大学计算机学院
-
出处
《信号处理》
CSCD
北大核心
2021年第10期1872-1879,共8页
-
基金
国家自然科学基金项目(61876214)。
-
文摘
近年来,随着神经网络的应用,语音增强效果显著提升。但对关联性较强的长序列语音数据,单一的网络结构受到自身性能的限制可能无法继续提升增强效果。为了进一步提升神经网络对语音增强的效果,本文将一种被称为双路径循环神经网络(dual-path recurrent neural network,DPRNN)的复合网络结构应用在语音增强任务中。该复合网络结构由卷积神经网络(convolution neural network,CNN)和长短时记忆神经网络(Long short-term memory,LSTM)组成,网络的核心是两个LSTM组成的双路径循环神经网络块(DPRNN Block)。DPRNN将长序列语音数据分割为重叠帧数据块,利用DPRNN Block对这些数据块执行块内计算和块间计算,以此实现数据的局部和全局建模。实验结果表明,相比于单一网络结构,DPRNN在已知噪声和未知噪声条件下均取得最好结果。
-
关键词
语音增强
双路径循环神经网络
长短时记忆网络
卷积神经网络
-
Keywords
speech enhancement
dual-path recurrent neural network
long short-term memory
convolution neural network
-
分类号
TN912.35
[电子电信—通信与信息系统]
-