期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种时频平滑的深度神经网络语音增强方法 被引量:6
1
作者 袁文浩 梁春燕 +2 位作者 娄迎曦 房超 王志强 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第4期130-136,共7页
由于现有的基于深度神经网络的语音增强方法在网络结构的设计上缺乏对语音增强问题自身特点的考虑,针对这一问题,基于语音增强在时间和频率两个维度上的不同特性,受传统语音增强方法中的含噪语音局部特征计算方法启发,设计了一种在时间... 由于现有的基于深度神经网络的语音增强方法在网络结构的设计上缺乏对语音增强问题自身特点的考虑,针对这一问题,基于语音增强在时间和频率两个维度上的不同特性,受传统语音增强方法中的含噪语音局部特征计算方法启发,设计了一种在时间和频率两个维度上进行不同处理的时频平滑网络.该网络采用门控循环单元来表达含噪语音在时间上的相关性,同时采用卷积神经网络来表达含噪语音在频率上的相关性,实现了类似传统语音增强方法的时频平滑处理.实验结果表明,这种时频平滑网络在保证语音增强系统因果性的前提下,相比其他网络显著地提高了语音增强性能,增强后的语音具有更好的语音质量和可懂度. 展开更多
关键词 语音增强 时频平滑 卷积神经网络 深度神经网络
在线阅读 下载PDF
利用生成噪声提高语音增强方法的泛化能力 被引量:6
2
作者 袁文浩 娄迎曦 +1 位作者 梁春燕 夏斌 《电子学报》 EI CAS CSCD 北大核心 2019年第4期791-797,共7页
如何提高对未知噪声类型的泛化能力是有监督语音增强方法中亟待解决的重要问题,通过对大量不同类型噪声进行建模,深度神经网络成为了解决该问题的有效手段.为了进一步提高基于深度神经网络的语音增强方法的泛化能力,本文基于生成式对抗... 如何提高对未知噪声类型的泛化能力是有监督语音增强方法中亟待解决的重要问题,通过对大量不同类型噪声进行建模,深度神经网络成为了解决该问题的有效手段.为了进一步提高基于深度神经网络的语音增强方法的泛化能力,本文基于生成式对抗网络(Generative Adversarial Networks,GAN)设计了能够由真实噪声数据生成新的噪声类型的NoiseGAN;通过在训练集中增加生成噪声类型,提高训练集噪声类型的多样性,从而达到提高语音增强模型泛化能力的目的.不同结构的网络下的语音增强实验结果表明,本文提出的NoiseGAN能够生成新的噪声类型,具备提高训练集噪声类型多样性的能力,有效提高了语音增强模型在未知噪声类型下的泛化能力. 展开更多
关键词 语音增强 生成式对抗网络 泛化能力 深度神经网络
在线阅读 下载PDF
感知联合优化的深度神经网络语音增强方法 被引量:4
3
作者 袁文浩 娄迎曦 +1 位作者 梁春燕 王志强 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第2期89-94,共6页
基于深度神经网络的语音增强模型的训练一般采用均方误差作为代价函数,没有针对语音增强问题进行优化。针对这一问题,从相邻帧网络输出之间的相关性和各时频单元的语音存在情况两方面进行考虑;通过在代价函数中对相邻帧的网络输出进行关... 基于深度神经网络的语音增强模型的训练一般采用均方误差作为代价函数,没有针对语音增强问题进行优化。针对这一问题,从相邻帧网络输出之间的相关性和各时频单元的语音存在情况两方面进行考虑;通过在代价函数中对相邻帧的网络输出进行关联,并设计一个反映时频单元语音存在情况的感知系数,提出了一种感知联合优化的深度神经网络语音增强方法。实验结果表明,相比基于均方误差的语音增强方法,该方法显著地提高了增强语音的语音质量和可懂度,具有更好的语音增强性能。 展开更多
关键词 语音增强 深度神经网络 代价函数 相关性
在线阅读 下载PDF
一种基于时频域特征融合的语音增强方法 被引量:5
4
作者 袁文浩 时云龙 +1 位作者 胡少东 娄迎曦 《计算机工程》 CAS CSCD 北大核心 2021年第10期75-81,共7页
为充分利用含噪语音特征来提升深度神经网络的语音增强性能,提出一种融合时频域特征的语音增强方法。以含噪语音的波形和纯净语音的对数功率谱分别作为训练特征和训练目标,获取含噪语音时域特征到纯净语音频域特征的映射关系。将含噪语... 为充分利用含噪语音特征来提升深度神经网络的语音增强性能,提出一种融合时频域特征的语音增强方法。以含噪语音的波形和纯净语音的对数功率谱分别作为训练特征和训练目标,获取含噪语音时域特征到纯净语音频域特征的映射关系。将含噪语音的波形和对数功率谱共同作为训练特征,构建融合含噪语音时域和频域特征的深度神经网络实现语音增强。实验结果表明,与单纯使用频域特征的语音增强方法相比,该方法能够明显提升增强语音的质量和可懂度,具有更好的语音增强性能。 展开更多
关键词 语音增强 深度神经网络 特征融合 时域特征 频域特征
在线阅读 下载PDF
基于准循环神经网络的语音增强方法 被引量:1
5
作者 娄迎曦 袁文浩 彭荣群 《计算机工程》 CAS CSCD 北大核心 2020年第4期316-320,共5页
在基于深度学习的语音增强模型中,长短时记忆网络能较好地解决序列语音增强问题,但该模型在处理大规模含噪语音数据时存在训练速度缓慢的问题.为此,提出一种基于准循环神经网络的语音增强方法.利用门函数和记忆单元确保含噪语音序列上... 在基于深度学习的语音增强模型中,长短时记忆网络能较好地解决序列语音增强问题,但该模型在处理大规模含噪语音数据时存在训练速度缓慢的问题.为此,提出一种基于准循环神经网络的语音增强方法.利用门函数和记忆单元确保含噪语音序列上下文的相关性,门函数的计算不再依赖上一时刻的输出,且该模型在含噪语音序列的输入和门函数的计算中都引入矩阵的卷积运算,使模型可以同时处理多个时刻的语音序列信息,从而增强模型并行计算的能力.实验结果表明,与长短时记忆网络相比,该方法能在保证语音增强性能的前提下,有效提高网络模型的训练速度. 展开更多
关键词 语音增强 准循环神经网络 长短时记忆网络 神经网络 卷积运算
在线阅读 下载PDF
一种用于实时语音增强的卷积准循环网络 被引量:3
6
作者 时云龙 袁文浩 +1 位作者 胡少东 娄迎曦 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2022年第3期183-190,共8页
为了在保证实时性的前提下,进一步提高深度神经网络的语音增强性能,提出一种用于实时语音增强的卷积准循环网络。该网络采用因果形式的输入,只利用含噪语音当前帧及过去帧的时频域特征,以满足实时语音增强方法的输入要求;基于准循环神... 为了在保证实时性的前提下,进一步提高深度神经网络的语音增强性能,提出一种用于实时语音增强的卷积准循环网络。该网络采用因果形式的输入,只利用含噪语音当前帧及过去帧的时频域特征,以满足实时语音增强方法的输入要求;基于准循环神经网络对含噪语音时间维度上的相关性进行建模,利用其对含噪语音序列的并行处理能力,提高网络模型的计算效率;同时使用卷积层改进准循环神经网络在隐层对含噪语音频率维度特征的计算方式,使网络模型能够更好地利用含噪语音相邻频带之间的局部相关性,提高网络模型的语音增强性能。实验结果表明,与基于准循环神经网络的语音增强方法相比,基于卷积准循环网络的语音增强方法不仅提高了语音增强性能,还降低了网络模型的参数量;与其他语音增强方法相比,卷积准循环网络在保证因果形式输入的前提下,有效地抑制了背景噪声对目标语音的干扰、降低了目标语音的失真程度,拥有更好的语音增强性能。最后,在不同计算平台上验证了基于卷积准循环网络的语音增强方法的实时性。 展开更多
关键词 语音增强 准循环神经网络 卷积神经网络 实时性
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部