检索结果-维普期刊中文期刊服务平台

一种时频平滑的深度神经网络语音增强方法被引量：6: 1; 作者袁文浩梁春燕 +2 位作者娄迎曦房超王志强《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第4期130-136,共7页; 由于现有的基于深度神经网络的语音增强方法在网络结构的设计上缺乏对语音增强问题自身特点的考虑,针对这一问题,基于语音增强在时间和频率两个维度上的不同特性,受传统语音增强方法中的含噪语音局部特征计算方法启发,设计了一种在时间... 展开更多; 关键词语音增强时频平滑卷积神经网络深度神经网络; 在线阅读下载PDF 职称材料

利用生成噪声提高语音增强方法的泛化能力被引量：6: 2; 作者袁文浩娄迎曦 +1 位作者梁春燕夏斌《电子学报》 EI CAS CSCD 北大核心 2019年第4期791-797,共7页; 如何提高对未知噪声类型的泛化能力是有监督语音增强方法中亟待解决的重要问题,通过对大量不同类型噪声进行建模,深度神经网络成为了解决该问题的有效手段.为了进一步提高基于深度神经网络的语音增强方法的泛化能力,本文基于生成式对抗... 展开更多; 关键词语音增强生成式对抗网络泛化能力深度神经网络; 在线阅读下载PDF 职称材料

感知联合优化的深度神经网络语音增强方法被引量：4: 3; 作者袁文浩娄迎曦 +1 位作者梁春燕王志强《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第2期89-94,共6页; 基于深度神经网络的语音增强模型的训练一般采用均方误差作为代价函数,没有针对语音增强问题进行优化。针对这一问题,从相邻帧网络输出之间的相关性和各时频单元的语音存在情况两方面进行考虑;通过在代价函数中对相邻帧的网络输出进行关... 展开更多; 关键词语音增强深度神经网络代价函数相关性; 在线阅读下载PDF 职称材料

一种基于时频域特征融合的语音增强方法被引量：5: 4; 作者袁文浩时云龙 +1 位作者胡少东娄迎曦《计算机工程》 CAS CSCD 北大核心 2021年第10期75-81,共7页; 为充分利用含噪语音特征来提升深度神经网络的语音增强性能,提出一种融合时频域特征的语音增强方法。以含噪语音的波形和纯净语音的对数功率谱分别作为训练特征和训练目标,获取含噪语音时域特征到纯净语音频域特征的映射关系。将含噪语... 展开更多; 关键词语音增强深度神经网络特征融合时域特征频域特征; 在线阅读下载PDF 职称材料

基于准循环神经网络的语音增强方法被引量：1: 5; 作者娄迎曦袁文浩彭荣群《计算机工程》 CAS CSCD 北大核心 2020年第4期316-320,共5页; 在基于深度学习的语音增强模型中,长短时记忆网络能较好地解决序列语音增强问题,但该模型在处理大规模含噪语音数据时存在训练速度缓慢的问题.为此,提出一种基于准循环神经网络的语音增强方法.利用门函数和记忆单元确保含噪语音序列上... 展开更多; 关键词语音增强准循环神经网络长短时记忆网络神经网络卷积运算; 在线阅读下载PDF 职称材料

一种用于实时语音增强的卷积准循环网络被引量：3: 6; 作者时云龙袁文浩 +1 位作者胡少东娄迎曦《西安电子科技大学学报》 EI CAS CSCD 北大核心 2022年第3期183-190,共8页; 为了在保证实时性的前提下,进一步提高深度神经网络的语音增强性能,提出一种用于实时语音增强的卷积准循环网络。该网络采用因果形式的输入,只利用含噪语音当前帧及过去帧的时频域特征,以满足实时语音增强方法的输入要求;基于准循环神... 展开更多; 关键词语音增强准循环神经网络卷积神经网络实时性; 在线阅读下载PDF 职称材料

题名一种时频平滑的深度神经网络语音增强方法被引量：6: 1; 作者袁文浩梁春燕娄迎曦房超王志强; 机构山东理工大学计算机科学与技术学院; 出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第4期130-136,共7页; 基金国家自然科学基金青年基金（61701286,11704229）山东省自然科学基金（ZR2015FL003,ZR2017MF047,ZR2017LA011,ZR2018LF002）; 文摘由于现有的基于深度神经网络的语音增强方法在网络结构的设计上缺乏对语音增强问题自身特点的考虑,针对这一问题,基于语音增强在时间和频率两个维度上的不同特性,受传统语音增强方法中的含噪语音局部特征计算方法启发,设计了一种在时间和频率两个维度上进行不同处理的时频平滑网络.该网络采用门控循环单元来表达含噪语音在时间上的相关性,同时采用卷积神经网络来表达含噪语音在频率上的相关性,实现了类似传统语音增强方法的时频平滑处理.实验结果表明,这种时频平滑网络在保证语音增强系统因果性的前提下,相比其他网络显著地提高了语音增强性能,增强后的语音具有更好的语音质量和可懂度.; 关键词语音增强时频平滑卷积神经网络深度神经网络; Keywords speech enhancement time-frequency smoothing convolutional neural network deep neural network; 分类号 TN912.3 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名利用生成噪声提高语音增强方法的泛化能力被引量：6: 2; 作者袁文浩娄迎曦梁春燕夏斌; 机构山东理工大学计算机科学与技术学院; 出处《电子学报》 EI CAS CSCD 北大核心 2019年第4期791-797,共7页; 基金国家自然科学基金(No.61701286 No.11704229) +2 种基金 No.ZR2017MF047 No.ZR2017LA011); 文摘如何提高对未知噪声类型的泛化能力是有监督语音增强方法中亟待解决的重要问题,通过对大量不同类型噪声进行建模,深度神经网络成为了解决该问题的有效手段.为了进一步提高基于深度神经网络的语音增强方法的泛化能力,本文基于生成式对抗网络(Generative Adversarial Networks,GAN)设计了能够由真实噪声数据生成新的噪声类型的NoiseGAN;通过在训练集中增加生成噪声类型,提高训练集噪声类型的多样性,从而达到提高语音增强模型泛化能力的目的.不同结构的网络下的语音增强实验结果表明,本文提出的NoiseGAN能够生成新的噪声类型,具备提高训练集噪声类型多样性的能力,有效提高了语音增强模型在未知噪声类型下的泛化能力.; 关键词语音增强生成式对抗网络泛化能力深度神经网络; Keywords speech enhancement generative adversarial networks generalization ability deep neural network; 分类号 TN912 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名感知联合优化的深度神经网络语音增强方法被引量：4: 3; 作者袁文浩娄迎曦梁春燕王志强; 机构山东理工大学计算机科学与技术学院; 出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第2期89-94,共6页; 基金国家自然科学基金青年基金(61701286 11704229) +3 种基金山东省自然科学基金(ZR2015FL003 ZR2017MF047 ZR2017LA011 ZR2018LF002); 文摘基于深度神经网络的语音增强模型的训练一般采用均方误差作为代价函数,没有针对语音增强问题进行优化。针对这一问题,从相邻帧网络输出之间的相关性和各时频单元的语音存在情况两方面进行考虑;通过在代价函数中对相邻帧的网络输出进行关联,并设计一个反映时频单元语音存在情况的感知系数,提出了一种感知联合优化的深度神经网络语音增强方法。实验结果表明,相比基于均方误差的语音增强方法,该方法显著地提高了增强语音的语音质量和可懂度,具有更好的语音增强性能。; 关键词语音增强深度神经网络代价函数相关性; Keywords speech enhancement deep neural network cost function correlation; 分类号 TN912.3 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名一种基于时频域特征融合的语音增强方法被引量：5: 4; 作者袁文浩时云龙胡少东娄迎曦; 机构山东理工大学计算机科学与技术学院; 出处《计算机工程》 CAS CSCD 北大核心 2021年第10期75-81,共7页; 基金国家自然科学基金(61701286)。; 文摘为充分利用含噪语音特征来提升深度神经网络的语音增强性能,提出一种融合时频域特征的语音增强方法。以含噪语音的波形和纯净语音的对数功率谱分别作为训练特征和训练目标,获取含噪语音时域特征到纯净语音频域特征的映射关系。将含噪语音的波形和对数功率谱共同作为训练特征,构建融合含噪语音时域和频域特征的深度神经网络实现语音增强。实验结果表明,与单纯使用频域特征的语音增强方法相比,该方法能够明显提升增强语音的质量和可懂度,具有更好的语音增强性能。; 关键词语音增强深度神经网络特征融合时域特征频域特征; Keywords speech enhancement deep neural network feature fusion time-domain feature frequency-domain feature; 分类号 TN912.3 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名基于准循环神经网络的语音增强方法被引量：1: 5; 作者娄迎曦袁文浩彭荣群; 机构山东理工大学计算机科学与技术学院; 出处《计算机工程》 CAS CSCD 北大核心 2020年第4期316-320,共5页; 基金国家自然科学基金(61701286,11704229) 山东省自然科学基金(ZR2015FL003,ZR2017MF047,ZR2017LA011)。; 文摘在基于深度学习的语音增强模型中,长短时记忆网络能较好地解决序列语音增强问题,但该模型在处理大规模含噪语音数据时存在训练速度缓慢的问题.为此,提出一种基于准循环神经网络的语音增强方法.利用门函数和记忆单元确保含噪语音序列上下文的相关性,门函数的计算不再依赖上一时刻的输出,且该模型在含噪语音序列的输入和门函数的计算中都引入矩阵的卷积运算,使模型可以同时处理多个时刻的语音序列信息,从而增强模型并行计算的能力.实验结果表明,与长短时记忆网络相比,该方法能在保证语音增强性能的前提下,有效提高网络模型的训练速度.; 关键词语音增强准循环神经网络长短时记忆网络神经网络卷积运算; Keywords speech enhancement Quasi Recurrent Neural Network(QRNN) Long Short-Term Memory Network(LSTM) neural network convolutional operation; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名一种用于实时语音增强的卷积准循环网络被引量：3: 6; 作者时云龙袁文浩胡少东娄迎曦; 机构山东理工大学计算机科学与技术学院; 出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2022年第3期183-190,共8页; 基金国家自然科学基金(61701286)。; 文摘为了在保证实时性的前提下,进一步提高深度神经网络的语音增强性能,提出一种用于实时语音增强的卷积准循环网络。该网络采用因果形式的输入,只利用含噪语音当前帧及过去帧的时频域特征,以满足实时语音增强方法的输入要求;基于准循环神经网络对含噪语音时间维度上的相关性进行建模,利用其对含噪语音序列的并行处理能力,提高网络模型的计算效率;同时使用卷积层改进准循环神经网络在隐层对含噪语音频率维度特征的计算方式,使网络模型能够更好地利用含噪语音相邻频带之间的局部相关性,提高网络模型的语音增强性能。实验结果表明,与基于准循环神经网络的语音增强方法相比,基于卷积准循环网络的语音增强方法不仅提高了语音增强性能,还降低了网络模型的参数量;与其他语音增强方法相比,卷积准循环网络在保证因果形式输入的前提下,有效地抑制了背景噪声对目标语音的干扰、降低了目标语音的失真程度,拥有更好的语音增强性能。最后,在不同计算平台上验证了基于卷积准循环网络的语音增强方法的实时性。; 关键词语音增强准循环神经网络卷积神经网络实时性; Keywords speech enhancement quasi-recurrent network convolutional neural network real-time performance; 分类号 TN912 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	一种时频平滑的深度神经网络语音增强方法	袁文浩梁春燕娄迎曦房超王志强	《西安电子科技大学学报》 EI CAS CSCD 北大核心	2019	6	在线阅读下载PDF 职称材料
2	利用生成噪声提高语音增强方法的泛化能力	袁文浩娄迎曦梁春燕夏斌	《电子学报》 EI CAS CSCD 北大核心	2019	6	在线阅读下载PDF 职称材料
3	感知联合优化的深度神经网络语音增强方法	袁文浩娄迎曦梁春燕王志强	《西安电子科技大学学报》 EI CAS CSCD 北大核心	2019	4	在线阅读下载PDF 职称材料
4	一种基于时频域特征融合的语音增强方法	袁文浩时云龙胡少东娄迎曦	《计算机工程》 CAS CSCD 北大核心	2021	5	在线阅读下载PDF 职称材料
5	基于准循环神经网络的语音增强方法	娄迎曦袁文浩彭荣群	《计算机工程》 CAS CSCD 北大核心	2020	1	在线阅读下载PDF 职称材料
6	一种用于实时语音增强的卷积准循环网络	时云龙袁文浩胡少东娄迎曦	《西安电子科技大学学报》 EI CAS CSCD 北大核心	2022	3	在线阅读下载PDF 职称材料