期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进循环生成对抗神经网络的语音增强 被引量:2
1
作者 徐珑婷 田娩鑫 魏郅林 《东华大学学报(自然科学版)》 CAS 北大核心 2022年第5期70-76,共7页
为克服基于生成对抗网络的语音增强技术存在成对语音样本缺乏的问题,提出改进的循环一致性生成对抗网络(CycleGAN)的不成对数据生成模型。通过引入2-1-2D CNN生成器和PatchGAN鉴别器,使改进的CycleGAN-2-1-2D模型能更有效地学习语音样... 为克服基于生成对抗网络的语音增强技术存在成对语音样本缺乏的问题,提出改进的循环一致性生成对抗网络(CycleGAN)的不成对数据生成模型。通过引入2-1-2D CNN生成器和PatchGAN鉴别器,使改进的CycleGAN-2-1-2D模型能更有效地学习语音样本多维度的特征,并大大缩短了训练时长。选取LibriTTS语料库中的部分纯净语音作为训练集A,从语料库中选取其他样本加3种类型的噪声作为训练集B,训练集A和训练集B作为CycleGAN-2-1-2D模型的输入参数。设置CycleGAN-2D和NMF(nonnegative matrix factorization)的语音增强模型作为CycleGAN-2-1-2D模型的对照试验,通过仿真试验对3种模型生成的语音质量进行评估。研究数据表明:相较于NMF模型,CycleGAN-2-1-2D模型生成的语音质量有了较大的提升;相较于CycleGAN-2D模型,CycleGAN-2-1-2D模型对女声的增强效果有明显提升。 展开更多
关键词 语音增强 深度神经网络 循环生成对抗网络 非平行数据
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部