期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进循环生成对抗神经网络的语音增强
被引量:
2
1
作者
徐珑婷
田娩鑫
魏郅林
《东华大学学报(自然科学版)》
CAS
北大核心
2022年第5期70-76,共7页
为克服基于生成对抗网络的语音增强技术存在成对语音样本缺乏的问题,提出改进的循环一致性生成对抗网络(CycleGAN)的不成对数据生成模型。通过引入2-1-2D CNN生成器和PatchGAN鉴别器,使改进的CycleGAN-2-1-2D模型能更有效地学习语音样...
为克服基于生成对抗网络的语音增强技术存在成对语音样本缺乏的问题,提出改进的循环一致性生成对抗网络(CycleGAN)的不成对数据生成模型。通过引入2-1-2D CNN生成器和PatchGAN鉴别器,使改进的CycleGAN-2-1-2D模型能更有效地学习语音样本多维度的特征,并大大缩短了训练时长。选取LibriTTS语料库中的部分纯净语音作为训练集A,从语料库中选取其他样本加3种类型的噪声作为训练集B,训练集A和训练集B作为CycleGAN-2-1-2D模型的输入参数。设置CycleGAN-2D和NMF(nonnegative matrix factorization)的语音增强模型作为CycleGAN-2-1-2D模型的对照试验,通过仿真试验对3种模型生成的语音质量进行评估。研究数据表明:相较于NMF模型,CycleGAN-2-1-2D模型生成的语音质量有了较大的提升;相较于CycleGAN-2D模型,CycleGAN-2-1-2D模型对女声的增强效果有明显提升。
展开更多
关键词
语音增强
深度神经网络
循环生成对抗网络
非平行数据
在线阅读
下载PDF
职称材料
题名
基于改进循环生成对抗神经网络的语音增强
被引量:
2
1
作者
徐珑婷
田娩鑫
魏郅林
机构
东华大学信息科学与技术学院
出处
《东华大学学报(自然科学版)》
CAS
北大核心
2022年第5期70-76,共7页
基金
上海市青年科技英才扬帆计划项目(19YF1402000)
国家自然科学青年基金项目(62001100)。
文摘
为克服基于生成对抗网络的语音增强技术存在成对语音样本缺乏的问题,提出改进的循环一致性生成对抗网络(CycleGAN)的不成对数据生成模型。通过引入2-1-2D CNN生成器和PatchGAN鉴别器,使改进的CycleGAN-2-1-2D模型能更有效地学习语音样本多维度的特征,并大大缩短了训练时长。选取LibriTTS语料库中的部分纯净语音作为训练集A,从语料库中选取其他样本加3种类型的噪声作为训练集B,训练集A和训练集B作为CycleGAN-2-1-2D模型的输入参数。设置CycleGAN-2D和NMF(nonnegative matrix factorization)的语音增强模型作为CycleGAN-2-1-2D模型的对照试验,通过仿真试验对3种模型生成的语音质量进行评估。研究数据表明:相较于NMF模型,CycleGAN-2-1-2D模型生成的语音质量有了较大的提升;相较于CycleGAN-2D模型,CycleGAN-2-1-2D模型对女声的增强效果有明显提升。
关键词
语音增强
深度神经网络
循环生成对抗网络
非平行数据
Keywords
speech enhancement
deep neural networks
cycle-consistent generative adversarial networks
non-parallel data
分类号
TN914.1 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进循环生成对抗神经网络的语音增强
徐珑婷
田娩鑫
魏郅林
《东华大学学报(自然科学版)》
CAS
北大核心
2022
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部