期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于i向量和变分自编码相对生成对抗网络的语音转换 被引量:2
1
作者 李燕萍 曹盼 +2 位作者 左宇涛 张燕 钱博 《自动化学报》 EI CAS CSCD 北大核心 2022年第7期1824-1833,共10页
提出一种基于i向量和变分自编码相对生成对抗网络的语音转换方法,实现了非平行文本条件下高质量的多对多语音转换.性能良好的语音转换系统,既要保持重构语音的自然度,又要兼顾转换语音的说话人个性特征是否准确.首先为了改善合成语音自... 提出一种基于i向量和变分自编码相对生成对抗网络的语音转换方法,实现了非平行文本条件下高质量的多对多语音转换.性能良好的语音转换系统,既要保持重构语音的自然度,又要兼顾转换语音的说话人个性特征是否准确.首先为了改善合成语音自然度,利用生成性能更好的相对生成对抗网络代替基于变分自编码生成对抗网络模型中的Wasserstein生成对抗网络,通过构造相对鉴别器的方式,使得鉴别器的输出依赖于真实样本和生成样本间的相对值,克服了Wasserstein生成对抗网络性能不稳定和收敛速度较慢等问题.进一步为了提升转换语音的说话人个性相似度,在解码阶段,引入含有丰富个性信息的i向量,以充分学习说话人的个性化特征.客观和主观实验表明,转换后的语音平均梅尔倒谱失真距离值较基准模型降低4.80%,平均意见得分值提升5.12%,ABX值提升8.60%,验证了该方法在语音自然度和个性相似度两个方面均有显著的提高,实现了高质量的语音转换. 展开更多
关键词 语音转换 相对生成对抗网络 I 向量 非平行文本 变分自编码器 多对多
在线阅读 下载PDF
用于全色锐化的相对平均生成对抗网络
2
作者 陈婷 王松涛 +2 位作者 高涛 刘梦尼 陈友静 《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第3期54-64,共11页
为解决全色锐化过程中对原图像特征提取不足导致融合结果细节信息易丢失,以及图像融合过程中因忽略不同区域的空间特征差异而导致信息冗余等问题,采用深度学习算法,提出一种用于全色锐化的相对平均生成对抗网络(Pan-RaGAN)。在生成器中... 为解决全色锐化过程中对原图像特征提取不足导致融合结果细节信息易丢失,以及图像融合过程中因忽略不同区域的空间特征差异而导致信息冗余等问题,采用深度学习算法,提出一种用于全色锐化的相对平均生成对抗网络(Pan-RaGAN)。在生成器中利用改进的密集块结构对原图像进行特征提取,充分利用原图像各级特征,获取包含了更多细节信息的融合结果;提出基于空间注意力机制的特征细化模块,用于特征选择,可在保留有效高频信息的同时剔除冗余信息;利用图像重建模块将细化后的特征与上采样的低分辨率多光谱图像进行融合,以保持光谱信息;利用相对平均鉴别器改进网络的损失函数,进一步优化融合效果。在高分2号卫星和快鸟卫星图像数据集上的实验结果表明,与已有用于遥感图像全色锐化的生成对抗网络相比,Pan-RaGAN网络的光谱角映射指标平均降低了0.075,验证了Pan-RaGAN网络的有效性。 展开更多
关键词 全色锐化 图像融合 相对平均生成对抗网络 空间注意力机制 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部