期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于i向量和变分自编码相对生成对抗网络的语音转换
被引量:
2
1
作者
李燕萍
曹盼
+2 位作者
左宇涛
张燕
钱博
《自动化学报》
EI
CAS
CSCD
北大核心
2022年第7期1824-1833,共10页
提出一种基于i向量和变分自编码相对生成对抗网络的语音转换方法,实现了非平行文本条件下高质量的多对多语音转换.性能良好的语音转换系统,既要保持重构语音的自然度,又要兼顾转换语音的说话人个性特征是否准确.首先为了改善合成语音自...
提出一种基于i向量和变分自编码相对生成对抗网络的语音转换方法,实现了非平行文本条件下高质量的多对多语音转换.性能良好的语音转换系统,既要保持重构语音的自然度,又要兼顾转换语音的说话人个性特征是否准确.首先为了改善合成语音自然度,利用生成性能更好的相对生成对抗网络代替基于变分自编码生成对抗网络模型中的Wasserstein生成对抗网络,通过构造相对鉴别器的方式,使得鉴别器的输出依赖于真实样本和生成样本间的相对值,克服了Wasserstein生成对抗网络性能不稳定和收敛速度较慢等问题.进一步为了提升转换语音的说话人个性相似度,在解码阶段,引入含有丰富个性信息的i向量,以充分学习说话人的个性化特征.客观和主观实验表明,转换后的语音平均梅尔倒谱失真距离值较基准模型降低4.80%,平均意见得分值提升5.12%,ABX值提升8.60%,验证了该方法在语音自然度和个性相似度两个方面均有显著的提高,实现了高质量的语音转换.
展开更多
关键词
语音转换
相对生成对抗网络
I
向量
非平行文本
变分自编码器
多对多
在线阅读
下载PDF
职称材料
用于全色锐化的相对平均生成对抗网络
2
作者
陈婷
王松涛
+2 位作者
高涛
刘梦尼
陈友静
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2022年第3期54-64,共11页
为解决全色锐化过程中对原图像特征提取不足导致融合结果细节信息易丢失,以及图像融合过程中因忽略不同区域的空间特征差异而导致信息冗余等问题,采用深度学习算法,提出一种用于全色锐化的相对平均生成对抗网络(Pan-RaGAN)。在生成器中...
为解决全色锐化过程中对原图像特征提取不足导致融合结果细节信息易丢失,以及图像融合过程中因忽略不同区域的空间特征差异而导致信息冗余等问题,采用深度学习算法,提出一种用于全色锐化的相对平均生成对抗网络(Pan-RaGAN)。在生成器中利用改进的密集块结构对原图像进行特征提取,充分利用原图像各级特征,获取包含了更多细节信息的融合结果;提出基于空间注意力机制的特征细化模块,用于特征选择,可在保留有效高频信息的同时剔除冗余信息;利用图像重建模块将细化后的特征与上采样的低分辨率多光谱图像进行融合,以保持光谱信息;利用相对平均鉴别器改进网络的损失函数,进一步优化融合效果。在高分2号卫星和快鸟卫星图像数据集上的实验结果表明,与已有用于遥感图像全色锐化的生成对抗网络相比,Pan-RaGAN网络的光谱角映射指标平均降低了0.075,验证了Pan-RaGAN网络的有效性。
展开更多
关键词
全色锐化
图像融合
相对
平均
生成
对抗
网络
空间注意力机制
深度学习
在线阅读
下载PDF
职称材料
题名
基于i向量和变分自编码相对生成对抗网络的语音转换
被引量:
2
1
作者
李燕萍
曹盼
左宇涛
张燕
钱博
机构
南京邮电大学通信与信息工程学院
金陵科技学院软件工程学院
南京电子技术研究所
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2022年第7期1824-1833,共10页
基金
国家自然科学青年基金(61401227)
国家自然科学基金(61872199,61872424)
金陵科技学院智能人机交互科技创新团队建设专项(218/010119200113)资助。
文摘
提出一种基于i向量和变分自编码相对生成对抗网络的语音转换方法,实现了非平行文本条件下高质量的多对多语音转换.性能良好的语音转换系统,既要保持重构语音的自然度,又要兼顾转换语音的说话人个性特征是否准确.首先为了改善合成语音自然度,利用生成性能更好的相对生成对抗网络代替基于变分自编码生成对抗网络模型中的Wasserstein生成对抗网络,通过构造相对鉴别器的方式,使得鉴别器的输出依赖于真实样本和生成样本间的相对值,克服了Wasserstein生成对抗网络性能不稳定和收敛速度较慢等问题.进一步为了提升转换语音的说话人个性相似度,在解码阶段,引入含有丰富个性信息的i向量,以充分学习说话人的个性化特征.客观和主观实验表明,转换后的语音平均梅尔倒谱失真距离值较基准模型降低4.80%,平均意见得分值提升5.12%,ABX值提升8.60%,验证了该方法在语音自然度和个性相似度两个方面均有显著的提高,实现了高质量的语音转换.
关键词
语音转换
相对生成对抗网络
I
向量
非平行文本
变分自编码器
多对多
Keywords
Voice conversion
relativistic standard generative adversarial network
i-vector
non-parallel corpora
variational autoencoder
many-to-many
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
用于全色锐化的相对平均生成对抗网络
2
作者
陈婷
王松涛
高涛
刘梦尼
陈友静
机构
长安大学信息工程学院
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2022年第3期54-64,共11页
基金
国家重点研发计划资助项目(2019YFE0108300)
国家自然科学基金资助项目(62001058)
中央高校基本科研业务费专项资金资助项目(300102241201)。
文摘
为解决全色锐化过程中对原图像特征提取不足导致融合结果细节信息易丢失,以及图像融合过程中因忽略不同区域的空间特征差异而导致信息冗余等问题,采用深度学习算法,提出一种用于全色锐化的相对平均生成对抗网络(Pan-RaGAN)。在生成器中利用改进的密集块结构对原图像进行特征提取,充分利用原图像各级特征,获取包含了更多细节信息的融合结果;提出基于空间注意力机制的特征细化模块,用于特征选择,可在保留有效高频信息的同时剔除冗余信息;利用图像重建模块将细化后的特征与上采样的低分辨率多光谱图像进行融合,以保持光谱信息;利用相对平均鉴别器改进网络的损失函数,进一步优化融合效果。在高分2号卫星和快鸟卫星图像数据集上的实验结果表明,与已有用于遥感图像全色锐化的生成对抗网络相比,Pan-RaGAN网络的光谱角映射指标平均降低了0.075,验证了Pan-RaGAN网络的有效性。
关键词
全色锐化
图像融合
相对
平均
生成
对抗
网络
空间注意力机制
深度学习
Keywords
pan-sharpening
image fusion
relativistic average generative adversarial network
spatial attention mechanism
deep learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于i向量和变分自编码相对生成对抗网络的语音转换
李燕萍
曹盼
左宇涛
张燕
钱博
《自动化学报》
EI
CAS
CSCD
北大核心
2022
2
在线阅读
下载PDF
职称材料
2
用于全色锐化的相对平均生成对抗网络
陈婷
王松涛
高涛
刘梦尼
陈友静
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2022
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部