期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
矢量量化正则变分自编码器做非平行语料语音转换 被引量:5
1
作者 王超 俞一彪 《信号处理》 CSCD 北大核心 2021年第7期1339-1345,共7页
基于矢量量化变分自编码器(Vector Quantized Variational Autoencoder,VQVAE)的语音转换系统是国内外语音转换领域研究的一大热点,但是其较差的转换音质限制了模型的应用。本文在VQVAE的基础上提出一种改进的矢量量化正则变分自编码器(... 基于矢量量化变分自编码器(Vector Quantized Variational Autoencoder,VQVAE)的语音转换系统是国内外语音转换领域研究的一大热点,但是其较差的转换音质限制了模型的应用。本文在VQVAE的基础上提出一种改进的矢量量化正则变分自编码器(Vector Quantization Regularized Variational Autoencoder,VQ-REG-VAE)。在训练时,矢量量化退化为正则化项,通过矢量量化的正则约束让编码器学习生成说话人无关的语义特征,同时让解码器学习将说话人特征融合到语义特征中。在转换时,可以去掉矢量量化这一正则化项,通过编码器和解码器就能实现语音转换。由于转换时没有进行矢量量化,语义特征信息得以更好保留。客观和主观实验都表明:基于VQ-REG-VAE模型的转换语音在不降低相似度的前提下,音质比VQVAE模型有显著的提升。 展开更多
关键词 语音转换 矢量量化 矢量量化正则自编码器
在线阅读 下载PDF
基于生成模型的三维波束形成图像压缩方法
2
作者 赵昀杰 贺岩松 +1 位作者 张志飞 徐中明 《中国机械工程》 北大核心 2025年第7期1520-1529,共10页
针对通道压缩方法在高压缩率下导致DenseNet模型定位性能显著降低的问题,提出一种基于改进向量量化变分自编码器(VQ-VAE-2)模型的三维波束形成图像压缩(3D-BFMC)方法。先利用VQ-VAE-2模型的层级编码器将三维波束形成图压缩为向量化局部... 针对通道压缩方法在高压缩率下导致DenseNet模型定位性能显著降低的问题,提出一种基于改进向量量化变分自编码器(VQ-VAE-2)模型的三维波束形成图像压缩(3D-BFMC)方法。先利用VQ-VAE-2模型的层级编码器将三维波束形成图压缩为向量化局部特征矩阵,再将该矩阵输入DenseNet模型实现三维定位。仿真结果表明,使用3D-BFMC方法压缩数据训练的DenseNet模型在定位精度、频率泛化性能、噪声鲁棒性上均优于通道压缩方法。单声源试验验证了3D-BFMC方法在真实环境中的有效性和可行性。 展开更多
关键词 波束形成 数据压缩 深度学习 改进向量量化自编码器 三维空间
在线阅读 下载PDF
融合图卷积残差网络与边收缩池化的VQ-VAE网格重建算法
3
作者 丁阳 杨华民 +2 位作者 韩成 刘宇 卢时禹 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第10期112-121,共10页
3D网格因其复杂性和不规则性使其有效表示成为挑战。为解决常规图卷积难以对3D网格有效传递和融合信息的问题,提出基于变分量化自编码器的3D网格模型,以探索其隐空间并用于3D网格的生成。提出带残差的图卷积模块,在处理3D网格这种复杂... 3D网格因其复杂性和不规则性使其有效表示成为挑战。为解决常规图卷积难以对3D网格有效传递和融合信息的问题,提出基于变分量化自编码器的3D网格模型,以探索其隐空间并用于3D网格的生成。提出带残差的图卷积模块,在处理3D网格这种复杂的图结构时,残差连接更有效地整合多层特征信息,支持更深的网络结构,显著提升模型的性能和泛化能力。在网格简化的边收缩算法基础上构建了可靠的多层池化和反池化操作,有效编码了层次结构中较粗糙和较稠密网格之间的对应关系。将3D网格形状投影到潜在空间的过程中,潜在特征被过度压缩导致信息损失,采用向量量化将潜在特征映射到预先定义的离散向量,在保持紧凑表示下更有效地编码和重建数据。实验结果表明,所提算法能够学习对可变形形状集合的紧凑表示,且在形状生成、形状插值等各种应用中表现出色。 展开更多
关键词 网格生成 变分量化自编码器 网格插值 图卷积
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部