期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
矢量量化正则变分自编码器做非平行语料语音转换
被引量:
5
1
作者
王超
俞一彪
《信号处理》
CSCD
北大核心
2021年第7期1339-1345,共7页
基于矢量量化变分自编码器(Vector Quantized Variational Autoencoder,VQVAE)的语音转换系统是国内外语音转换领域研究的一大热点,但是其较差的转换音质限制了模型的应用。本文在VQVAE的基础上提出一种改进的矢量量化正则变分自编码器(...
基于矢量量化变分自编码器(Vector Quantized Variational Autoencoder,VQVAE)的语音转换系统是国内外语音转换领域研究的一大热点,但是其较差的转换音质限制了模型的应用。本文在VQVAE的基础上提出一种改进的矢量量化正则变分自编码器(Vector Quantization Regularized Variational Autoencoder,VQ-REG-VAE)。在训练时,矢量量化退化为正则化项,通过矢量量化的正则约束让编码器学习生成说话人无关的语义特征,同时让解码器学习将说话人特征融合到语义特征中。在转换时,可以去掉矢量量化这一正则化项,通过编码器和解码器就能实现语音转换。由于转换时没有进行矢量量化,语义特征信息得以更好保留。客观和主观实验都表明:基于VQ-REG-VAE模型的转换语音在不降低相似度的前提下,音质比VQVAE模型有显著的提升。
展开更多
关键词
语音转换
矢量
量化
矢量
量化
正则
变
分
自编码器
在线阅读
下载PDF
职称材料
基于生成模型的三维波束形成图像压缩方法
2
作者
赵昀杰
贺岩松
+1 位作者
张志飞
徐中明
《中国机械工程》
北大核心
2025年第7期1520-1529,共10页
针对通道压缩方法在高压缩率下导致DenseNet模型定位性能显著降低的问题,提出一种基于改进向量量化变分自编码器(VQ-VAE-2)模型的三维波束形成图像压缩(3D-BFMC)方法。先利用VQ-VAE-2模型的层级编码器将三维波束形成图压缩为向量化局部...
针对通道压缩方法在高压缩率下导致DenseNet模型定位性能显著降低的问题,提出一种基于改进向量量化变分自编码器(VQ-VAE-2)模型的三维波束形成图像压缩(3D-BFMC)方法。先利用VQ-VAE-2模型的层级编码器将三维波束形成图压缩为向量化局部特征矩阵,再将该矩阵输入DenseNet模型实现三维定位。仿真结果表明,使用3D-BFMC方法压缩数据训练的DenseNet模型在定位精度、频率泛化性能、噪声鲁棒性上均优于通道压缩方法。单声源试验验证了3D-BFMC方法在真实环境中的有效性和可行性。
展开更多
关键词
波束形成
数据压缩
深度学习
改进向量
量化
变
分
自编码器
三维空间
在线阅读
下载PDF
职称材料
融合图卷积残差网络与边收缩池化的VQ-VAE网格重建算法
3
作者
丁阳
杨华民
+2 位作者
韩成
刘宇
卢时禹
《重庆理工大学学报(自然科学)》
CAS
北大核心
2024年第10期112-121,共10页
3D网格因其复杂性和不规则性使其有效表示成为挑战。为解决常规图卷积难以对3D网格有效传递和融合信息的问题,提出基于变分量化自编码器的3D网格模型,以探索其隐空间并用于3D网格的生成。提出带残差的图卷积模块,在处理3D网格这种复杂...
3D网格因其复杂性和不规则性使其有效表示成为挑战。为解决常规图卷积难以对3D网格有效传递和融合信息的问题,提出基于变分量化自编码器的3D网格模型,以探索其隐空间并用于3D网格的生成。提出带残差的图卷积模块,在处理3D网格这种复杂的图结构时,残差连接更有效地整合多层特征信息,支持更深的网络结构,显著提升模型的性能和泛化能力。在网格简化的边收缩算法基础上构建了可靠的多层池化和反池化操作,有效编码了层次结构中较粗糙和较稠密网格之间的对应关系。将3D网格形状投影到潜在空间的过程中,潜在特征被过度压缩导致信息损失,采用向量量化将潜在特征映射到预先定义的离散向量,在保持紧凑表示下更有效地编码和重建数据。实验结果表明,所提算法能够学习对可变形形状集合的紧凑表示,且在形状生成、形状插值等各种应用中表现出色。
展开更多
关键词
网格生成
变分量化自编码器
网格插值
图卷积
在线阅读
下载PDF
职称材料
题名
矢量量化正则变分自编码器做非平行语料语音转换
被引量:
5
1
作者
王超
俞一彪
机构
苏州大学电子信息学院
出处
《信号处理》
CSCD
北大核心
2021年第7期1339-1345,共7页
文摘
基于矢量量化变分自编码器(Vector Quantized Variational Autoencoder,VQVAE)的语音转换系统是国内外语音转换领域研究的一大热点,但是其较差的转换音质限制了模型的应用。本文在VQVAE的基础上提出一种改进的矢量量化正则变分自编码器(Vector Quantization Regularized Variational Autoencoder,VQ-REG-VAE)。在训练时,矢量量化退化为正则化项,通过矢量量化的正则约束让编码器学习生成说话人无关的语义特征,同时让解码器学习将说话人特征融合到语义特征中。在转换时,可以去掉矢量量化这一正则化项,通过编码器和解码器就能实现语音转换。由于转换时没有进行矢量量化,语义特征信息得以更好保留。客观和主观实验都表明:基于VQ-REG-VAE模型的转换语音在不降低相似度的前提下,音质比VQVAE模型有显著的提升。
关键词
语音转换
矢量
量化
矢量
量化
正则
变
分
自编码器
Keywords
voice conversion
vector quantization
vector quantization regularized variational autoencoder
分类号
TN912.33 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于生成模型的三维波束形成图像压缩方法
2
作者
赵昀杰
贺岩松
张志飞
徐中明
机构
重庆大学机械与运载工程学院
出处
《中国机械工程》
北大核心
2025年第7期1520-1529,共10页
基金
国家自然科学基金(11874096)。
文摘
针对通道压缩方法在高压缩率下导致DenseNet模型定位性能显著降低的问题,提出一种基于改进向量量化变分自编码器(VQ-VAE-2)模型的三维波束形成图像压缩(3D-BFMC)方法。先利用VQ-VAE-2模型的层级编码器将三维波束形成图压缩为向量化局部特征矩阵,再将该矩阵输入DenseNet模型实现三维定位。仿真结果表明,使用3D-BFMC方法压缩数据训练的DenseNet模型在定位精度、频率泛化性能、噪声鲁棒性上均优于通道压缩方法。单声源试验验证了3D-BFMC方法在真实环境中的有效性和可行性。
关键词
波束形成
数据压缩
深度学习
改进向量
量化
变
分
自编码器
三维空间
Keywords
beamforming
data compression
deep learning
vector quantized-variational autoencoder-2(VQ-VAE-2)
three-dimensional space
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TN912 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
融合图卷积残差网络与边收缩池化的VQ-VAE网格重建算法
3
作者
丁阳
杨华民
韩成
刘宇
卢时禹
机构
长春理工大学计算机科学技术学院
马来西亚博特拉大学计算机科学与信息技术学院
出处
《重庆理工大学学报(自然科学)》
CAS
北大核心
2024年第10期112-121,共10页
基金
吉林省自然科学基金项目(20220101134JC)。
文摘
3D网格因其复杂性和不规则性使其有效表示成为挑战。为解决常规图卷积难以对3D网格有效传递和融合信息的问题,提出基于变分量化自编码器的3D网格模型,以探索其隐空间并用于3D网格的生成。提出带残差的图卷积模块,在处理3D网格这种复杂的图结构时,残差连接更有效地整合多层特征信息,支持更深的网络结构,显著提升模型的性能和泛化能力。在网格简化的边收缩算法基础上构建了可靠的多层池化和反池化操作,有效编码了层次结构中较粗糙和较稠密网格之间的对应关系。将3D网格形状投影到潜在空间的过程中,潜在特征被过度压缩导致信息损失,采用向量量化将潜在特征映射到预先定义的离散向量,在保持紧凑表示下更有效地编码和重建数据。实验结果表明,所提算法能够学习对可变形形状集合的紧凑表示,且在形状生成、形状插值等各种应用中表现出色。
关键词
网格生成
变分量化自编码器
网格插值
图卷积
Keywords
mesh generation
variational autoencoder
mesh interpolation
graph convolution
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
矢量量化正则变分自编码器做非平行语料语音转换
王超
俞一彪
《信号处理》
CSCD
北大核心
2021
5
在线阅读
下载PDF
职称材料
2
基于生成模型的三维波束形成图像压缩方法
赵昀杰
贺岩松
张志飞
徐中明
《中国机械工程》
北大核心
2025
0
在线阅读
下载PDF
职称材料
3
融合图卷积残差网络与边收缩池化的VQ-VAE网格重建算法
丁阳
杨华民
韩成
刘宇
卢时禹
《重庆理工大学学报(自然科学)》
CAS
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部