期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
用于隐马尔可夫模型语音带宽扩展的激励分段扩展方法 被引量:5
1
作者 郭雷勇 李宇 +1 位作者 林胜义 谭洪舟 《计算机应用》 CSCD 北大核心 2017年第8期2416-2420,共5页
语音带宽扩展通过人为恢复窄带语音的频谱带宽来提高语音听觉质量。针对源滤波器扩展模型的激励扩展问题,提出一种分段扩展方法。该方法在扩展带的低频段与高频段部分分别采用窄带激励源的高频部分与帧能量等效的白噪声作为激励信号,最... 语音带宽扩展通过人为恢复窄带语音的频谱带宽来提高语音听觉质量。针对源滤波器扩展模型的激励扩展问题,提出一种分段扩展方法。该方法在扩展带的低频段与高频段部分分别采用窄带激励源的高频部分与帧能量等效的白噪声作为激励信号,最后两者与原窄带激励组成宽带激励信号。基于隐马尔可夫模型(HMM)谱包络估计的宽带语音重构实验结果表明:该方法降低了重建语音的失真度,恢复重建的语音信号优于谱平移激励扩展方法。 展开更多
关键词 语音带宽扩展 分段扩展 谱平移 激励信号 隐马尔可夫模型
在线阅读 下载PDF
基于受限玻尔兹曼机的语音带宽扩展 被引量:3
2
作者 王迎雪 赵胜辉 +1 位作者 于莹莹 匡镜明 《电子与信息学报》 EI CSCD 北大核心 2016年第7期1717-1723,共7页
语音带宽扩展是为了提高语音质量,利用语音低频和高频之间的相关性重构语音高频的一种技术。高斯混合模型法是语音带宽技术中被广泛应用的一种方法,但是,由于该方法假设语音高频、低频服从高斯分布,且只表征了语音低频、高频之间的线性... 语音带宽扩展是为了提高语音质量,利用语音低频和高频之间的相关性重构语音高频的一种技术。高斯混合模型法是语音带宽技术中被广泛应用的一种方法,但是,由于该方法假设语音高频、低频服从高斯分布,且只表征了语音低频、高频之间的线性关系,从而导致合成的高频语音出现失真。因此,该文提出一种基于受限玻尔兹曼机的方法,该方法利用两个高斯伯努利受限玻尔兹曼机提取语音低频和高频中蕴含的高阶统计特性;并利用前馈神经网络将语音低频高阶统计特性参数映射为高频高阶统计特性参数。这样,通过提取语音低频和高频中蕴含的高阶统计特性,该方法可以深层挖掘语音高频和语音低频之间的实际关系,从而更加准确地模拟频谱包络分布,合成质量更高的语音。客观测试、主观测试结果表明,该方法性能优于传统的高斯混合模型方法。 展开更多
关键词 语音带宽扩展 受限玻尔兹曼机 前馈神经网络 高斯混合模型
在线阅读 下载PDF
基于Flatten-CNN的语音带宽扩展研究 被引量:2
3
作者 杨俊美 雷杨 陈习坤 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第11期87-94,共8页
现有基于深度学习的语音带宽扩展算法中,时域算法语音特征提取不够精确,训练数据量大;频域算法对数功率谱特征提取未重视帧与帧之间的信息关联,频率轴数为奇数,不便于加深网络深度,且忽略时域信息;时频两域算法模型相对复杂。针对以上问... 现有基于深度学习的语音带宽扩展算法中,时域算法语音特征提取不够精确,训练数据量大;频域算法对数功率谱特征提取未重视帧与帧之间的信息关联,频率轴数为奇数,不便于加深网络深度,且忽略时域信息;时频两域算法模型相对复杂。针对以上问题,文中提出了一种基于Flatten-CNN的语音带宽扩展算法。首先,为了充分利用语音特征和减少数据量,文中算法基于频域运行;其次,为了利用对数功率谱时间轴信息,提出了一种改进的编码器,通过引入平铺层,实现对数功率谱时频两轴特征提取;接着,为了加深网络深度,在频率轴数据处理时去掉最后一个点,还原时再补零,使频率轴数为偶数,以利于加深网络深度;最后,为了利用语音信号时域信息,在损失函数中引入时域损失。为验证文中算法的有效性,用TIMIT数据集和VCTK数据集进行了模型的训练和测试,实验结果表明,与当前主流算法相比,文中算法生成的高带宽语音质量得到提高,呈现出了更好的听觉效果。 展开更多
关键词 语音带宽扩展 平铺层 时频两轴特征提取 时频损失 网络深度
在线阅读 下载PDF
基于码本映射和GMM的语音带宽扩展
4
作者 王迎雪 于莹莹 +1 位作者 赵胜辉 匡镜明 《北京理工大学学报》 EI CAS CSCD 北大核心 2017年第9期970-974,共5页
采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯... 采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯混合模型相结合的语音带宽扩展算法.提取高、低频特征参数,并训练高斯混合模型,基于高斯混合模型参数训练偏移矢量的码本;在扩展阶段,利用偏移矢量的码本将低频偏移矢量映射为高频偏移矢量,再将高频偏移矢量与高斯混合模型估计部分相加作为估计的高频特征参数.对利用该方法进行带宽扩展后的语音质量进行主观/客观评测.实验结果表明,相比传统的GMM语音带宽方法,CM-GMM合成的高频语音更接近原始高频语音,明显消除了高频过平滑现象. 展开更多
关键词 语音带宽扩展 高斯混合模型 码本映射
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部