期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于音素级韵律建模的自回归零样本语音合成
1
作者 岳焕景 王嘉玮 杨敬钰 《湖南大学学报(自然科学版)》 北大核心 2025年第4期114-123,共10页
为了提升合成韵律的自然度和稳定性,提出了基于音素级韵律建模的自回归语音合成模型.该模型从词级别停顿和音素时长两方面改进韵律建模.为了提升词级别停顿的多样性和准确性,在文本前端提出了停顿预测模块.该模块基于原始文本来预测多... 为了提升合成韵律的自然度和稳定性,提出了基于音素级韵律建模的自回归语音合成模型.该模型从词级别停顿和音素时长两方面改进韵律建模.为了提升词级别停顿的多样性和准确性,在文本前端提出了停顿预测模块.该模块基于原始文本来预测多类停顿标签,从而为语音合成提供停顿时长建模的准确参考.为了提升音素时长的自然度,提出了时长预测模块.该模块预测每个音素的混合高斯分布,并通过随机采样来获得多样化的音素时长.为了提升自回归模型中的音素时长建模的稳定性,提出了注意力判别模块.该模块应用于自回归的每个时间步中,并通过注意力和判断机制来避免对齐紊乱现象.实验结果表明,所提三种模块可有效提升韵律建模的自然度和稳定性,从而提升语音合成的效果. 展开更多
关键词 语音合成 韵律建模 停顿预测
在线阅读 下载PDF
基于细粒度韵律建模和条件CycleGAN的非平行蒙古语语音转换方法 被引量:2
2
作者 吴则诚 飞龙 +1 位作者 张晖 王海波 《信号处理》 CSCD 北大核心 2021年第10期1825-1834,共10页
语音转换技术在保持语义内容不变的前提下将源说话人的语音音色转换为目标说话人。目前,蒙古语语音转换面临语料匮乏、蒙古语字词在发音上韵律变化丰富等问题。针对这些问题,本文提出一种基于细粒度韵律建模和条件CycleGAN的非平行蒙古... 语音转换技术在保持语义内容不变的前提下将源说话人的语音音色转换为目标说话人。目前,蒙古语语音转换面临语料匮乏、蒙古语字词在发音上韵律变化丰富等问题。针对这些问题,本文提出一种基于细粒度韵律建模和条件CycleGAN的非平行蒙古语语音转换方法。该方法首先使用连续小波变换提取细粒度的语音韵律特征,然后向CycleGAN中加入说话人向量构建条件CycleGAN,最后使用条件CycleGAN得到源说话人和目标说话人之间稳定的韵律转换。实验结果表明,该方法与传统CycleGAN语音转换方法相比能够有效提升蒙古语语音转换效果,在语音自然度和说话人相似度的MOS评分上分别提升了0.1和0.2。 展开更多
关键词 蒙古语语音转换 非平行 条件CycleGAN 细粒度韵律建模
在线阅读 下载PDF
基于声调核参数及DNN建模的韵律边界检测研究 被引量:1
3
作者 林举 解焱陆 +1 位作者 张劲松 张微 《中文信息学报》 CSCD 北大核心 2016年第6期35-39,48,共6页
韵律边界对言语表达的自然度和可理解度有着重要作用。韵律建模也是语音合成、语音理解中的重要方面。该文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声学特征的汉语韵律边界检测方法。该方法首先采用声调核部分... 韵律边界对言语表达的自然度和可理解度有着重要作用。韵律建模也是语音合成、语音理解中的重要方面。该文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声学特征的汉语韵律边界检测方法。该方法首先采用声调核部分的声学特征来计算边界检测相关参数。然后,利用深度神经网络进行建模。作为对比,实验中采用了以整个音节的声学特征为输入特征的基线系统。结果表明,只使用调核部分声学特征的系统优于使用整个音节的系统,韵律边界检测正确率相对提高了4%,这表明该文提出的汉语韵律边界检测方法的有效性。 展开更多
关键词 韵律边界 声调核 深度神经网络
在线阅读 下载PDF
基于统计韵律模型的汉语语音合成系统的研究 被引量:7
4
作者 陶建华 赵晟 蔡莲红 《中文信息学报》 CSCD 北大核心 2002年第1期1-6,共6页
本文论述了采用统计模型进行汉语韵律层级结构分析和韵律建模的思路 ,在此基础上建立了汉语语音合成系统。其中 ,本文还仔细阐述了韵律代价函数的构造 ,及其参数的自动训练算法。同时 ,论文还分析了韵律特征间相互作用对音节基元选取的... 本文论述了采用统计模型进行汉语韵律层级结构分析和韵律建模的思路 ,在此基础上建立了汉语语音合成系统。其中 ,本文还仔细阐述了韵律代价函数的构造 ,及其参数的自动训练算法。同时 ,论文还分析了韵律特征间相互作用对音节基元选取的影响 ,并最终实现了一个连续语流中用于汉语语音合成的音节基元选取模型。测试表明了本文提出的基于统计模型的韵律层级分析和韵律建模思路 ,能够较好应用于汉语语音合成系统的构造 。 展开更多
关键词 汉语韵律层级结构 韵律建模 韵律代价函数 语音合成系统
在线阅读 下载PDF
普通话到西安话的韵律转换
5
作者 郭威彤 杨鸿武 +1 位作者 梁青青 裴东 《计算机工程与应用》 CSCD 北大核心 2011年第16期122-127,共6页
方言语音的转换是人机交互领域的一个重要研究课题。为实现普通话到西安话的转换,论文利用《方言调查字表》设计了一个包括文本语料和语音语料的西安方言语料库,录制了普通话和西安话平行的语音语料库。提出了基于归一化非线性多项式的... 方言语音的转换是人机交互领域的一个重要研究课题。为实现普通话到西安话的转换,论文利用《方言调查字表》设计了一个包括文本语料和语音语料的西安方言语料库,录制了普通话和西安话平行的语音语料库。提出了基于归一化非线性多项式的方言韵律转换模型以及基于统计的方言时长转换模型和停顿时长转换模型。利用STRAIGHT算法修改普通话语音,实现普通话到西安话的转换。对转换结果的MOS评测表明,转换后的单字平均MOS得分4.60,双字平均MOS得分为4.75,语句的平均MOS得分为4.15。 展开更多
关键词 方言转换 语料库 韵律建模 时长 基频曲线
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部