期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于音素级韵律建模的自回归零样本语音合成
1
作者
岳焕景
王嘉玮
杨敬钰
《湖南大学学报(自然科学版)》
北大核心
2025年第4期114-123,共10页
为了提升合成韵律的自然度和稳定性,提出了基于音素级韵律建模的自回归语音合成模型.该模型从词级别停顿和音素时长两方面改进韵律建模.为了提升词级别停顿的多样性和准确性,在文本前端提出了停顿预测模块.该模块基于原始文本来预测多...
为了提升合成韵律的自然度和稳定性,提出了基于音素级韵律建模的自回归语音合成模型.该模型从词级别停顿和音素时长两方面改进韵律建模.为了提升词级别停顿的多样性和准确性,在文本前端提出了停顿预测模块.该模块基于原始文本来预测多类停顿标签,从而为语音合成提供停顿时长建模的准确参考.为了提升音素时长的自然度,提出了时长预测模块.该模块预测每个音素的混合高斯分布,并通过随机采样来获得多样化的音素时长.为了提升自回归模型中的音素时长建模的稳定性,提出了注意力判别模块.该模块应用于自回归的每个时间步中,并通过注意力和判断机制来避免对齐紊乱现象.实验结果表明,所提三种模块可有效提升韵律建模的自然度和稳定性,从而提升语音合成的效果.
展开更多
关键词
语音合成
韵律建模
停顿预测
在线阅读
下载PDF
职称材料
基于细粒度韵律建模和条件CycleGAN的非平行蒙古语语音转换方法
被引量:
2
2
作者
吴则诚
飞龙
+1 位作者
张晖
王海波
《信号处理》
CSCD
北大核心
2021年第10期1825-1834,共10页
语音转换技术在保持语义内容不变的前提下将源说话人的语音音色转换为目标说话人。目前,蒙古语语音转换面临语料匮乏、蒙古语字词在发音上韵律变化丰富等问题。针对这些问题,本文提出一种基于细粒度韵律建模和条件CycleGAN的非平行蒙古...
语音转换技术在保持语义内容不变的前提下将源说话人的语音音色转换为目标说话人。目前,蒙古语语音转换面临语料匮乏、蒙古语字词在发音上韵律变化丰富等问题。针对这些问题,本文提出一种基于细粒度韵律建模和条件CycleGAN的非平行蒙古语语音转换方法。该方法首先使用连续小波变换提取细粒度的语音韵律特征,然后向CycleGAN中加入说话人向量构建条件CycleGAN,最后使用条件CycleGAN得到源说话人和目标说话人之间稳定的韵律转换。实验结果表明,该方法与传统CycleGAN语音转换方法相比能够有效提升蒙古语语音转换效果,在语音自然度和说话人相似度的MOS评分上分别提升了0.1和0.2。
展开更多
关键词
蒙古语语音转换
非平行
条件CycleGAN
细粒度
韵律建模
在线阅读
下载PDF
职称材料
基于声调核参数及DNN建模的韵律边界检测研究
被引量:
1
3
作者
林举
解焱陆
+1 位作者
张劲松
张微
《中文信息学报》
CSCD
北大核心
2016年第6期35-39,48,共6页
韵律边界对言语表达的自然度和可理解度有着重要作用。韵律建模也是语音合成、语音理解中的重要方面。该文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声学特征的汉语韵律边界检测方法。该方法首先采用声调核部分...
韵律边界对言语表达的自然度和可理解度有着重要作用。韵律建模也是语音合成、语音理解中的重要方面。该文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声学特征的汉语韵律边界检测方法。该方法首先采用声调核部分的声学特征来计算边界检测相关参数。然后,利用深度神经网络进行建模。作为对比,实验中采用了以整个音节的声学特征为输入特征的基线系统。结果表明,只使用调核部分声学特征的系统优于使用整个音节的系统,韵律边界检测正确率相对提高了4%,这表明该文提出的汉语韵律边界检测方法的有效性。
展开更多
关键词
韵律
边界
建
模
声调核
深度神经网络
在线阅读
下载PDF
职称材料
基于统计韵律模型的汉语语音合成系统的研究
被引量:
7
4
作者
陶建华
赵晟
蔡莲红
《中文信息学报》
CSCD
北大核心
2002年第1期1-6,共6页
本文论述了采用统计模型进行汉语韵律层级结构分析和韵律建模的思路 ,在此基础上建立了汉语语音合成系统。其中 ,本文还仔细阐述了韵律代价函数的构造 ,及其参数的自动训练算法。同时 ,论文还分析了韵律特征间相互作用对音节基元选取的...
本文论述了采用统计模型进行汉语韵律层级结构分析和韵律建模的思路 ,在此基础上建立了汉语语音合成系统。其中 ,本文还仔细阐述了韵律代价函数的构造 ,及其参数的自动训练算法。同时 ,论文还分析了韵律特征间相互作用对音节基元选取的影响 ,并最终实现了一个连续语流中用于汉语语音合成的音节基元选取模型。测试表明了本文提出的基于统计模型的韵律层级分析和韵律建模思路 ,能够较好应用于汉语语音合成系统的构造 。
展开更多
关键词
汉语
韵律
层级结构
韵律建模
韵律
代价函数
语音合成系统
在线阅读
下载PDF
职称材料
普通话到西安话的韵律转换
5
作者
郭威彤
杨鸿武
+1 位作者
梁青青
裴东
《计算机工程与应用》
CSCD
北大核心
2011年第16期122-127,共6页
方言语音的转换是人机交互领域的一个重要研究课题。为实现普通话到西安话的转换,论文利用《方言调查字表》设计了一个包括文本语料和语音语料的西安方言语料库,录制了普通话和西安话平行的语音语料库。提出了基于归一化非线性多项式的...
方言语音的转换是人机交互领域的一个重要研究课题。为实现普通话到西安话的转换,论文利用《方言调查字表》设计了一个包括文本语料和语音语料的西安方言语料库,录制了普通话和西安话平行的语音语料库。提出了基于归一化非线性多项式的方言韵律转换模型以及基于统计的方言时长转换模型和停顿时长转换模型。利用STRAIGHT算法修改普通话语音,实现普通话到西安话的转换。对转换结果的MOS评测表明,转换后的单字平均MOS得分4.60,双字平均MOS得分为4.75,语句的平均MOS得分为4.15。
展开更多
关键词
方言转换
语料库
韵律建模
时长
模
型
基频曲线
在线阅读
下载PDF
职称材料
题名
基于音素级韵律建模的自回归零样本语音合成
1
作者
岳焕景
王嘉玮
杨敬钰
机构
天津大学电气自动化与信息工程学院
出处
《湖南大学学报(自然科学版)》
北大核心
2025年第4期114-123,共10页
基金
国家自然科学基金资助项目(61672378)。
文摘
为了提升合成韵律的自然度和稳定性,提出了基于音素级韵律建模的自回归语音合成模型.该模型从词级别停顿和音素时长两方面改进韵律建模.为了提升词级别停顿的多样性和准确性,在文本前端提出了停顿预测模块.该模块基于原始文本来预测多类停顿标签,从而为语音合成提供停顿时长建模的准确参考.为了提升音素时长的自然度,提出了时长预测模块.该模块预测每个音素的混合高斯分布,并通过随机采样来获得多样化的音素时长.为了提升自回归模型中的音素时长建模的稳定性,提出了注意力判别模块.该模块应用于自回归的每个时间步中,并通过注意力和判断机制来避免对齐紊乱现象.实验结果表明,所提三种模块可有效提升韵律建模的自然度和稳定性,从而提升语音合成的效果.
关键词
语音合成
韵律建模
停顿预测
Keywords
speech synthesis
prosody modeling
pause prediction
分类号
TP37 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于细粒度韵律建模和条件CycleGAN的非平行蒙古语语音转换方法
被引量:
2
2
作者
吴则诚
飞龙
张晖
王海波
机构
内蒙古大学计算机学院
蒙古文智能信息处理技术国家地方联合工程研究中心
内蒙古自治区蒙古文信息处理技术重点实验室
内蒙古自治区纪检监察大数据实验室
出处
《信号处理》
CSCD
北大核心
2021年第10期1825-1834,共10页
基金
国家重点研发计划项目(2018YFE0122900)
国家自然基金项目(62066033,61773224)
+1 种基金
内蒙古自治区应用技术研究与开发资金项目(2019GG372,2020GG0046,2021GG0158,2020PT0002)
内蒙古自治区成果转化项目(2019CG028)。
文摘
语音转换技术在保持语义内容不变的前提下将源说话人的语音音色转换为目标说话人。目前,蒙古语语音转换面临语料匮乏、蒙古语字词在发音上韵律变化丰富等问题。针对这些问题,本文提出一种基于细粒度韵律建模和条件CycleGAN的非平行蒙古语语音转换方法。该方法首先使用连续小波变换提取细粒度的语音韵律特征,然后向CycleGAN中加入说话人向量构建条件CycleGAN,最后使用条件CycleGAN得到源说话人和目标说话人之间稳定的韵律转换。实验结果表明,该方法与传统CycleGAN语音转换方法相比能够有效提升蒙古语语音转换效果,在语音自然度和说话人相似度的MOS评分上分别提升了0.1和0.2。
关键词
蒙古语语音转换
非平行
条件CycleGAN
细粒度
韵律建模
Keywords
Mongolian voice conversation
non-paralle
conditional CycleGAN
fined-grained prosody modeling
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于声调核参数及DNN建模的韵律边界检测研究
被引量:
1
3
作者
林举
解焱陆
张劲松
张微
机构
北京语言大学信息科学学院
出处
《中文信息学报》
CSCD
北大核心
2016年第6期35-39,48,共6页
基金
北京语言大学梧桐创新平台项目资助(中央高校基本科研业务费专项基金)(16PT05)
北京语言大学研究生创新基金资助项目(中央高校基本科研业务费专项资金)(16YCX163)
文摘
韵律边界对言语表达的自然度和可理解度有着重要作用。韵律建模也是语音合成、语音理解中的重要方面。该文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声学特征的汉语韵律边界检测方法。该方法首先采用声调核部分的声学特征来计算边界检测相关参数。然后,利用深度神经网络进行建模。作为对比,实验中采用了以整个音节的声学特征为输入特征的基线系统。结果表明,只使用调核部分声学特征的系统优于使用整个音节的系统,韵律边界检测正确率相对提高了4%,这表明该文提出的汉语韵律边界检测方法的有效性。
关键词
韵律
边界
建
模
声调核
深度神经网络
Keywords
prosody boundary modeling
tone nucleus
deep neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于统计韵律模型的汉语语音合成系统的研究
被引量:
7
4
作者
陶建华
赵晟
蔡莲红
机构
清华大学计算机系人机交互与媒体集成研究所
出处
《中文信息学报》
CSCD
北大核心
2002年第1期1-6,共6页
基金
国家自然科学基金 (6 9875 0 0 8)
文摘
本文论述了采用统计模型进行汉语韵律层级结构分析和韵律建模的思路 ,在此基础上建立了汉语语音合成系统。其中 ,本文还仔细阐述了韵律代价函数的构造 ,及其参数的自动训练算法。同时 ,论文还分析了韵律特征间相互作用对音节基元选取的影响 ,并最终实现了一个连续语流中用于汉语语音合成的音节基元选取模型。测试表明了本文提出的基于统计模型的韵律层级分析和韵律建模思路 ,能够较好应用于汉语语音合成系统的构造 。
关键词
汉语
韵律
层级结构
韵律建模
韵律
代价函数
语音合成系统
Keywords
Chinese Prosodic Hierarchy
Prosody Modeling
Prosody Cost Function.
分类号
TN912.33 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
普通话到西安话的韵律转换
5
作者
郭威彤
杨鸿武
梁青青
裴东
机构
西北师范大学物理与电子工程学院
甘肃联合大学电子与信息工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2011年第16期122-127,共6页
基金
国家自然科学基金面上项目No.60875015
教育部科学研究重点项目(No.208146)~~
文摘
方言语音的转换是人机交互领域的一个重要研究课题。为实现普通话到西安话的转换,论文利用《方言调查字表》设计了一个包括文本语料和语音语料的西安方言语料库,录制了普通话和西安话平行的语音语料库。提出了基于归一化非线性多项式的方言韵律转换模型以及基于统计的方言时长转换模型和停顿时长转换模型。利用STRAIGHT算法修改普通话语音,实现普通话到西安话的转换。对转换结果的MOS评测表明,转换后的单字平均MOS得分4.60,双字平均MOS得分为4.75,语句的平均MOS得分为4.15。
关键词
方言转换
语料库
韵律建模
时长
模
型
基频曲线
Keywords
dialect conversion
corpus
prosody modeling
duration model
pitch contour
分类号
TP302.7 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于音素级韵律建模的自回归零样本语音合成
岳焕景
王嘉玮
杨敬钰
《湖南大学学报(自然科学版)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于细粒度韵律建模和条件CycleGAN的非平行蒙古语语音转换方法
吴则诚
飞龙
张晖
王海波
《信号处理》
CSCD
北大核心
2021
2
在线阅读
下载PDF
职称材料
3
基于声调核参数及DNN建模的韵律边界检测研究
林举
解焱陆
张劲松
张微
《中文信息学报》
CSCD
北大核心
2016
1
在线阅读
下载PDF
职称材料
4
基于统计韵律模型的汉语语音合成系统的研究
陶建华
赵晟
蔡莲红
《中文信息学报》
CSCD
北大核心
2002
7
在线阅读
下载PDF
职称材料
5
普通话到西安话的韵律转换
郭威彤
杨鸿武
梁青青
裴东
《计算机工程与应用》
CSCD
北大核心
2011
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部