期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
融合自动检错的单元挑选语音合成方法
1
作者 孙晓辉 凌震华 戴礼荣 《数据采集与处理》 CSCD 北大核心 2016年第2期385-392,共8页
提出了一种融合自动检错的单元挑选语音合成方法。本文方法旨在设计与主观听感更加一致的单元挑选准则,以提高合成语音的自然度。首先利用众包网络平台快速大量地收集测听人对于合成语音的主观评价数据,取代了传统的利用具备语言学知识... 提出了一种融合自动检错的单元挑选语音合成方法。本文方法旨在设计与主观听感更加一致的单元挑选准则,以提高合成语音的自然度。首先利用众包网络平台快速大量地收集测听人对于合成语音的主观评价数据,取代了传统的利用具备语言学知识的专家收集主观评价数据的方法;然后基于这些主观评价数据,提取对应语音的音节时长、单元代价以及声学参数距离等特征,构建基于支持向量机的合成错误检测器;在合成阶段,该检测器被用来对传统单元挑选输出的N条路径行重打分,以确定最优的单元挑选序列。倾向性测听结果表明本文方法可以有效地提高合成语音的自然度。 展开更多
关键词 语音合成 单元挑选 支持向量机 众包 合成错误检测
在线阅读 下载PDF
基于声学统计建模的语音合成技术研究 被引量:9
2
作者 胡郁 凌震华 +1 位作者 王仁华 戴礼荣 《中文信息学报》 CSCD 北大核心 2011年第6期127-136,共10页
该文介绍基于声学统计建模的语音合成技术,重点回顾中国科学技术大学讯飞语音实验室在语音合成领域这一前沿发展方向的创新性工作成果。具体包括:融合发音动作参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然... 该文介绍基于声学统计建模的语音合成技术,重点回顾中国科学技术大学讯飞语音实验室在语音合成领域这一前沿发展方向的创新性工作成果。具体包括:融合发音动作参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,改善参数语音合成器在合成语音音质上的不足。以上技术创新使得语音合成系统在自然度、表现力、灵活性及多语种应用等方面的性能都有进一步的提升,并推动语音合成技术在呼叫中心信息服务、移动嵌入式设备人机语音交互、智能语音教学等领域的广泛引用。 展开更多
关键词 语音合成 隐马尔可夫模型 参数合成 单元挑选
在线阅读 下载PDF
基于声学统计建模的新一代语音合成技术 被引量:2
3
作者 王仁华 戴礼荣 +1 位作者 胡郁 凌震华 《中国科学技术大学学报》 CAS CSCD 北大核心 2008年第7期725-734,共10页
介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音... 介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,从根本上改善HMM参数语音合成器在合成语音音质上的不足.这些技术创新使得新一代语音合成在自然度、表现力、灵活性及多语种实现等方面的性能都有进一步的提升. 展开更多
关键词 语音合成 隐马尔可夫模型 参数合成 单元挑选
在线阅读 下载PDF
多基元及韵律参数匹配的维吾尔语语音合成方法 被引量:3
4
作者 姑丽加玛丽·麦麦提艾力 艾斯卡尔·肉孜 艾斯卡尔·艾木都拉 《计算机工程与应用》 CSCD 2012年第2期116-118,共3页
音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音... 音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音素和三音素两个不同基元的单元挑选算法。通过在单元挑选模块中加入韵律参数相匹配的方法选出最佳韵律匹配的单元并解决了合成语音不连续的情况。实验结果表明,提出的方法有效地解决了合成语音不稳定和不连续的现象,从而提高了合成语音的自然度。 展开更多
关键词 维吾尔语音合成 单音素 三音素 韵律参数模型 单元挑选
在线阅读 下载PDF
面向大语料库的语音合成方法研究 被引量:2
5
作者 于延锁 朱风云 +2 位作者 李先刚 刘翼 吴玺宏 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第5期791-796,共6页
针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题... 针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题,优化了传统的训练流程,在不损失声学模型准确性的前提下,显著提高了模型的训练速度。主观实验表明,与具有精标注的小语料库相比,引入粗标注的大语料库可以带来0.5分左右的MOS提升。 展开更多
关键词 语音数据筛选 声学模型训练 基于HMM的单元挑选与波形拼接
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部