期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
TTS在车载乘客信息系统中的应用
1
作者 汤俊芹 《电声技术》 2024年第1期25-28,共4页
随着从文本到语音(Text To Speech,TTS)技术的发展,其语音效果已经可以达到真人播报效果。基于此,提出将TTS技术应用到车载乘客信息系统中,改变传统预录语音文件报站的方式,极大地提高语音播报的灵活性和可维护性。
关键词 文本到语音(tts) 乘客信息系统 语音质量
在线阅读 下载PDF
一种用于语音转换的区域最近邻迭代训练算法 被引量:1
2
作者 简志华 王向文 《电子与信息学报》 EI CSCD 北大核心 2012年第9期2091-2096,共6页
针对非对称语音库情况下的语音转换,该文提出一种新的改进的语音转换训练算法ILNCA。与原有的训练算法INCA不一样的是,ILNCA首先利用高斯混合模型(GMM)分别对源、目标语音特征参数空间进行分类。然后根据Kullback–Leibler(KL)距离最小... 针对非对称语音库情况下的语音转换,该文提出一种新的改进的语音转换训练算法ILNCA。与原有的训练算法INCA不一样的是,ILNCA首先利用高斯混合模型(GMM)分别对源、目标语音特征参数空间进行分类。然后根据Kullback–Leibler(KL)距离最小原则对源、目标GMM模型的子空间进行匹配,最后利用最近邻准则在相对应的子空间中进行源、目标语音特征参数矢量的对齐。客观测试和主观听觉实验都表明由于该文算法采用了更加精确的矢量对齐方法,能取得比INCA算法更优异的转换性能。 展开更多
关键词 语音转换 文本无关 最近邻准则 迭代训练
在线阅读 下载PDF
融合句嵌入的VAACGAN多对多语音转换 被引量:1
3
作者 李燕萍 曹盼 +1 位作者 石杨 张燕 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第3期500-508,共9页
针对非平行文本条件下语音转换质量不理想、说话人个性相似度不高的问题,提出一种融合句嵌入的变分自编码辅助分类器生成对抗网络(VAACGAN)语音转换方法,在非平行文本条件下,有效实现了高质量的多对多语音转换。辅助分类器生成对抗网络... 针对非平行文本条件下语音转换质量不理想、说话人个性相似度不高的问题,提出一种融合句嵌入的变分自编码辅助分类器生成对抗网络(VAACGAN)语音转换方法,在非平行文本条件下,有效实现了高质量的多对多语音转换。辅助分类器生成对抗网络的鉴别器中包含辅助解码器网络,能够在预测频谱特征真假的同时输出训练数据所属的说话人类别,使得生成对抗网络的训练更为稳定且加快其收敛速度。通过训练文本编码器获得句嵌入,将其作为一种语义内容约束融合到模型中,利用句嵌入包含的语义信息增强隐变量表征语音内容的能力,解决隐变量存在的过度正则化效应的问题,有效改善语音合成质量。实验结果表明:所提方法的转换语音平均MCD值较基准模型降低6.67%,平均MOS值提升8.33%,平均ABX值提升11.56%,证明该方法在语音音质和说话人个性相似度方面均有显著提升,实现了高质量的语音转换。 展开更多
关键词 语音转换 句嵌入 文本编码器 辅助分类器生成对抗网络(ACGAN) 变分自编码器 非平行文本 多对多
在线阅读 下载PDF
一个基于规则的英语TTS系统
4
作者 张连海 吴保民 《信息工程大学学报》 2005年第4期40-42,46,共4页
文章给出了一个基于规则的英语TTS(Text-To-Speech)系统的设计与实现方法。系统以音素作为合成基元,建立音素字典,使用基于规则的文本分析算法将输入英语句子转换成音素序列,使用基音同步叠接相加(PSOLA)算法合成语音。仿真结果表明,合... 文章给出了一个基于规则的英语TTS(Text-To-Speech)系统的设计与实现方法。系统以音素作为合成基元,建立音素字典,使用基于规则的文本分析算法将输入英语句子转换成音素序列,使用基音同步叠接相加(PSOLA)算法合成语音。仿真结果表明,合成语音清晰可懂。 展开更多
关键词 英语 文本语音转换 基于规则 文本分析 基音同步叠接相加
在线阅读 下载PDF
基于PSOLA算法的单片机TTS系统的研究及实现
5
作者 张涌 徐宏炳 《电子工程师》 2002年第2期1-3,8,共4页
为了在单片机系统中实现 PSOLA算法 ,对 PSOLA算法的支持库进行了简化 。
关键词 PSOLA算法 文语转换 小波变换 矢量量化 单片机 tts系统 语音合成
在线阅读 下载PDF
汉语语音视位的研究 被引量:10
6
作者 王志明 蔡莲红 《应用声学》 CSCD 北大核心 2002年第3期29-34,共6页
MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从... MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从AVI文件中自动抽取出这些基本视位图像,从MPEG-4所规定的68个面部动画参数(FAP)中提取出28个来描述这些口形,并实现了部分FAP参数的自动测量。最后,我们给出一个视位研究应用的实例。 展开更多
关键词 汉语 语音视位 文本-语音转换系统 文本-可视语音转换系统 静态视位 MPEG-4 语音识别
在线阅读 下载PDF
语音合成技术在声音修复上的尝试 被引量:2
7
作者 王峥 《现代电影技术》 2019年第7期46-50,共5页
为满足对影片声音修复的需要,解决目前面临的一些具体问题,本文对音频修复技术中文本转换为自然语音的技术方法进行了探讨,介绍了TTS以及Tacotron2方法,并提出了结合两种技术进行声音修复的尝试方法。
关键词 声音修复 文本转换为自然语音 语音合成
在线阅读 下载PDF
IC卡电子语音书
8
作者 杨振野 佘丙涛 +1 位作者 朱仁才 赖强 《电子技术应用》 北大核心 2003年第3期73-74,80,共3页
基于ISD单片语音录放集成电路和大容量IC卡,给出了IC卡电子语音书的设计方法。这种电子语音书具有体积小、重量轻、用电省和成本低的特点。
关键词 电子语音 IC卡 语音录放 文本转换 ISD 单片机
在线阅读 下载PDF
农产品质量语音查询系统的设计
9
作者 梁宇恩 付祥 《数字技术与应用》 2011年第3期62-63,共2页
根据农产品售后服务的需要,本文利用数据库和文本语音转换技术开发了一套农产品质量语音查询系统。系统结构合理,工作稳定,响应速度快。
关键词 文本语音转换 多线程 有限状态机
在线阅读 下载PDF
人工智能音色转换模型可有效服务和促进电影创作生产 被引量:4
10
作者 王薇娜(整理撰写) 《现代电影技术》 2023年第12期58-59,共2页
迄今,人工智能(AI)技术已广泛应用于电影声音生成和制作领域,可精准模仿特定演员的声音、语调和语速,以实现高度逼真的语音合成和自动配音,尤其适用于处理语言障碍或需要重新配音的情况;AI还可根据特定文本生成自然流畅的语音,用于电影... 迄今,人工智能(AI)技术已广泛应用于电影声音生成和制作领域,可精准模仿特定演员的声音、语调和语速,以实现高度逼真的语音合成和自动配音,尤其适用于处理语言障碍或需要重新配音的情况;AI还可根据特定文本生成自然流畅的语音,用于电影旁白、解说或虚拟角色对话。但在实际应用过程中,AI生成的人声质量参差不齐,易出现音色模仿不够精准等问题,其主要原因在于音色转换质量。当前其他相关领域中AI音色转换技术的创新应用可借鉴于电影制作中,以有效改善AI生成的人声质量。 展开更多
关键词 自然流畅 语音合成 虚拟角色 转换模型 电影制作 电影创作 电影声音 文本生成
在线阅读 下载PDF
韵律增强型汉语语音合成系统
11
作者 牛芳 吾守尔·斯拉木 《现代电子技术》 2022年第13期87-92,共6页
端到端语音合成(TTS)系统可以直接根据给定的字素或音素序列生成语音。当前主流的端到端语音合成系统可以为英语生成近似于人类声音的语音。然而,中文的文本不同于这类以罗马字母为基础的语言(如英语),直接将端到端语音合成框架应用于... 端到端语音合成(TTS)系统可以直接根据给定的字素或音素序列生成语音。当前主流的端到端语音合成系统可以为英语生成近似于人类声音的语音。然而,中文的文本不同于这类以罗马字母为基础的语言(如英语),直接将端到端语音合成框架应用于汉语时,合成音频存在较为严重的韵律问题,如断句或停顿不恰当、自然度差等。为此,结合汉语的语言特性和韵律特性,提出一种神经网络端到端韵律增强型汉语语音合成系统,该系统使用从预训练Bert模型中提取的多层次上下文特征增强端到端汉语语音合成系统的输入。在汉语语音合成公开数据集上的实验结果表明,与当前主流的端到端语音合成系统相比,该韵律增强型汉语语音合成系统可以生成更加自然且富有表现力的语音。 展开更多
关键词 文语转换 语音合成 汉语 韵律增强 Bert模型 tts
在线阅读 下载PDF
浅析智能电视语音中控解决方案
12
作者 刁艳侠 《电子产品世界》 2022年第10期28-31,共4页
我们正处在以智能制造为主导的第四次工业革命的浪潮中,随着人工智能、信息技术、生物技术等新兴技术的兴起,制造业进入到了全面智能化转型时期。如何让机器设备变得更加智能,为人类提供更舒适便捷的服务,就成为人们不断探索的课题。语... 我们正处在以智能制造为主导的第四次工业革命的浪潮中,随着人工智能、信息技术、生物技术等新兴技术的兴起,制造业进入到了全面智能化转型时期。如何让机器设备变得更加智能,为人类提供更舒适便捷的服务,就成为人们不断探索的课题。语言交流是人与人沟通的基础,自然而然地,智能语音就成为人与机器交互的一个重要载体。在智能电视领域,随着技术升级和应用场景的不断拓展,智能语音已经成为智能电视的核心能力之一,在人机交互中占据了越来越重要的地位。为了提升语音整体性能及业务能力,各大厂家不再满足于第三方语音技术方案提供的整套服务,开始加大对智能语音全链路的研发投入,以便对语音功能有更多优化和选择的空间。而在智能语音的整个链路中,云端控制和决策能力又是至关重要的一环,所以搭建私有化中控平台,成为各大厂家优先选择的方案。 展开更多
关键词 智能语音 中控平台 自动语音识别 自然语言理解 文本转换
在线阅读 下载PDF
基于实时交互数字人技术的融合智能终端设计与实现
13
作者 王丁 刘阳桢 陈嘉 《广播与电视技术》 2024年第9期24-27,共4页
本文重点介绍深圳广播电影电视集团推出的“机器人雇员智能终端”项目,该项目运用互动数字人、语音智能引导、VR技术和沉浸式体验等概念,将语音识别、自然语言处理、文本到语音转换技术以及广电虚拟主持人、裸眼3D成像技术同智能终端进... 本文重点介绍深圳广播电影电视集团推出的“机器人雇员智能终端”项目,该项目运用互动数字人、语音智能引导、VR技术和沉浸式体验等概念,将语音识别、自然语言处理、文本到语音转换技术以及广电虚拟主持人、裸眼3D成像技术同智能终端进行深度融合,可以提升政务服务的智能化水平,为智慧城市建设提供新思路和实践路径。 展开更多
关键词 实时交互数字人 广电虚拟主持人 语音识别 自然语言处理 文本到语音转换 智能终端
在线阅读 下载PDF
基于Web的英语自助学习系统设计 被引量:4
14
作者 张红斌 李广丽 《华东交通大学学报》 2010年第1期52-57,共6页
分析了基于Web的英语自助学习系统的工作原理,选择Microsoft Speech SDK5.1并在其基础之上封装WebVoiceCtl作为构建系统的核心技术。调用Text To Speech Engine完成文本语音转换,实现基于Web的英语听力测试。此外,通过Web-VoiceCtl控件... 分析了基于Web的英语自助学习系统的工作原理,选择Microsoft Speech SDK5.1并在其基础之上封装WebVoiceCtl作为构建系统的核心技术。调用Text To Speech Engine完成文本语音转换,实现基于Web的英语听力测试。此外,通过Web-VoiceCtl控件调用Speech Recognition Engine完成语音识别,实现基于Web的英语口语测试。最后,在ASP.NET环境下实现英语自助学习软件系统,该软件可提供基于Web的英语听、说、写等技能训练。 展开更多
关键词 英语自助学习系统 文本语音转换 语音识别 MICROSOFT SPEECH SDK WebVoiceCtl
在线阅读 下载PDF
基于CT技术搭建教务成绩查询热线 被引量:1
15
作者 谭保华 吴坚 曾玲 《信息技术》 2005年第9期146-148,共3页
以“湖北工业大学教务成绩查询热线”服务系统的设计为实例,讨论了呼叫应答中心服务系统,并与单纯基于互联网的客户服务进行了比较。着重从系统的设计思路、系统软硬件、系统功能模块,及系统运行和管理等方面进行了深入阐述。
关键词 呼叫中心 计算机电话技术(CTI) 交互式语音应答(IVR) 文语转换技术(tts)
在线阅读 下载PDF
基于EML语言的电话选举系统
16
作者 宫湘琦 《信息通信》 2013年第6期123-124,共2页
该系统采用了以下技术:自动语音识别技术(ASR),文本到语音转换技术(TTS)和互联网协议(IP)。选民使用的电话连接到传统的公共交换电话网(PSTN)或移动网络。系统使用语音自动识别引擎收集到选民的语音信息,并将语音转换成文本,再转换成选... 该系统采用了以下技术:自动语音识别技术(ASR),文本到语音转换技术(TTS)和互联网协议(IP)。选民使用的电话连接到传统的公共交换电话网(PSTN)或移动网络。系统使用语音自动识别引擎收集到选民的语音信息,并将语音转换成文本,再转换成选举标记语言(EML)格式的文本输出给电子选举系统;选举系统生成的EML格式的文本反馈信息通过使用文本转换语音(TTS)引擎和话筒传达给选民。 展开更多
关键词 选举标记语言EML 网上投票系统 自动语音识别系统ASR 文本到语音转换tts 语音投票
在线阅读 下载PDF
华为Voice Internet业务——带给您全新的感受
17
《有线电视技术》 2003年第5期101-101,94,共2页
随着现代通讯的高速发展,人们对信息的需求也与日俱增.然而在Internet网络成为最为普通的信息载体的今天,调查却显示出在众多国内电话用户中,不懂或不熟悉键盘操作的用户占有4/5,那如何利用人类最为原始的听说方式来获取互连网上的信息... 随着现代通讯的高速发展,人们对信息的需求也与日俱增.然而在Internet网络成为最为普通的信息载体的今天,调查却显示出在众多国内电话用户中,不懂或不熟悉键盘操作的用户占有4/5,那如何利用人类最为原始的听说方式来获取互连网上的信息呢?与此同时,电信运营商有大量的空闲电话网络,那如何利用闲置资源来提升话务量和服务质量?另外,互联网上有大量的闲置信息,网站如何赚钱?另一方面,广大用户想随时随地获得想要的信息,如何满足用户即时上网的需求呢?这些都成为现代通讯市场急需解决的问题. 展开更多
关键词 VoiceInternet业务 华为公司 电话网 语音互联网 自动语音识别 文本语音转换
在线阅读 下载PDF
水情报汛助手的设计及实现
18
作者 贺旭东 《治淮》 2011年第4期30-31,共2页
水情值班人员在检查各水文测站拍发的水情报文时,经常需要查询各测站相关实时水情信息。水情报汛助手将人工和遥测水情数据库结合起来,为用户提供屏幕取词查询、语音播报等服务,以减少水情值班人员的工作量,提高水情报汛工作效率。本文... 水情值班人员在检查各水文测站拍发的水情报文时,经常需要查询各测站相关实时水情信息。水情报汛助手将人工和遥测水情数据库结合起来,为用户提供屏幕取词查询、语音播报等服务,以减少水情值班人员的工作量,提高水情报汛工作效率。本文将介绍水情报汛助手的设计及其Visual C++实现。 展开更多
关键词 水情信息 水情报汛 屏幕取词 文本语音转换
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部