期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
18
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
TTS在车载乘客信息系统中的应用
1
作者
汤俊芹
《电声技术》
2024年第1期25-28,共4页
随着从文本到语音(Text To Speech,TTS)技术的发展,其语音效果已经可以达到真人播报效果。基于此,提出将TTS技术应用到车载乘客信息系统中,改变传统预录语音文件报站的方式,极大地提高语音播报的灵活性和可维护性。
关键词
从
文本到
语音
(
tts
)
乘客信息系统
语音
质量
在线阅读
下载PDF
职称材料
一种用于语音转换的区域最近邻迭代训练算法
被引量:
1
2
作者
简志华
王向文
《电子与信息学报》
EI
CSCD
北大核心
2012年第9期2091-2096,共6页
针对非对称语音库情况下的语音转换,该文提出一种新的改进的语音转换训练算法ILNCA。与原有的训练算法INCA不一样的是,ILNCA首先利用高斯混合模型(GMM)分别对源、目标语音特征参数空间进行分类。然后根据Kullback–Leibler(KL)距离最小...
针对非对称语音库情况下的语音转换,该文提出一种新的改进的语音转换训练算法ILNCA。与原有的训练算法INCA不一样的是,ILNCA首先利用高斯混合模型(GMM)分别对源、目标语音特征参数空间进行分类。然后根据Kullback–Leibler(KL)距离最小原则对源、目标GMM模型的子空间进行匹配,最后利用最近邻准则在相对应的子空间中进行源、目标语音特征参数矢量的对齐。客观测试和主观听觉实验都表明由于该文算法采用了更加精确的矢量对齐方法,能取得比INCA算法更优异的转换性能。
展开更多
关键词
语音
转换
与
文本
无关
最近邻准则
迭代训练
在线阅读
下载PDF
职称材料
融合句嵌入的VAACGAN多对多语音转换
被引量:
1
3
作者
李燕萍
曹盼
+1 位作者
石杨
张燕
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2021年第3期500-508,共9页
针对非平行文本条件下语音转换质量不理想、说话人个性相似度不高的问题,提出一种融合句嵌入的变分自编码辅助分类器生成对抗网络(VAACGAN)语音转换方法,在非平行文本条件下,有效实现了高质量的多对多语音转换。辅助分类器生成对抗网络...
针对非平行文本条件下语音转换质量不理想、说话人个性相似度不高的问题,提出一种融合句嵌入的变分自编码辅助分类器生成对抗网络(VAACGAN)语音转换方法,在非平行文本条件下,有效实现了高质量的多对多语音转换。辅助分类器生成对抗网络的鉴别器中包含辅助解码器网络,能够在预测频谱特征真假的同时输出训练数据所属的说话人类别,使得生成对抗网络的训练更为稳定且加快其收敛速度。通过训练文本编码器获得句嵌入,将其作为一种语义内容约束融合到模型中,利用句嵌入包含的语义信息增强隐变量表征语音内容的能力,解决隐变量存在的过度正则化效应的问题,有效改善语音合成质量。实验结果表明:所提方法的转换语音平均MCD值较基准模型降低6.67%,平均MOS值提升8.33%,平均ABX值提升11.56%,证明该方法在语音音质和说话人个性相似度方面均有显著提升,实现了高质量的语音转换。
展开更多
关键词
语音
转换
句嵌入
文本
编码器
辅助分类器生成对抗网络(ACGAN)
变分自编码器
非平行
文本
多对多
在线阅读
下载PDF
职称材料
一个基于规则的英语TTS系统
4
作者
张连海
吴保民
《信息工程大学学报》
2005年第4期40-42,46,共4页
文章给出了一个基于规则的英语TTS(Text-To-Speech)系统的设计与实现方法。系统以音素作为合成基元,建立音素字典,使用基于规则的文本分析算法将输入英语句子转换成音素序列,使用基音同步叠接相加(PSOLA)算法合成语音。仿真结果表明,合...
文章给出了一个基于规则的英语TTS(Text-To-Speech)系统的设计与实现方法。系统以音素作为合成基元,建立音素字典,使用基于规则的文本分析算法将输入英语句子转换成音素序列,使用基音同步叠接相加(PSOLA)算法合成语音。仿真结果表明,合成语音清晰可懂。
展开更多
关键词
英语
文本
语音
转换
基于规则
文本
分析
基音同步叠接相加
在线阅读
下载PDF
职称材料
基于PSOLA算法的单片机TTS系统的研究及实现
5
作者
张涌
徐宏炳
《电子工程师》
2002年第2期1-3,8,共4页
为了在单片机系统中实现 PSOLA算法 ,对 PSOLA算法的支持库进行了简化 。
关键词
PSOLA算法
文语
转换
小波变换
矢量量化
单片机
tts
系统
语音
合成
在线阅读
下载PDF
职称材料
汉语语音视位的研究
被引量:
10
6
作者
王志明
蔡莲红
《应用声学》
CSCD
北大核心
2002年第3期29-34,共6页
MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从...
MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从AVI文件中自动抽取出这些基本视位图像,从MPEG-4所规定的68个面部动画参数(FAP)中提取出28个来描述这些口形,并实现了部分FAP参数的自动测量。最后,我们给出一个视位研究应用的实例。
展开更多
关键词
汉语
语音
视位
文本
-
语音
转换
系统
文本
-可视
语音
转换
系统
静态视位
MPEG-4
语音
识别
在线阅读
下载PDF
职称材料
语音合成技术在声音修复上的尝试
被引量:
2
7
作者
王峥
《现代电影技术》
2019年第7期46-50,共5页
为满足对影片声音修复的需要,解决目前面临的一些具体问题,本文对音频修复技术中文本转换为自然语音的技术方法进行了探讨,介绍了TTS以及Tacotron2方法,并提出了结合两种技术进行声音修复的尝试方法。
关键词
声音修复
文本
转换
为自然
语音
语音
合成
在线阅读
下载PDF
职称材料
IC卡电子语音书
8
作者
杨振野
佘丙涛
+1 位作者
朱仁才
赖强
《电子技术应用》
北大核心
2003年第3期73-74,80,共3页
基于ISD单片语音录放集成电路和大容量IC卡,给出了IC卡电子语音书的设计方法。这种电子语音书具有体积小、重量轻、用电省和成本低的特点。
关键词
电子
语音
书
IC卡
语音
录放
文本
转换
ISD
单片机
在线阅读
下载PDF
职称材料
农产品质量语音查询系统的设计
9
作者
梁宇恩
付祥
《数字技术与应用》
2011年第3期62-63,共2页
根据农产品售后服务的需要,本文利用数据库和文本语音转换技术开发了一套农产品质量语音查询系统。系统结构合理,工作稳定,响应速度快。
关键词
文本
语音
转换
多线程
有限状态机
在线阅读
下载PDF
职称材料
人工智能音色转换模型可有效服务和促进电影创作生产
被引量:
4
10
作者
王薇娜(整理撰写)
《现代电影技术》
2023年第12期58-59,共2页
迄今,人工智能(AI)技术已广泛应用于电影声音生成和制作领域,可精准模仿特定演员的声音、语调和语速,以实现高度逼真的语音合成和自动配音,尤其适用于处理语言障碍或需要重新配音的情况;AI还可根据特定文本生成自然流畅的语音,用于电影...
迄今,人工智能(AI)技术已广泛应用于电影声音生成和制作领域,可精准模仿特定演员的声音、语调和语速,以实现高度逼真的语音合成和自动配音,尤其适用于处理语言障碍或需要重新配音的情况;AI还可根据特定文本生成自然流畅的语音,用于电影旁白、解说或虚拟角色对话。但在实际应用过程中,AI生成的人声质量参差不齐,易出现音色模仿不够精准等问题,其主要原因在于音色转换质量。当前其他相关领域中AI音色转换技术的创新应用可借鉴于电影制作中,以有效改善AI生成的人声质量。
展开更多
关键词
自然流畅
语音
合成
虚拟角色
转换
模型
电影制作
电影创作
电影声音
文本
生成
在线阅读
下载PDF
职称材料
韵律增强型汉语语音合成系统
11
作者
牛芳
吾守尔·斯拉木
《现代电子技术》
2022年第13期87-92,共6页
端到端语音合成(TTS)系统可以直接根据给定的字素或音素序列生成语音。当前主流的端到端语音合成系统可以为英语生成近似于人类声音的语音。然而,中文的文本不同于这类以罗马字母为基础的语言(如英语),直接将端到端语音合成框架应用于...
端到端语音合成(TTS)系统可以直接根据给定的字素或音素序列生成语音。当前主流的端到端语音合成系统可以为英语生成近似于人类声音的语音。然而,中文的文本不同于这类以罗马字母为基础的语言(如英语),直接将端到端语音合成框架应用于汉语时,合成音频存在较为严重的韵律问题,如断句或停顿不恰当、自然度差等。为此,结合汉语的语言特性和韵律特性,提出一种神经网络端到端韵律增强型汉语语音合成系统,该系统使用从预训练Bert模型中提取的多层次上下文特征增强端到端汉语语音合成系统的输入。在汉语语音合成公开数据集上的实验结果表明,与当前主流的端到端语音合成系统相比,该韵律增强型汉语语音合成系统可以生成更加自然且富有表现力的语音。
展开更多
关键词
文语
转换
语音
合成
汉语
韵律增强
Bert模型
tts
在线阅读
下载PDF
职称材料
浅析智能电视语音中控解决方案
12
作者
刁艳侠
《电子产品世界》
2022年第10期28-31,共4页
我们正处在以智能制造为主导的第四次工业革命的浪潮中,随着人工智能、信息技术、生物技术等新兴技术的兴起,制造业进入到了全面智能化转型时期。如何让机器设备变得更加智能,为人类提供更舒适便捷的服务,就成为人们不断探索的课题。语...
我们正处在以智能制造为主导的第四次工业革命的浪潮中,随着人工智能、信息技术、生物技术等新兴技术的兴起,制造业进入到了全面智能化转型时期。如何让机器设备变得更加智能,为人类提供更舒适便捷的服务,就成为人们不断探索的课题。语言交流是人与人沟通的基础,自然而然地,智能语音就成为人与机器交互的一个重要载体。在智能电视领域,随着技术升级和应用场景的不断拓展,智能语音已经成为智能电视的核心能力之一,在人机交互中占据了越来越重要的地位。为了提升语音整体性能及业务能力,各大厂家不再满足于第三方语音技术方案提供的整套服务,开始加大对智能语音全链路的研发投入,以便对语音功能有更多优化和选择的空间。而在智能语音的整个链路中,云端控制和决策能力又是至关重要的一环,所以搭建私有化中控平台,成为各大厂家优先选择的方案。
展开更多
关键词
智能
语音
中控平台
自动
语音
识别
自然语言理解
文本
转换
在线阅读
下载PDF
职称材料
基于实时交互数字人技术的融合智能终端设计与实现
13
作者
王丁
刘阳桢
陈嘉
《广播与电视技术》
2024年第9期24-27,共4页
本文重点介绍深圳广播电影电视集团推出的“机器人雇员智能终端”项目,该项目运用互动数字人、语音智能引导、VR技术和沉浸式体验等概念,将语音识别、自然语言处理、文本到语音转换技术以及广电虚拟主持人、裸眼3D成像技术同智能终端进...
本文重点介绍深圳广播电影电视集团推出的“机器人雇员智能终端”项目,该项目运用互动数字人、语音智能引导、VR技术和沉浸式体验等概念,将语音识别、自然语言处理、文本到语音转换技术以及广电虚拟主持人、裸眼3D成像技术同智能终端进行深度融合,可以提升政务服务的智能化水平,为智慧城市建设提供新思路和实践路径。
展开更多
关键词
实时交互数字人
广电虚拟主持人
语音
识别
自然语言处理
文本到
语音
转换
智能终端
在线阅读
下载PDF
职称材料
基于Web的英语自助学习系统设计
被引量:
4
14
作者
张红斌
李广丽
《华东交通大学学报》
2010年第1期52-57,共6页
分析了基于Web的英语自助学习系统的工作原理,选择Microsoft Speech SDK5.1并在其基础之上封装WebVoiceCtl作为构建系统的核心技术。调用Text To Speech Engine完成文本语音转换,实现基于Web的英语听力测试。此外,通过Web-VoiceCtl控件...
分析了基于Web的英语自助学习系统的工作原理,选择Microsoft Speech SDK5.1并在其基础之上封装WebVoiceCtl作为构建系统的核心技术。调用Text To Speech Engine完成文本语音转换,实现基于Web的英语听力测试。此外,通过Web-VoiceCtl控件调用Speech Recognition Engine完成语音识别,实现基于Web的英语口语测试。最后,在ASP.NET环境下实现英语自助学习软件系统,该软件可提供基于Web的英语听、说、写等技能训练。
展开更多
关键词
英语自助学习系统
文本
语音
转换
语音
识别
MICROSOFT
SPEECH
SDK
WebVoiceCtl
在线阅读
下载PDF
职称材料
基于CT技术搭建教务成绩查询热线
被引量:
1
15
作者
谭保华
吴坚
曾玲
《信息技术》
2005年第9期146-148,共3页
以“湖北工业大学教务成绩查询热线”服务系统的设计为实例,讨论了呼叫应答中心服务系统,并与单纯基于互联网的客户服务进行了比较。着重从系统的设计思路、系统软硬件、系统功能模块,及系统运行和管理等方面进行了深入阐述。
关键词
呼叫中心
计算机电话技术(CTI)
交互式
语音
应答(IVR)
文语
转换
技术(
tts
)
在线阅读
下载PDF
职称材料
基于EML语言的电话选举系统
16
作者
宫湘琦
《信息通信》
2013年第6期123-124,共2页
该系统采用了以下技术:自动语音识别技术(ASR),文本到语音转换技术(TTS)和互联网协议(IP)。选民使用的电话连接到传统的公共交换电话网(PSTN)或移动网络。系统使用语音自动识别引擎收集到选民的语音信息,并将语音转换成文本,再转换成选...
该系统采用了以下技术:自动语音识别技术(ASR),文本到语音转换技术(TTS)和互联网协议(IP)。选民使用的电话连接到传统的公共交换电话网(PSTN)或移动网络。系统使用语音自动识别引擎收集到选民的语音信息,并将语音转换成文本,再转换成选举标记语言(EML)格式的文本输出给电子选举系统;选举系统生成的EML格式的文本反馈信息通过使用文本转换语音(TTS)引擎和话筒传达给选民。
展开更多
关键词
选举标记语言EML
网上投票系统
自动
语音
识别系统ASR
文本到语音转换tts
语音
投票
在线阅读
下载PDF
职称材料
华为Voice Internet业务——带给您全新的感受
17
《有线电视技术》
2003年第5期101-101,94,共2页
随着现代通讯的高速发展,人们对信息的需求也与日俱增.然而在Internet网络成为最为普通的信息载体的今天,调查却显示出在众多国内电话用户中,不懂或不熟悉键盘操作的用户占有4/5,那如何利用人类最为原始的听说方式来获取互连网上的信息...
随着现代通讯的高速发展,人们对信息的需求也与日俱增.然而在Internet网络成为最为普通的信息载体的今天,调查却显示出在众多国内电话用户中,不懂或不熟悉键盘操作的用户占有4/5,那如何利用人类最为原始的听说方式来获取互连网上的信息呢?与此同时,电信运营商有大量的空闲电话网络,那如何利用闲置资源来提升话务量和服务质量?另外,互联网上有大量的闲置信息,网站如何赚钱?另一方面,广大用户想随时随地获得想要的信息,如何满足用户即时上网的需求呢?这些都成为现代通讯市场急需解决的问题.
展开更多
关键词
VoiceInternet业务
华为公司
电话网
语音
互联网
自动
语音
识别
文本
语音
转换
在线阅读
下载PDF
职称材料
水情报汛助手的设计及实现
18
作者
贺旭东
《治淮》
2011年第4期30-31,共2页
水情值班人员在检查各水文测站拍发的水情报文时,经常需要查询各测站相关实时水情信息。水情报汛助手将人工和遥测水情数据库结合起来,为用户提供屏幕取词查询、语音播报等服务,以减少水情值班人员的工作量,提高水情报汛工作效率。本文...
水情值班人员在检查各水文测站拍发的水情报文时,经常需要查询各测站相关实时水情信息。水情报汛助手将人工和遥测水情数据库结合起来,为用户提供屏幕取词查询、语音播报等服务,以减少水情值班人员的工作量,提高水情报汛工作效率。本文将介绍水情报汛助手的设计及其Visual C++实现。
展开更多
关键词
水情信息
水情报汛
屏幕取词
文本
语音
转换
在线阅读
下载PDF
职称材料
题名
TTS在车载乘客信息系统中的应用
1
作者
汤俊芹
机构
北京奥特维科技有限公司
出处
《电声技术》
2024年第1期25-28,共4页
文摘
随着从文本到语音(Text To Speech,TTS)技术的发展,其语音效果已经可以达到真人播报效果。基于此,提出将TTS技术应用到车载乘客信息系统中,改变传统预录语音文件报站的方式,极大地提高语音播报的灵活性和可维护性。
关键词
从
文本到
语音
(
tts
)
乘客信息系统
语音
质量
Keywords
Text To Speech(
tts
)
passenger information system
speech quality
分类号
TN912.2 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
一种用于语音转换的区域最近邻迭代训练算法
被引量:
1
2
作者
简志华
王向文
机构
杭州电子科技大学通信工程学院
出处
《电子与信息学报》
EI
CSCD
北大核心
2012年第9期2091-2096,共6页
基金
浙江省教育厅科研项目(Y201016542)
浙江省自然科学基金项目(Y1101040)资助课题
文摘
针对非对称语音库情况下的语音转换,该文提出一种新的改进的语音转换训练算法ILNCA。与原有的训练算法INCA不一样的是,ILNCA首先利用高斯混合模型(GMM)分别对源、目标语音特征参数空间进行分类。然后根据Kullback–Leibler(KL)距离最小原则对源、目标GMM模型的子空间进行匹配,最后利用最近邻准则在相对应的子空间中进行源、目标语音特征参数矢量的对齐。客观测试和主观听觉实验都表明由于该文算法采用了更加精确的矢量对齐方法,能取得比INCA算法更优异的转换性能。
关键词
语音
转换
与
文本
无关
最近邻准则
迭代训练
Keywords
Voice conversion
Text independent
Nearest neighbor
Iterative training
分类号
TN911.23 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
融合句嵌入的VAACGAN多对多语音转换
被引量:
1
3
作者
李燕萍
曹盼
石杨
张燕
机构
南京邮电大学通信与信息工程学院
金陵科技学院软件工程学院
出处
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2021年第3期500-508,共9页
基金
国家自然科学基金(61401227,61872199,61872424)
金陵科技学院智能人机交互科技创新团队建设专项(218/010119200113)。
文摘
针对非平行文本条件下语音转换质量不理想、说话人个性相似度不高的问题,提出一种融合句嵌入的变分自编码辅助分类器生成对抗网络(VAACGAN)语音转换方法,在非平行文本条件下,有效实现了高质量的多对多语音转换。辅助分类器生成对抗网络的鉴别器中包含辅助解码器网络,能够在预测频谱特征真假的同时输出训练数据所属的说话人类别,使得生成对抗网络的训练更为稳定且加快其收敛速度。通过训练文本编码器获得句嵌入,将其作为一种语义内容约束融合到模型中,利用句嵌入包含的语义信息增强隐变量表征语音内容的能力,解决隐变量存在的过度正则化效应的问题,有效改善语音合成质量。实验结果表明:所提方法的转换语音平均MCD值较基准模型降低6.67%,平均MOS值提升8.33%,平均ABX值提升11.56%,证明该方法在语音音质和说话人个性相似度方面均有显著提升,实现了高质量的语音转换。
关键词
语音
转换
句嵌入
文本
编码器
辅助分类器生成对抗网络(ACGAN)
变分自编码器
非平行
文本
多对多
Keywords
voice conversion
sentence embedding
text-encoder
Auxiliary Classifier Generative Adversarial Network(ACGAN)
variational autoencoder
non-parallel corpora
many-to-many
分类号
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
一个基于规则的英语TTS系统
4
作者
张连海
吴保民
机构
信息工程大学信息工程学院
出处
《信息工程大学学报》
2005年第4期40-42,46,共4页
文摘
文章给出了一个基于规则的英语TTS(Text-To-Speech)系统的设计与实现方法。系统以音素作为合成基元,建立音素字典,使用基于规则的文本分析算法将输入英语句子转换成音素序列,使用基音同步叠接相加(PSOLA)算法合成语音。仿真结果表明,合成语音清晰可懂。
关键词
英语
文本
语音
转换
基于规则
文本
分析
基音同步叠接相加
Keywords
English
tts
rule-based
text analysis
PSOLA
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于PSOLA算法的单片机TTS系统的研究及实现
5
作者
张涌
徐宏炳
机构
东南大学计算机科学与工程系
出处
《电子工程师》
2002年第2期1-3,8,共4页
文摘
为了在单片机系统中实现 PSOLA算法 ,对 PSOLA算法的支持库进行了简化 。
关键词
PSOLA算法
文语
转换
小波变换
矢量量化
单片机
tts
系统
语音
合成
Keywords
Pitch Synchronous Over Lap Add,Text To Speech, wavelet transform, vector quantization, chip microcomputer
分类号
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
汉语语音视位的研究
被引量:
10
6
作者
王志明
蔡莲红
机构
清华大学计算机系
出处
《应用声学》
CSCD
北大核心
2002年第3期29-34,共6页
基金
国家教育部高等学校博士学科点专项科研基金资助项目(20010003049)
文摘
MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从AVI文件中自动抽取出这些基本视位图像,从MPEG-4所规定的68个面部动画参数(FAP)中提取出28个来描述这些口形,并实现了部分FAP参数的自动测量。最后,我们给出一个视位研究应用的实例。
关键词
汉语
语音
视位
文本
-
语音
转换
系统
文本
-可视
语音
转换
系统
静态视位
MPEG-4
语音
识别
Keywords
Viseme, Facial animation parameter, Text-to-speech, Text-to-visual speech
分类号
TN912.34 [电子电信—通信与信息系统]
TN919.81 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
语音合成技术在声音修复上的尝试
被引量:
2
7
作者
王峥
机构
中国电影资料馆
出处
《现代电影技术》
2019年第7期46-50,共5页
文摘
为满足对影片声音修复的需要,解决目前面临的一些具体问题,本文对音频修复技术中文本转换为自然语音的技术方法进行了探讨,介绍了TTS以及Tacotron2方法,并提出了结合两种技术进行声音修复的尝试方法。
关键词
声音修复
文本
转换
为自然
语音
语音
合成
分类号
J945 [艺术—电影电视艺术]
在线阅读
下载PDF
职称材料
题名
IC卡电子语音书
8
作者
杨振野
佘丙涛
朱仁才
赖强
机构
广东技术师范学院电子信息工程系
广州天圣科技有限公司
出处
《电子技术应用》
北大核心
2003年第3期73-74,80,共3页
文摘
基于ISD单片语音录放集成电路和大容量IC卡,给出了IC卡电子语音书的设计方法。这种电子语音书具有体积小、重量轻、用电省和成本低的特点。
关键词
电子
语音
书
IC卡
语音
录放
文本
转换
ISD
单片机
分类号
TN492 [电子电信—微电子学与固体电子学]
TN912.2 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
农产品质量语音查询系统的设计
9
作者
梁宇恩
付祥
机构
浙江机电职业技术学院计算机工程学院
出处
《数字技术与应用》
2011年第3期62-63,共2页
文摘
根据农产品售后服务的需要,本文利用数据库和文本语音转换技术开发了一套农产品质量语音查询系统。系统结构合理,工作稳定,响应速度快。
关键词
文本
语音
转换
多线程
有限状态机
Keywords
text-to-speech
multi thread
finite state machine
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
人工智能音色转换模型可有效服务和促进电影创作生产
被引量:
4
10
作者
王薇娜(整理撰写)
机构
中国电影科学技术研究所(中央宣传部电影技术质量检测所)
出处
《现代电影技术》
2023年第12期58-59,共2页
文摘
迄今,人工智能(AI)技术已广泛应用于电影声音生成和制作领域,可精准模仿特定演员的声音、语调和语速,以实现高度逼真的语音合成和自动配音,尤其适用于处理语言障碍或需要重新配音的情况;AI还可根据特定文本生成自然流畅的语音,用于电影旁白、解说或虚拟角色对话。但在实际应用过程中,AI生成的人声质量参差不齐,易出现音色模仿不够精准等问题,其主要原因在于音色转换质量。当前其他相关领域中AI音色转换技术的创新应用可借鉴于电影制作中,以有效改善AI生成的人声质量。
关键词
自然流畅
语音
合成
虚拟角色
转换
模型
电影制作
电影创作
电影声音
文本
生成
分类号
J933 [艺术—电影电视艺术]
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
韵律增强型汉语语音合成系统
11
作者
牛芳
吾守尔·斯拉木
机构
新疆大学信息科学与工程学院
新疆多语种信息技术实验室
新疆多语种信息技术研究中心
出处
《现代电子技术》
2022年第13期87-92,共6页
基金
国家自然科学基金资助项目:维吾尔语汉语语音翻译系统关键技术研究(U1603262)
文摘
端到端语音合成(TTS)系统可以直接根据给定的字素或音素序列生成语音。当前主流的端到端语音合成系统可以为英语生成近似于人类声音的语音。然而,中文的文本不同于这类以罗马字母为基础的语言(如英语),直接将端到端语音合成框架应用于汉语时,合成音频存在较为严重的韵律问题,如断句或停顿不恰当、自然度差等。为此,结合汉语的语言特性和韵律特性,提出一种神经网络端到端韵律增强型汉语语音合成系统,该系统使用从预训练Bert模型中提取的多层次上下文特征增强端到端汉语语音合成系统的输入。在汉语语音合成公开数据集上的实验结果表明,与当前主流的端到端语音合成系统相比,该韵律增强型汉语语音合成系统可以生成更加自然且富有表现力的语音。
关键词
文语
转换
语音
合成
汉语
韵律增强
Bert模型
tts
Keywords
text⁃to⁃speech
speech synthesis
mandarin
prosody enhancement
Bert model
tts
分类号
TN912.33-34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
浅析智能电视语音中控解决方案
12
作者
刁艳侠
机构
康佳集团
出处
《电子产品世界》
2022年第10期28-31,共4页
文摘
我们正处在以智能制造为主导的第四次工业革命的浪潮中,随着人工智能、信息技术、生物技术等新兴技术的兴起,制造业进入到了全面智能化转型时期。如何让机器设备变得更加智能,为人类提供更舒适便捷的服务,就成为人们不断探索的课题。语言交流是人与人沟通的基础,自然而然地,智能语音就成为人与机器交互的一个重要载体。在智能电视领域,随着技术升级和应用场景的不断拓展,智能语音已经成为智能电视的核心能力之一,在人机交互中占据了越来越重要的地位。为了提升语音整体性能及业务能力,各大厂家不再满足于第三方语音技术方案提供的整套服务,开始加大对智能语音全链路的研发投入,以便对语音功能有更多优化和选择的空间。而在智能语音的整个链路中,云端控制和决策能力又是至关重要的一环,所以搭建私有化中控平台,成为各大厂家优先选择的方案。
关键词
智能
语音
中控平台
自动
语音
识别
自然语言理解
文本
转换
分类号
TN949.2 [电子电信—信号与信息处理]
在线阅读
下载PDF
职称材料
题名
基于实时交互数字人技术的融合智能终端设计与实现
13
作者
王丁
刘阳桢
陈嘉
机构
深圳广播电影电视集团
出处
《广播与电视技术》
2024年第9期24-27,共4页
文摘
本文重点介绍深圳广播电影电视集团推出的“机器人雇员智能终端”项目,该项目运用互动数字人、语音智能引导、VR技术和沉浸式体验等概念,将语音识别、自然语言处理、文本到语音转换技术以及广电虚拟主持人、裸眼3D成像技术同智能终端进行深度融合,可以提升政务服务的智能化水平,为智慧城市建设提供新思路和实践路径。
关键词
实时交互数字人
广电虚拟主持人
语音
识别
自然语言处理
文本到
语音
转换
智能终端
Keywords
Real-time interactive digital human
Broadcasting virtual host
Speech recognition
Natural language processing
Text-to-speech translation
Intelligent terminal
分类号
TP37 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于Web的英语自助学习系统设计
被引量:
4
14
作者
张红斌
李广丽
机构
华东交通大学软件学院
华东交通大学信息工程学院
出处
《华东交通大学学报》
2010年第1期52-57,共6页
基金
江西省教育厅科学技术项目(2006[177])
华东交通大学科学技术研究项目(08XX05)
文摘
分析了基于Web的英语自助学习系统的工作原理,选择Microsoft Speech SDK5.1并在其基础之上封装WebVoiceCtl作为构建系统的核心技术。调用Text To Speech Engine完成文本语音转换,实现基于Web的英语听力测试。此外,通过Web-VoiceCtl控件调用Speech Recognition Engine完成语音识别,实现基于Web的英语口语测试。最后,在ASP.NET环境下实现英语自助学习软件系统,该软件可提供基于Web的英语听、说、写等技能训练。
关键词
英语自助学习系统
文本
语音
转换
语音
识别
MICROSOFT
SPEECH
SDK
WebVoiceCtl
Keywords
English self-study system
text to speech
speech recognition
Microsoft Speech SDK
WebVoiceCtl
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于CT技术搭建教务成绩查询热线
被引量:
1
15
作者
谭保华
吴坚
曾玲
机构
湖北工业大学理学院
湖北工业大学计算机工程学院
出处
《信息技术》
2005年第9期146-148,共3页
基金
湖北省教育厅重大科研项目基金(编号2003Z002)
湖北省自然科学基金(编号2003ABA054)
湖北省科技厅攻关项目基金(编号2003AA101C06)
文摘
以“湖北工业大学教务成绩查询热线”服务系统的设计为实例,讨论了呼叫应答中心服务系统,并与单纯基于互联网的客户服务进行了比较。着重从系统的设计思路、系统软硬件、系统功能模块,及系统运行和管理等方面进行了深入阐述。
关键词
呼叫中心
计算机电话技术(CTI)
交互式
语音
应答(IVR)
文语
转换
技术(
tts
)
Keywords
call center
CTI ( Computer Telephone Integration)
IVR ( Interactive Voice Response)
TIS(Text To Speech)
分类号
TN916.7 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于EML语言的电话选举系统
16
作者
宫湘琦
机构
郑州电缆有限公司
出处
《信息通信》
2013年第6期123-124,共2页
文摘
该系统采用了以下技术:自动语音识别技术(ASR),文本到语音转换技术(TTS)和互联网协议(IP)。选民使用的电话连接到传统的公共交换电话网(PSTN)或移动网络。系统使用语音自动识别引擎收集到选民的语音信息,并将语音转换成文本,再转换成选举标记语言(EML)格式的文本输出给电子选举系统;选举系统生成的EML格式的文本反馈信息通过使用文本转换语音(TTS)引擎和话筒传达给选民。
关键词
选举标记语言EML
网上投票系统
自动
语音
识别系统ASR
文本到语音转换tts
语音
投票
分类号
TN916.2 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
华为Voice Internet业务——带给您全新的感受
17
机构
华为技术有限公司
出处
《有线电视技术》
2003年第5期101-101,94,共2页
文摘
随着现代通讯的高速发展,人们对信息的需求也与日俱增.然而在Internet网络成为最为普通的信息载体的今天,调查却显示出在众多国内电话用户中,不懂或不熟悉键盘操作的用户占有4/5,那如何利用人类最为原始的听说方式来获取互连网上的信息呢?与此同时,电信运营商有大量的空闲电话网络,那如何利用闲置资源来提升话务量和服务质量?另外,互联网上有大量的闲置信息,网站如何赚钱?另一方面,广大用户想随时随地获得想要的信息,如何满足用户即时上网的需求呢?这些都成为现代通讯市场急需解决的问题.
关键词
VoiceInternet业务
华为公司
电话网
语音
互联网
自动
语音
识别
文本
语音
转换
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
水情报汛助手的设计及实现
18
作者
贺旭东
机构
河南省信阳水文水资源勘测局
出处
《治淮》
2011年第4期30-31,共2页
文摘
水情值班人员在检查各水文测站拍发的水情报文时,经常需要查询各测站相关实时水情信息。水情报汛助手将人工和遥测水情数据库结合起来,为用户提供屏幕取词查询、语音播报等服务,以减少水情值班人员的工作量,提高水情报汛工作效率。本文将介绍水情报汛助手的设计及其Visual C++实现。
关键词
水情信息
水情报汛
屏幕取词
文本
语音
转换
分类号
TV124 [水利工程—水文学及水资源]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
TTS在车载乘客信息系统中的应用
汤俊芹
《电声技术》
2024
0
在线阅读
下载PDF
职称材料
2
一种用于语音转换的区域最近邻迭代训练算法
简志华
王向文
《电子与信息学报》
EI
CSCD
北大核心
2012
1
在线阅读
下载PDF
职称材料
3
融合句嵌入的VAACGAN多对多语音转换
李燕萍
曹盼
石杨
张燕
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2021
1
在线阅读
下载PDF
职称材料
4
一个基于规则的英语TTS系统
张连海
吴保民
《信息工程大学学报》
2005
0
在线阅读
下载PDF
职称材料
5
基于PSOLA算法的单片机TTS系统的研究及实现
张涌
徐宏炳
《电子工程师》
2002
0
在线阅读
下载PDF
职称材料
6
汉语语音视位的研究
王志明
蔡莲红
《应用声学》
CSCD
北大核心
2002
10
在线阅读
下载PDF
职称材料
7
语音合成技术在声音修复上的尝试
王峥
《现代电影技术》
2019
2
在线阅读
下载PDF
职称材料
8
IC卡电子语音书
杨振野
佘丙涛
朱仁才
赖强
《电子技术应用》
北大核心
2003
0
在线阅读
下载PDF
职称材料
9
农产品质量语音查询系统的设计
梁宇恩
付祥
《数字技术与应用》
2011
0
在线阅读
下载PDF
职称材料
10
人工智能音色转换模型可有效服务和促进电影创作生产
王薇娜(整理撰写)
《现代电影技术》
2023
4
在线阅读
下载PDF
职称材料
11
韵律增强型汉语语音合成系统
牛芳
吾守尔·斯拉木
《现代电子技术》
2022
0
在线阅读
下载PDF
职称材料
12
浅析智能电视语音中控解决方案
刁艳侠
《电子产品世界》
2022
0
在线阅读
下载PDF
职称材料
13
基于实时交互数字人技术的融合智能终端设计与实现
王丁
刘阳桢
陈嘉
《广播与电视技术》
2024
0
在线阅读
下载PDF
职称材料
14
基于Web的英语自助学习系统设计
张红斌
李广丽
《华东交通大学学报》
2010
4
在线阅读
下载PDF
职称材料
15
基于CT技术搭建教务成绩查询热线
谭保华
吴坚
曾玲
《信息技术》
2005
1
在线阅读
下载PDF
职称材料
16
基于EML语言的电话选举系统
宫湘琦
《信息通信》
2013
0
在线阅读
下载PDF
职称材料
17
华为Voice Internet业务——带给您全新的感受
《有线电视技术》
2003
0
在线阅读
下载PDF
职称材料
18
水情报汛助手的设计及实现
贺旭东
《治淮》
2011
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部