-
题名基于数据驱动方法的汉语文本-可视语音合成(英文)
被引量:16
- 1
-
-
作者
王志明
蔡莲红
艾海舟
-
机构
北京科技大学计算机科学与技术系
清华大学计算机科学与技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2005年第6期1054-1063,共10页
-
基金
国家教育部博士点基金
北京科技大学校内科研基金~~
-
文摘
计算机文本-可视语音合成系统(TTVS)可以增强语音的可懂度,并使人机交互界面变得更为友好.给出一个基于数据驱动方法(基于样本方法)的汉语文本-可视语音合成系统,通过将小段视频拼接生成新的可视语音.给出一种构造汉语声韵母视觉混淆树的有效方法,并提出了一个基于视觉混淆树和硬度因子的协同发音模型,模型可用于分析阶段的语料库选取和合成阶段的基元选取.对于拼接边界处两帧图像的明显差别,采用图像变形技术进行平滑并.结合已有的文本-语音合成系统(TTS),实现了一个中文文本-视觉语音合成系统.
-
关键词
文-语转换系统(TTS)
文本-可视语音合成系统(TTVS)
视位
协同发音
-
Keywords
Human computer interaction
Image processing
Pattern recognition
Speech
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名文本-视觉语音合成综述
被引量:5
- 2
-
-
作者
王志明
陶建华
-
机构
北京科技大学计算机科学与技术系
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第1期145-152,共8页
-
基金
北京科技大学校科研基金项目(20040509190)
中国科学院自动化研究所模式识别国家重点实验室开放课题基金项目
-
文摘
视觉信息对于理解语音的内容非常重要·不只是听力有障碍的人,普通人在交谈过程中也存在着一定程度的唇读,尤其是在语音质量受损的噪声环境下·正如文语转换系统可以使计算机像人一样讲话,文本-视觉语音合成系统可以使计算机模拟人类语音的双模态性,让计算机界面变得更为友好·回顾了文本-视觉语音合成的发展·文本驱动的视觉语音合成的实现方法可以分为两类:基于参数控制的方法和基于数据驱动的方法·详细介绍了参数控制类中的几个关键问题和数据驱动类中的几种不同实现方法,比较了这两类方法的优缺点及不同的适用环境·
-
关键词
文本-视觉语音合成(TTVS)
视位
协同发音
人脸模型
人脸动画
-
Keywords
text-to-visual speech (TTVS)
viseme
co-articulation
face model
facial animation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于以太网的考试指令播报系统
- 3
-
-
作者
陈茜茹
钟清华
张涵
-
机构
华南师范大学物理与电信工程学院
-
出处
《实验室研究与探索》
CAS
北大核心
2019年第6期107-110,共4页
-
基金
国家自然科学基金项目(61471176)
广州市珠江科技新星专项(201610010199)
-
文摘
针对标准化考场建设的需要,设计了一种基于以太网的考试指令播报系统。系统由卫星时间接收装置、考务系统和多个考场终端共同组成。考务系统负责各个考场终端系统时间同步校准、发送考试指令、网络参数配置、升级下位机程序等远程网络化管理。考场终端以STM32F107嵌入式处理器为核心,包含以太网接口电路、LED点阵屏显示控制电路、文本语音合成电路等,通过以太网接收考务系统的各种指令并完成相应功能。考试期间的各种考试指令和考试时间由LED点阵屏显示文字信息并使用文本语音合成技术将其播放。系统经过学校期末考试、全国大学生英语等级等大型考试实际运行测试,切实有效,可靠性强,具有较强的推广价值。
-
关键词
以太网
考试指令
网络化管理
嵌入式处理器
LED点阵屏
文本语音合成
-
Keywords
Ethernet
examination instructions
network management
embedded processor
LED dot matrix screen
text to speech synthesis technology
-
分类号
TN911-34
[电子电信—通信与信息系统]
-