-
题名基于发音轨迹的可视语音合成
被引量:1
- 1
-
-
作者
郑红娜
白静
王岚
朱云
-
机构
太原理工大学信息工程学院山西太原
中国科学院深圳先进技术研究院广东深圳
-
出处
《计算机应用与软件》
CSCD
北大核心
2013年第6期253-257,261,共6页
-
文摘
着眼于语音可视化。为呈现真实说话人各发音器官的运动,提出一种改进的CM协同发音模型,并采用该方法合成汉字的发音轨迹,进而以此驱动和控制虚拟3D音视频说话人头模型,直观呈现通常可见及不可见发音器官的发音运动。实验证明:由改进方法获得的合成发音轨迹更逼近真实发音轨迹。同时,为了定量比较舌读和唇读在语音感知和识别中的作用,设计三组感知实验,实验结果显示:叠加了唇读信息的感知识别率较单纯的加噪语音的识别率提高了25.8%;而叠加了舌读信息的识别率较单纯听觉信息的识别率提高了26.7%。因此,当语音恶化时,舌读信息可提供大于唇读信息的补充作用,且舌读信息与唇读信息一样具有识别力。
-
关键词
语音可视化
CM协同发音模型
改进的CM协同发音模型
舌读
唇读
-
Keywords
Speech visualisation
CM co-articulation model
Modified
CM co-articulation model
Tongue reading
Lip reading
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名汉语语音同步的三维口型动画研究
被引量:3
- 2
-
-
作者
米辉辉
侯进
李克豹
甘凌云
-
机构
西南交通大学信息科学与技术学院
南京大学计算机软件新技术国家重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第4期1244-1247,共4页
-
基金
国家自然科学基金面上项目(61371165)
浙江大学CAD&CG国家重点实验室开放课题(A1416)
+1 种基金
计算机软件新技术国家重点实验室开放课题基金资助项目(KFKT2013B22)
四川省动漫研究中心2012年度科研项目(DM201204)
-
文摘
针对汉语的发音习惯以及语音可视化技术中对口型动画自然、连续的要求,提出了一种基于肌肉模型与协同发音模型的与语音保持同步的口型动画的方法。首先,根据汉语发音时的口型视位特征将声、韵母音素归类,并用数据映射的方式合成与之对应的口型关键帧。通过分析输入的文本信息,合成与语音保持同步的三维人脸口型动画。为了解决汉语发音习惯的问题,设计了一种基于微分几何学描述的协同发音建模的方法,该方法通过分析相邻音子间视素的影响权重,可以产生符合汉语发音习惯的口型动画。最后,通过实验对比和分析,该方法产生的口型动画更为逼真,且符合汉语发音的习惯。
-
关键词
语音可视化
协同发音模型
口型动画
语音动画
-
Keywords
speech visualization
coarticulation model
lip animation
speech animation
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-