-
题名基于语音驱动的风格化数字人关键技术研究与应用示范
- 1
-
-
作者
郝洺
张翀
冯海亮
施玉海
-
机构
国家广播电视总局广播电视科学研究院
-
出处
《广播与电视技术》
2024年第10期20-23,共4页
-
基金
广科院2024基本科研项目《生成式人工智能应用于视频生成的安全评估技术研究》(24011401),2024年广科院实验室运行维护经费(240305)资助。
-
文摘
近年来,数字人技术的应用正逐渐成为推动媒体融合发展的重要力量。本文提出了一种基于语音驱动的风格化数字人技术框架,旨在为广电领域提供一种新的技术解决方案。该框架通过语音生成、唇形同步、面部风格化等AI技术生成数字人,在保留较高的人物形象真实性的同时降低了制作成本。通过在北京东城会馆的应用示范,验证了该技术在大屏应用中展现出广泛的适应性和可行性,为广电行业的内容创新和形式多样化提供了强有力的技术支持。
-
关键词
语音驱动
风格化
数字人
唇形同步
会馆
-
Keywords
Voice-driven
Stylized
Digital human
Lip synchronization
Assembly hall
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于共振峰分析的语音驱动人脸动画方法
被引量:1
- 2
-
-
作者
潘晋
杨卫英
-
机构
上海大学影视艺术技术学院
-
出处
《电声技术》
2009年第5期62-65,共4页
-
文摘
快速、高效地实现语音驱动下的唇形自动合成,以及优化语音与唇动的同步是语音驱动人脸动画的重点。提出了一种基于共振峰分析的语音驱动人脸动画的方法。对语音信号进行加窗分帧,DFT变换,再对短时音频信号的频谱进行第一、第二共振峰分析,将分析结果映射为一组控制序列,并对控制序列进行去奇异点等后处理。设定三维人脸模型的动态基本口形,以定时方式将控制序列导入模型,完成人脸动画驱动。实验结果表明,该方法简单快速,有效实现了语音和唇形的同步,动画效果连贯自然,可广泛用于各类虚拟角色的配音,缩短虚拟人物的制作周期。
-
关键词
语音驱动
共振峰分析
人脸动画
语音唇形同步
-
Keywords
speech driving
formants analysis
lip animation
speech-lip synchronization
-
分类号
TN912
[电子电信—通信与信息系统]
-