-
题名融合音频内容、风格和情感特征的人脸动画生成方法
- 1
-
-
作者
张欣茹
朱欣娟
高全力
-
机构
西安工程大学计算机科学学院
西安工程大学陕西省服装设计智能化重点实验室
西安工程大学新型网络智能信息服务国家地方联合工程研究中心
-
出处
《计算机应用研究》
北大核心
2025年第2期636-640,共5页
-
基金
陕西省重点研发计划资助项目(2024GX-YBXM-548)。
-
文摘
现有的音频驱动人脸动画技术主要注重唇部运动与音频的同步性,忽略了对人物面部表情或头部运动的再现能力。为此,提出了一种融合音频内容、风格和情感特征的高质量人脸动画生成方法(ACSEF)。首先,设计了情感动画模块(EAM),从音频中提取隐含的情感辅助特征来估计更加准确的面部情感标志位移,然后与语音内容和说话者风格动画的面部地标位移进行融合,提高landmarks(面部地标)预测的准确性和生动性。其次,设计了一个基于U-Net模型的注意力增强解码器(AADU),使得估计的地标与图像最终解码为逼真的包含唇音同步、头部运动和面部表情的理想视频帧。实验表明,该方法既能增强面部情感表达,又可使图像更加清晰,效果优于对比基线模型。
-
关键词
音频驱动
人脸动画
情感动画模块
注意力增强解码器
-
Keywords
audio driver
facial animation
emotional animation module
attention-augmented decoder
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名状态与杂波相关的GM-PHD平滑滤波
被引量:2
- 2
-
-
作者
陈金广
王星辉
马丽丽
-
机构
西安工程大学计算机科学学院
西安工程大学陕西省服装设计智能化重点实验室
西安工程大学新型网络智能信息服务国家地方联合工程研究中心
-
出处
《计算机工程与设计》
北大核心
2019年第11期3186-3191,共6页
-
基金
陕西省教育厅科研计划基金项目(18JK0349)
西安工程大学研究生创新基金项目(chx201813)
-
文摘
考虑到多目标跟踪中杂波与状态之间的相关性,引入平滑算法提高目标估计的精度。针对整个监视区域内的杂波,重新计算其强度;将目标分为幸存目标和新生目标两大类,采用自适应椭球门限对量测进行预处理,将门限内的量测用于更新幸存目标,门限外的量测用于更新新生目标;采用RTS平滑算法进行逆向平滑。实验结果表明,在该条件下所提算法具有较好的跟踪性能,优于未平滑的GM-PHD滤波器。
-
关键词
多目标跟踪
RTS平滑
概率假设密度滤波
状态相关杂波
自适应椭球门限
-
Keywords
multi-target tracking
RTS smoother
probability hypothesis density filter
state-dependent clutter
adaptive ellipsoid gate
-
分类号
TP931
[自动化与计算机技术]
-
-
题名基于自然语言生成的协同制造企业图表数据分析方法
被引量:1
- 3
-
-
作者
陈亮
赵康廷
刘昌宏
-
机构
西安工程大学计算机科学学院
西安工程大学陕西省服装设计智能化重点实验室
重庆中烟工业有限责任公司黔江卷烟厂
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2023年第3期910-919,共10页
-
基金
国家自然科学基金资助项目(51675158)
陕西省教育厅重点科学研究计划资助项目(22JS021)。
-
文摘
为充分利用协同制造企业在生产过程中的非结构化图表数据,提出一种基于自然语言生成的图表数据分析方法。首先使用光学字符识别技术和关键点检测网络对图表中的文本信息和数据信息进行识别和提取;随后将用户需求作为输入,通过自然语言生成模型输出相应的图表文本描述,使其可以根据用户不同的意图,生成智能和准确的图表分析结果。该方法图表提取的精度为88.6%,文本描述的评估得分为86.4%。通过在企业的应用案例和相关调研也表明该方法能够根据用户需求对不同类型的图表进行准确的分析。
-
关键词
数据分析
深度学习
图表数据
自然语言生成
-
Keywords
data analysis
deep learning
chart data
natural language generation
-
分类号
TP391.7
[自动化与计算机技术—计算机应用技术]
-