期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
融合音频内容、风格和情感特征的人脸动画生成方法
1
作者 张欣茹 朱欣娟 高全力 《计算机应用研究》 北大核心 2025年第2期636-640,共5页
现有的音频驱动人脸动画技术主要注重唇部运动与音频的同步性,忽略了对人物面部表情或头部运动的再现能力。为此,提出了一种融合音频内容、风格和情感特征的高质量人脸动画生成方法(ACSEF)。首先,设计了情感动画模块(EAM),从音频中提取... 现有的音频驱动人脸动画技术主要注重唇部运动与音频的同步性,忽略了对人物面部表情或头部运动的再现能力。为此,提出了一种融合音频内容、风格和情感特征的高质量人脸动画生成方法(ACSEF)。首先,设计了情感动画模块(EAM),从音频中提取隐含的情感辅助特征来估计更加准确的面部情感标志位移,然后与语音内容和说话者风格动画的面部地标位移进行融合,提高landmarks(面部地标)预测的准确性和生动性。其次,设计了一个基于U-Net模型的注意力增强解码器(AADU),使得估计的地标与图像最终解码为逼真的包含唇音同步、头部运动和面部表情的理想视频帧。实验表明,该方法既能增强面部情感表达,又可使图像更加清晰,效果优于对比基线模型。 展开更多
关键词 音频驱动 人脸动画 情感动画模块 注意力增强解码器
在线阅读 下载PDF
状态与杂波相关的GM-PHD平滑滤波 被引量:2
2
作者 陈金广 王星辉 马丽丽 《计算机工程与设计》 北大核心 2019年第11期3186-3191,共6页
考虑到多目标跟踪中杂波与状态之间的相关性,引入平滑算法提高目标估计的精度。针对整个监视区域内的杂波,重新计算其强度;将目标分为幸存目标和新生目标两大类,采用自适应椭球门限对量测进行预处理,将门限内的量测用于更新幸存目标,门... 考虑到多目标跟踪中杂波与状态之间的相关性,引入平滑算法提高目标估计的精度。针对整个监视区域内的杂波,重新计算其强度;将目标分为幸存目标和新生目标两大类,采用自适应椭球门限对量测进行预处理,将门限内的量测用于更新幸存目标,门限外的量测用于更新新生目标;采用RTS平滑算法进行逆向平滑。实验结果表明,在该条件下所提算法具有较好的跟踪性能,优于未平滑的GM-PHD滤波器。 展开更多
关键词 多目标跟踪 RTS平滑 概率假设密度滤波 状态相关杂波 自适应椭球门限
在线阅读 下载PDF
基于自然语言生成的协同制造企业图表数据分析方法 被引量:1
3
作者 陈亮 赵康廷 刘昌宏 《计算机集成制造系统》 EI CSCD 北大核心 2023年第3期910-919,共10页
为充分利用协同制造企业在生产过程中的非结构化图表数据,提出一种基于自然语言生成的图表数据分析方法。首先使用光学字符识别技术和关键点检测网络对图表中的文本信息和数据信息进行识别和提取;随后将用户需求作为输入,通过自然语言... 为充分利用协同制造企业在生产过程中的非结构化图表数据,提出一种基于自然语言生成的图表数据分析方法。首先使用光学字符识别技术和关键点检测网络对图表中的文本信息和数据信息进行识别和提取;随后将用户需求作为输入,通过自然语言生成模型输出相应的图表文本描述,使其可以根据用户不同的意图,生成智能和准确的图表分析结果。该方法图表提取的精度为88.6%,文本描述的评估得分为86.4%。通过在企业的应用案例和相关调研也表明该方法能够根据用户需求对不同类型的图表进行准确的分析。 展开更多
关键词 数据分析 深度学习 图表数据 自然语言生成
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部