-
题名视觉-语言多模态下的多任务人脸年龄估计
- 1
-
-
作者
何江
池静
池佳稷
高松
-
机构
河北工程大学信息与电气工程学院
拉彭兰塔理工大学电气工程学院
邯郸市第三建筑工程有限公司
-
出处
《现代电子技术》
北大核心
2024年第14期171-176,共6页
-
基金
邯郸市科学技术研究与发展计划项目(21422031252)。
-
文摘
现有的年龄估计方法仅基于人脸图像,无法充分利用图像背后的语言背景信息。此外,这些方法通常专注于单一年龄估计任务的优化,忽略了相近任务带来的提高模型性能的信息。针对上述问题,提出一种基于视觉-语言多模态的多任务人脸年龄估计方法。该方法利用提示文本信息为年龄估计提供更丰富、更准确的图像理解和先验知识。同时,引入多任务学习方法,利用任务间的互补性将年龄分类任务与序数回归任务相结合,以获得更好的性能。最后,为了获得可靠的预测结果,研究了加权平均法和任务回归法两种多任务结果融合方法,并对加权平均法的权重系数进行了消融实验,以期找到一组合适的权重系数。结果表明:与其他先进方法相比,所提方法在UTK-FACE数据集上的平均绝对误差(MAE)降低了7.32%,在MorphⅡ数据集上的MAE降低了1.20%,累积分数(CS)提升了0.11%。
-
关键词
年龄估计
视觉-语言多模态
多任务学习
加权平均法
提示文本
任务回归器
-
Keywords
age estimation
visual-language multimodality
multitask learning
weighted average method
prompt text
task regressor
-
分类号
TN711-34
[电子电信—电路与系统]
TP391
[自动化与计算机技术—计算机应用技术]
-