期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于空间注意力推理机制的视觉问答算法研究 被引量:1
1
作者 李智涛 周之平 叶琴 《计算机应用研究》 CSCD 北大核心 2021年第3期952-955,共4页
针对现有基于注意力机制的多模态学习,对文字上下文之间的自我联系和图像目标区域的空间位置关系进行了深入研究。在分析现有注意力网络的基础上,提出使用自注意力模块(self-attention,SA)和空间推理注意力模块(spatial reasoning atten... 针对现有基于注意力机制的多模态学习,对文字上下文之间的自我联系和图像目标区域的空间位置关系进行了深入研究。在分析现有注意力网络的基础上,提出使用自注意力模块(self-attention,SA)和空间推理注意力模块(spatial reasoning attention,SRA)对文本信息和图像目标进行映射,最终得到融合特征输出。相较于其他注意力机制,SA和SRA可以更好地将文本信息匹配图像目标区域。模型在VQAv2数据集上进行训练和验证,并在VQAv2数据集上达到了64.01%的准确率。 展开更多
关键词 视觉问答 注意力机制 多模态学习 注意力 空间推理注意力
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部