-
题名基于平行全维动态注意力机制的视觉地点识别方法
- 1
-
-
作者
刘沛津
刘淑婕
何林
彭莉峻
付雪峰
-
机构
西安建筑科技大学机电工程学院
西安建筑科技大学理学院
-
出处
《液晶与显示》
CAS
CSCD
北大核心
2024年第9期1233-1242,共10页
-
基金
陕西省重点研发计划(No.2022GY-134)
陕西省教育厅专项科研项目(No.21JK0732)
西安建筑科技大学自然科学专项(No.ZR19058)。
-
文摘
针对天气、季节、光线等环境变化导致的视觉地点识别鲁棒性低的问题,提出了一种提升视觉地点识别特征描述子环境稳健性的多维度注意力机制——平行全维动态注意力机制(POD-Attention)。为实现卷积核在全维度上的动态精细探索,增强特征提取网络对建筑物等不变性特征的提取与学习能力,采用全维动态卷积块在卷积核全维度(输入输出通道、卷积空间和卷积核数量)上添加互补性注意力。将1×1卷积、Skip Squeeze-and-Excitation(SSE)模块与全维动态卷积块平行融合,不仅有效提高了特征提取速率,还扩大了视觉地点识别网络的感受野,进一步提升了视觉地点的识别准确率。在公开数据集上进行的实验表明,基于VGG16及Patch-NetVLAD特征聚合的视觉地点识别方法经POD注意力机制改进后,在Nordland与Mapillary Street-Level Sequences数据集上的Recall@1指标提升了9.7%与1.8%,充分证明了本文POD注意力机制对于网络性能的提升效果,也证明了基于本文POD注意力机制的视觉地点识别方法的有效性。
-
关键词
视觉地点识别
环境鲁棒性
深度学习
平行全维动态注意力机制
平行策略
-
Keywords
visual place recognition
environmental robustness
deep learning
parallel omni-dimensional dynamic attention
parallel strategy
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名动态多阶段强波动型表情识别模型
被引量:2
- 2
-
-
作者
欧阳勇
陈凌钰
曾雅文
万俊
王春枝
-
机构
湖北工业大学计算机学院
深圳大学计算机与软件学院
-
出处
《计算机工程与设计》
北大核心
2021年第10期2970-2978,共9页
-
基金
国家自然科学基金面上基金项目(61772180)
全国大学生创新创业训练计划基金项目(201910500010)。
-
文摘
考虑到问卷调查顾客的满意度评价时存在样本获取困难、主观误差等问题,利用表情识别技术分析视频中顾客的情感表达,但实际应用存在人物表情变化波动过大的强波动型表情识别问题。为更好地挖掘强波动型表情变化的信息,提出一种动态多阶段强波动型表情识别模型(LNsCo),该模型包括长期情绪波动状态生成器(LEF)、近短期表情特征生成器(NsSE)、平行共同注意力网络(co-attention network)。将图像序列预处理后,分别送到LEF和NsSE提取表情的隐藏特征,利用共同注意网络生成二者相互依赖的表征,用分类器进行表情分类。在公共数据集和真实应用场景下的结果表明,所述方法具有良好的性能。
-
关键词
强波动型表情识别
长期情绪波动状态生成器
近短期表情特征生成器
平行共同注意力网络
双向长短期记忆网络
-
Keywords
dynamic expression recognition
LEF
NsSE
parallel co-attention network
BiLSTM
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-