-
题名基于FasterMDNet的视频目标跟踪算法
被引量:3
- 1
-
-
作者
王玲
王辉
王鹏
李岩芳
-
机构
长春理工大学计算机科学技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第14期123-130,共8页
-
基金
吉林省科技发展计划技术攻关项目(No.20190302118GX)。
-
文摘
多域卷积神经网络(MDNet)算法在卷积层采用选择性搜索的方式来提取候选框,因此它没有共享完整图像特征,从而导致在线视频目标跟踪速度慢。针对这个问题,提出一种快速多域卷积神经网络(FasterMDNet)视频目标跟踪算法。FasterMDNet是建立在MDNet基础上的一种模型,在卷积层后面引入RPN(Region Proposal Network)网络,优化了损失函数,共享完整图像卷积特征,加快候选区域建议框(ROI)更高效的生成;为了更好地获得目标和背景信息表示,在RPN网络后加入ROIAlign层,对提取的候选区域建议框特征图用双线性插值方法来提高感受野的分辨率。该算法对目标跟踪基准数据集OTB2013、OTB2015、VOT2016进行了评估,并与前沿的跟踪算法做对比,实验结果证明,该算法跟踪准确率优于其他对比方法,并且对比相同实验环境下MDNet算法,在线跟踪速度提高了近12倍。
-
关键词
多域卷积神经网络(mdnet)
快速多域卷积神经网络(Fastermdnet)
视频目标跟踪
区域建议网络(RPN)
候选区域建议框(ROI)
ROIAlign
-
Keywords
multi-domain convolutional neural network(mdnet)
Faster multi-domain convolutional neural network(Fastermdnet)
video target tracking
Region Proposal network(RPN)
Region of Interest(ROI)
ROIAlign
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于自注意力机制的多域卷积神经网络的视觉追踪
被引量:5
- 2
-
-
作者
李生武
张选德
-
机构
陕西科技大学电子信息与人工智能学院
-
出处
《计算机应用》
CSCD
北大核心
2020年第8期2219-2224,共6页
-
基金
国家自然科学基金资助项目(61871260)。
-
文摘
为了解决多域卷积神经网络(MDNet)在目标快速移动和外观剧烈变化时发生的模型漂移问题,提出了自注意力多域卷积神经网络(SAMDNet),通过引入自注意力机制从通道和空间两个维度来提升追踪网络的性能。首先,利用空间注意力模块将所有位置上的特征的加权总和选择性地聚合到特征图中的所有位置上,使得相似的特征彼此相关;然后,利用通道注意力模块整合所有特征图来选择性地强调互相关联的通道的重要性;最后,融合得到最终的特征图。此外,针对MDNet算法因训练数据中存在较多相似但属性不同的序列所造成的网络模型分类不准的问题,构造了复合损失函数。该复合损失函数由分类损失函数和实例判别损失函数组成,首先,用分类损失函数来统计分类的损失值;然后,利用实例判别损失函数来提高目标在当前视频序列中的权重,抑制其在其他序列中的权重;最后,融合两项损失作为模型的最终损失。在目前广泛采用的测试基准数据集OTB50和OTB2015上进行实验,结果表明所提出的算法在成功率指标上相比2015年视觉目标跟踪挑战(VOT2015)的冠军算法MDNet分别提高了1.6个百分点和1.4个百分点,在精确率和成功率指标上优于连续域卷积相关滤波(CCOT)算法,在OTB50上的精确率指标优于高效卷积操作(ECO)算法,验证了该算法的有效性。
-
关键词
多域卷积神经网络
视觉追踪
自注意力机制
实例判别损失
深度学习
-
Keywords
multi-domain convolutional neural network(mdnet)
visual tracking
self-attention mechanism
instance discriminant loss
deep learning
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-