期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于非局部注意力机制的在线多目标跟踪算法 被引量:1
1
作者 郑龙澍 林野 +1 位作者 翟鹏 张立华 《计算机应用与软件》 北大核心 2024年第2期178-187,共10页
针对多目标跟踪任务在人群拥挤场景存在目标漏检、遮挡等问题,在CenterTrack框架基础上引入非局部注意力机制以捕捉多个目标之间、目标与场景之间的非局部依赖关系,提出基于空间非局部注意力残差块的跟踪模型;并进一步扩展到时空域,建... 针对多目标跟踪任务在人群拥挤场景存在目标漏检、遮挡等问题,在CenterTrack框架基础上引入非局部注意力机制以捕捉多个目标之间、目标与场景之间的非局部依赖关系,提出基于空间非局部注意力残差块的跟踪模型;并进一步扩展到时空域,建立基于时空关系非局部注意力模块的跟踪模型,同时实现检测和跟踪任务。在MOT17、MOT16、2D MOT15三个数据集的实验结果表明,提出的两种在线跟踪模型较CenterTrack算法有明显提升,且在MOT17中MOTA(Multiple Object Tracking Accuracy)指标达到了目前较为先进的水平,为62.4%和62.5%,验证了该算法的有效性。 展开更多
关键词 多目标跟踪 计算机视觉 非局部注意力机制 深度学习
在线阅读 下载PDF
基于生成对抗网络和网络集成的面部表情识别方法EE-GAN 被引量:7
2
作者 杨鼎康 黄帅 +3 位作者 王顺利 翟鹏 李一丹 张立华 《计算机应用》 CSCD 北大核心 2022年第3期750-756,共7页
由于现实生活场景差异大,人类在不同场景中表现的情感也不尽相同,导致获取到的情感数据集标签分布不均衡;同时传统方法多采用模型预训练和特征工程来增强与表情相关特征的表示能力,但没有考虑不同特征表达之间的互补性,限制了模型的泛... 由于现实生活场景差异大,人类在不同场景中表现的情感也不尽相同,导致获取到的情感数据集标签分布不均衡;同时传统方法多采用模型预训练和特征工程来增强与表情相关特征的表示能力,但没有考虑不同特征表达之间的互补性,限制了模型的泛化性和鲁棒性。针对上述问题,提出了一种包含网络集成模型Ens-Net的端到端深度学习框架EE-GAN:一方面考虑了多个异质网络获得的不同深度和区域的特征,实现不同语义、不同层次的特征融合,并通过网络集成以提高模型的学习能力;另一方面,基于对抗生成网络生成具有特定表情标签的面部图像,在进行数据增强的同时,达到平衡表情标签数据分布的目的。在CK+、FER2013和JAFFE数据集上的定性和定量实验验证了所提方法的有效性:相较于局部保留投影方法(LPP)在内的基于视图学习的方法,EE-GAN面部表情识别的准确率最高,分别达到了82.1%、84.8%和91.5%;同时,和AlexNet、VGG、ResNet等传统卷积神经网络(CNN)模型相比,准确率最少提高了9个百分点。 展开更多
关键词 面部表情识别 生成对抗网络 网络集成 不均衡标签分布 特征融合
在线阅读 下载PDF
面向光束平差法的视觉SLAM并行计算架构与实现 被引量:3
3
作者 成祥 陈迟晓 +1 位作者 翟鹏 张立华 《小型微型计算机系统》 CSCD 北大核心 2022年第9期1931-1938,共8页
同步定位和建图(SLAM)是解决机器人探索未知环境的最基本的方法之一,它能够让机器人在无需预先获得场景定位基础结构的条件下便可以进行定位和避障.作为一个普遍而通用的解决方法,光束平差法被绝大多数的视觉SLAM算法的后端优化环节所采... 同步定位和建图(SLAM)是解决机器人探索未知环境的最基本的方法之一,它能够让机器人在无需预先获得场景定位基础结构的条件下便可以进行定位和避障.作为一个普遍而通用的解决方法,光束平差法被绝大多数的视觉SLAM算法的后端优化环节所采用,但实际应用中需要耗费大量的计算资源和时间.目前,视觉SLAM算法对算力要求越来越高,其中后端性能优化更是直接影响视觉SLAM算法的整个性能.本文提出一种基于FPGA的光束调整加速架构,该架构包括矩阵乘加加速器、舒尔补构造加速单元以及预处理共轭梯度求解器,能够有效地简化求解矩阵规模,以并行化方式加速求解后端优化方程.本文使用高层次综合来实现基于块的预处理共轭梯度加速器的并行化设计,比ARM计算平台提升了27.7倍的执行速度,节省了约95%的能耗,所提出的加速架构能灵活适用于采用各种视觉SLAM算法的光束平差法部分的运算. 展开更多
关键词 光束平差法 高层次综合 现场可编程门阵列 同步定位和建图
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部