基于多尺度感受野网络和注意力机制的场景识别方法研究被引量：1

Scene recognition via multi-scale receptive field network with attention mechanism

在线阅读下载PDF

导出

摘要场景识别在人机交互、内容检索、智能场景拍照等领域有着越来越强的应用需求。以往的识别方法大多采用多特征融合,比如对象特征、全局布局特征和上下文特征,来得到特征的多样性和互补性,但我们认为由于场景图像的拍摄距离、拍摄视角更具有多样性,导致场景识别相对于其他图像识别任务来说,对感受野的自适应性需求更强。传统的卷积神经网络每一层都是一个固定的感受野,导致感受野的变化不够灵活。在本文中,我们提出了一个多尺度感受野网络来改进网络的感受野,并加入了注意力机制来进一步提取更具有语义区分度的场景特征。最后,我们在三个标准的场景识别数据集上进行了充足的实验,结果表明我们提出的方法是有效的且具有良好的性能。 Scene recognition is ever more important in many computer vision applications such as human-computer interaction,content retrieval,and intelligent scene matching photography.Previous works mostly employ multi-feature fusion,such as object features,global layout information,and context features,to achieve the diversity and complementary of features.We consider that compared with other image recognition tasks,due to the diversity of shooting distance and shooting view,multi-scale receptive field is more helpful to enhance feature discriminative power for scene recognition.However,the traditional convolutional neural network has a fixed receptive field of each layer,the change of receptive field is not flexible enough.In this paper,we propose a Multi-Scale Receptive Field Network to effectively improve the receptive field in the network,and employ the attention mechanism to capture the discriminative regions and semantic features for scene recognition.Extensive experimental evaluation on three standard benchmarks demonstrates the efficacy of our approach compared to other state-of-the-art methods.

作者张能欢王永滨 ZHANG Neng-huan;WANG Yong-bin(Collaborative Innovation Center,Communication University of China,Beijing 100024,China;School of Computer Science,Communication University of China,Beijing 100024,China)

机构地区中国传媒大学协同创新中心中国传媒大学计算机与网络空间安全学院

出处《中国传媒大学学报（自然科学版）》 2020年第5期9-15,共7页 Journal of Communication University of China：Science and Technology

基金国家重点研发计划“融媒体技术支撑及服务模式研究”(2019YFB1406201)

关键词场景识别感受野多尺度注意力机制 scene recognition receptive field multi-scale attention mechanism

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

作者简介张能欢(1990-),女(汉族),安徽六安人,中国传媒大学博士研究生.E-mail:nhzhang@cuc.edu.cn

引文网络
相关文献

同被引文献14

1龚健雅,钟燕飞.光学遥感影像智能化处理研究进展[J].遥感学报,2016,20(5):733-747. 被引量：38
2张晓男,钟兴,朱瑞飞,高放,张作省,鲍松泽,李竺强.基于集成卷积神经网络的遥感影像场景分类[J].光学学报,2018,38(11):342-352. 被引量：27
3赵婵娟,周绍光,丁倩,刘丽丽.基于同质区和迁移学习的高光谱图像半监督分类[J].地理信息世界,2019,26(5):45-52. 被引量：1
4史旭东,熊伟丽.基于改进自训练算法的半监督GPR软测量建模[J].控制工程,2020,27(3):451-455. 被引量：5
5程康明,熊伟丽.一种自训练框架下的三优选半监督回归算法[J].智能系统学报,2020,15(3):568-577. 被引量：4
6龚循强,张方泽,鲁铁定,陈志高.基于中位数绝对偏差的异常训练样本探测方法[J].激光与光电子学进展,2020,57(23):165-170. 被引量：7
7贾霄,郭顺心,赵红.基于图像属性的零样本分类方法综述[J].南京大学学报（自然科学版）,2021,57(4):531-543. 被引量：3
8杨雨龙,郭田德,韩丛英.基于原型学习改进的伪标签半监督学习算法[J].中国科学院大学学报（中英文）,2021,38(6):841-851. 被引量：6
9吕佳,李婷婷.半监督自训练方法综述[J].重庆师范大学学报（自然科学版）,2021,38(5):98-106. 被引量：8
10龚希,陈占龙,吴亮,谢忠,徐永洋.用于高分辨遥感影像场景分类的迁移学习混合专家分类模型[J].光学学报,2021,41(23):11-23. 被引量：10

引证文献1

1张方泽,龚循强,周秀芳,刘卓涛.基于自训练卷积神经网络的遥感场景图像异常探测方法[J].时空信息学报,2023,30(4):482-490. 被引量：6

二级引证文献6

1刘卓涛,龚循强,夏元平,陈晓勇,吴晋涛.KU-Net:改进U-Net的高分辨率遥感影像建筑物提取方法[J].遥感信息,2024,39(5):121-131. 被引量：2
2杜志强,周天畅,甘巧燕.震害任务驱动的遥感信息服务链动态演化方法[J].时空信息学报,2024,31(5):666-679. 被引量：1
3潘琛,顾建祥,岳照溪.基于高光谱影像的长三角一体化示范区典型区域植被类型分类[J].时空信息学报,2024,31(6):698-709. 被引量：2
4龚循强,方启锐,侯昭阳,张智华,夏元平.一种光学与合成孔径雷达影像融合去云方法[J].光学学报,2024,44(24):185-196. 被引量：2
5吕开云,马爱龙,龚循强.智能测绘时代测绘学科研究生创新能力培养体系构建与实践[J].江西测绘,2024(4):53-56.
6徐然,邓力凡,张经度,刘雪俊,谢萍,魏冀明.基于深度学习的耕地后备资源潜力评价方法研究[J].时空信息学报,2025,32(4):430-441.

1车满强,李树斌,葛金鹏.多模型融合的孪生网络视觉跟踪[J].激光与光电子学进展,2021,58(4):341-348. 被引量：1
2吕惠炼,胡维平.基于端到端深度神经网络的语音情感识别研究[J].广西师范大学学报（自然科学版）,2021,39(3):20-26. 被引量：12
3龚娟,刘璞,李娟.基于查新目的分类的高质量科技查新服务[J].中国科技信息,2021(11):113-114. 被引量：4
4曹一冰,张江水,华一新,陈云海.全空间时空对象可视化工具的设计与实现[J].测绘科学技术学报,2021,38(2):173-180. 被引量：9
5涂蓝.基于卷积神经网络的场景分类预测模型应用[J].电脑编程技巧与维护,2021(5):142-144.
6张震,张照崎,朱留存,苗志滨,王骥月,李修明,赵成龙,张坤伦.基于Harris-改进LBP的特征匹配及目标定位算法[J].吉林大学学报（理学版）,2021,59(3):568-576. 被引量：6
7吴纹辉,慎利,董新丰,杜有德.面向高分辨率遥感影像建筑物变化检测的边缘感知网络[J].地理与地理信息科学,2021,37(3):21-28. 被引量：7
8毕林丰.精细化治理视角下基层社会救助工作队伍建设——基于上海市P区调研分析[J].上海城市管理,2021,30(3):78-83.
9丁晓凤,熊赟晖,林祖轩.基于参照物和深度估计的建筑物体尺度估算[J].现代计算机,2021,27(10):99-107. 被引量：1
10孙文轩,张笑恒,张杉,迟宗涛.基于优化PSO-BP的多特征融合图像识别算法研究[J].青岛大学学报（工程技术版）,2021,36(2):72-82. 被引量：5

中国传媒大学学报（自然科学版）

2020年第5期

浏览历史

内容加载中请稍等...

基于多尺度感受野网络和注意力机制的场景识别方法研究被引量：1

同被引文献14

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于多尺度感受野网络和注意力机制的场景识别方法研究 被引量：1

同被引文献14

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于多尺度感受野网络和注意力机制的场景识别方法研究被引量：1