-
题名基于随机块移位和可变形注意力的视频烟雾识别
- 1
-
-
作者
谢晔辉
赵海涛
-
机构
华东理工大学信息科学与工程学院
-
出处
《应用光学》
CAS
北大核心
2024年第6期1204-1211,共8页
-
基金
国家自然科学基金(62173143)。
-
文摘
识别出工业环境中的烟雾排放行为对于规范和实时监督企业,以及环境保护都具有至关重要的意义。然而,识别工业排放烟雾具有很高的挑战性,一方面工业排放烟雾具有高透明度、高动态性等特点;另一方面烟雾的形状和尺寸可能会因环境、光照等因素而发生变化。目前主流的烟雾识别方法都是基于图像或视频的深度学习模型,但是基于图像的模型无法对视频中烟雾的动态特性进行有效的时序建模,同时基于视频的模型没有考虑烟雾形状多变的特性。将随机块移位(random patch shift,RPS)和可变形注意力(deformable attention,DA)引入Swin Transformer。RPS将传统的2D空间注意力转变为时空注意力,从而使用2D的自注意力计算对动态烟雾进行建模;DA通过自适应形变的方式使网络能够适应不同的烟雾形态和外观变化,提高网络的鲁棒性和泛化能力。在RISE数据集上的实验结果表明,本文方法能够在3个子集上分别达到0.85、0.86和0.84的F 1分数,相比其他方法有0.01~0.06的提升。
-
关键词
烟雾识别
随机块移位
可变形注意力
深度神经网络
-
Keywords
smoke recognition
random patch shift
deformable attention
deep neural network
-
分类号
TN911.73
[电子电信—通信与信息系统]
-