-
题名FCSNet:频域感知的跨特征融合烟雾分割网络
- 1
-
-
作者
王开正
曾瑶
张占喜
谭义章
文刚
-
机构
昆明理工大学电力工程学院
南方电网电动汽车服务有限公司
云南电网有限责任公司电力科学研究院
-
出处
《电子与信息学报》
北大核心
2025年第7期2320-2333,共14页
-
基金
国家自然科学基金(52107017)
云南省科技厅基础研究专项青年项目(202201AU070172)。
-
文摘
由于烟雾具有非刚性结构、半透明性以及形态多变等特点,烟雾的语义分割相较于其他物体具有更大的挑战性。为此,该文设计了频域感知的跨特征融合烟雾分割网络(FCSNet),用于应对真实场景中的烟雾分割任务。该网络由Transformer分支、卷积神经网络分支、特征融合分支以及多级高频感知分支组成。为了在获取全局上下文信息的同时降低Transformer分支的计算复杂度,提出频率Transformer分支,该分支基于傅里叶变换来获取全局特征,并使用频域中的低频幅值来代表大规模的语义结构。此外,还提出域间交互模块(DIM),该模块通过加权融合操作和坐标注意力机制,促进了来自不同特征源信息的协同学习和整合,有效地融合全局和局部信息。为了充分利用边缘信息的固有分割能力来解决混淆区域的不准确分割问题,提出多级高频感知模块(MHFM),以获取准确的高频边缘信息。考虑到烟雾的非刚性特征,设计多向交叉注意力模块(MHCA),该模块计算边缘特征图和解码器特征图之间的相似性,从而指导混淆区域的分割结果。实验结果表明,该网络在真实场景烟雾分割数据集中的两个测试数据集上分别达到了58.95%和63.92%的平均交并比,在SMOKE5K数据集上达到了78.94%的平均交并比。与其他方法相比,该网络能够获得准确的烟雾定位和更精细的烟雾边缘。
-
关键词
烟雾语义分割
频率Transformer
域间交互
多级高频感知
多向交叉注意力
-
Keywords
Smoke semantic segmentation
Frequency Transformer
Domain interaction
Multi-level high-frequency perception
Multi-Head Cross Attention(MHCA)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-