-
题名一种用于视频对象分割的仿U形网络
- 1
-
-
作者
黄志勇
韩莎莎
陈致君
姚玉
熊彪
马凯
-
机构
三峡大学计算机与信息学院
-
出处
《图学学报》
CSCD
北大核心
2023年第1期104-111,共8页
-
基金
国家自然科学基金项目(61871258)。
-
文摘
在半监督的分割任务中,单镜头视频对象分割(OSVOS)方法根据第一帧的对象标记掩模进行引导,从视频画面中分离出后续帧中的前景对象。虽然取得了令人印象深刻的分割结果,但其不适用于前景对象外观变化显著或前景对象与背景外观相似的情形。针对这些问题,提出一种用于视频对象分割的仿U形网络结构。将注意力机制加入到此网络的编码器和解码器之间,以便在特征图之间建立关联来产生全局语义信息。同时,优化损失函数,进一步解决了类别间的不平衡问题,提高了模型的鲁棒性。此外,还将多尺度预测与全连接条件随机场(FC/Dense CRF)结合,提高了分割结果边缘的平滑度。在具有挑战性的DAVIS 2016数据集上进行了大量实验,此方法与其他最先进方法相比获得了具有竞争力的分割结果。
-
关键词
半监督视频对象分割
注意力机制
损失函数
多尺度特征
全连接条件随机场
-
Keywords
semi-supervised video object segmentation
attention mechanism
loss function
multi-scale feature
fully connected conditional random field
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-