期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
基于动态嵌入特征的鲁棒半监督视频目标分割 被引量:1
1
作者 陈亚当 赵翊冰 吴恩华 《北京航空航天大学学报》 北大核心 2025年第7期2253-2261,共9页
针对半监督视频目标分割(VOS)方法存在推理时内存占用不断增加及仅依赖低级像素特征训练困难的问题,提出一种基于动态嵌入特征和辅助损失函数的半监督视频目标分割方法。使用动态嵌入特征建立恒定大小的记忆库;通过时空聚合方法,利用历... 针对半监督视频目标分割(VOS)方法存在推理时内存占用不断增加及仅依赖低级像素特征训练困难的问题,提出一种基于动态嵌入特征和辅助损失函数的半监督视频目标分割方法。使用动态嵌入特征建立恒定大小的记忆库;通过时空聚合方法,利用历史信息生成和更新动态嵌入特征;使用内存更新感应器来自适应控制记忆库的更新间隔,适应不同视频的运动模式;使用辅助损失函数,在高级语义特征层面上给网络提供辅助指导,并通过在多重特征层面多方面指导,提高模型精度和训练效率;针对视频前背景中相似目标误匹配的问题,设计一种时空约束模块,以利用视频的时间连续性特性更好地捕获前一帧掩码信息与当前帧之间的关联。实验结果表明:所提方法在DAVIS 2017验证集上达到84.5%J&F的精度,在YouTube-VOS 2019验证集达到82.4%J&F的精度。 展开更多
关键词 视频目标分割 时空记忆网络 时空约束 内存更新感应 动态嵌入特征
在线阅读 下载PDF
基于时空解耦和区域鲁棒性增强的半监督视频目标分割方法
2
作者 陈鹏宇 聂秀山 +1 位作者 李南君 李拓 《计算机应用》 北大核心 2025年第5期1379-1386,共8页
针对半监督视频目标分割(VOS)领域中基于记忆的方法存在由于目标交互造成的物体遮挡以及背景中类似对象或噪声的干扰等问题,提出一种基于时空解耦和区域鲁棒性增强的半监督VOS方法。首先,构建一个结构化Transformer架构去除所有像素共... 针对半监督视频目标分割(VOS)领域中基于记忆的方法存在由于目标交互造成的物体遮挡以及背景中类似对象或噪声的干扰等问题,提出一种基于时空解耦和区域鲁棒性增强的半监督VOS方法。首先,构建一个结构化Transformer架构去除所有像素共有的特征信息,突出每个像素之间的差异,深入挖掘视频帧中目标的关键特征;其次,解耦当前帧与长期记忆帧之间的相似性,区分为时空相关性和目标重要性2个关键维度,使得对像素级时空特征和目标特征的分析更精确,从而解决由目标交互造成的物体遮挡问题;最后,设计一个区域条形注意力(RSA)模块,利用长期记忆中的目标位置信息增强对前景区域的关注度并抑制背景噪声。实验结果表明,所提方法在DAVIS 2017验证集上比重新训练的AOT(Associating Objects with Transformers)模型的J&F指标高1.7个百分点,在YouTube-VOS2019验证集上比重新训练的AOT模型的总分高1.6个百分点。可见所提方法可有效解决半监督VOS存在的问题。 展开更多
关键词 视频目标分割 时空解耦 半监督学习 TRANSFORMER 条形注意力
在线阅读 下载PDF
聚焦式学习分割一切提示的无监督视频目标分割
3
作者 沈勇辉 卜东旭 +1 位作者 张胜裕 宋慧慧 《计算机工程与科学》 北大核心 2025年第2期298-307,共10页
无监督视频目标分割旨在测试阶段自动定位和分割视频帧中的主要目标。目前,大多数模型、方法依赖于从RGB图提取的外观线索和从光流图提取的运动线索来进行目标分割。然而,目标遮挡、快速运动或静止等问题会导致光流获取的信息缺失,仅依... 无监督视频目标分割旨在测试阶段自动定位和分割视频帧中的主要目标。目前,大多数模型、方法依赖于从RGB图提取的外观线索和从光流图提取的运动线索来进行目标分割。然而,目标遮挡、快速运动或静止等问题会导致光流获取的信息缺失,仅依靠外观分支获取的有限信息难以实现良好的分割效果。为了解决这一问题,提出了一种聚焦式学习网络模型FPLNet,该模型引入额外的双分支结构以捕捉主要目标的位置信息和轮廓信息,从而弥补光流信息的缺失。首先,所提出的模型利用分割一切模型SAM的骨干网络提取外观和运动信息,从而提高模型的泛化性。然后,将额外引入的粗粒度和细粒度的2个分割分支共同作为聚焦式学习网络的提示部分。在解码部分,RGB外观信息、光流运动信息、粗粒度特征和细粒度特征逐步融合,以此模仿人类视觉系统,实现聚焦式学习目标特征的过程。在3个标准数据集上进行了大量的测试,实验结果表明,与现有的模型相比,所提出的模型拥有更优异的性能。 展开更多
关键词 无监督视频目标分割 聚焦式学习 分割一切模型
在线阅读 下载PDF
基于多尺度特征增强与全局-局部特征聚合的视频目标分割算法 被引量:1
4
作者 侯志强 董佳乐 +3 位作者 马素刚 王晨旭 杨小宝 王昀琛 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第11期4198-4207,共10页
针对记忆网络算法中多尺度特征表达能力不足和浅层特征没有充分利用的问题,该文提出一种多尺度特征增强与全局-局部特征聚合的视频目标分割(VOS)算法。首先,通过多尺度特征增强模块融合可参考掩码分支和可参考RGB分支的不同尺度特征信息... 针对记忆网络算法中多尺度特征表达能力不足和浅层特征没有充分利用的问题,该文提出一种多尺度特征增强与全局-局部特征聚合的视频目标分割(VOS)算法。首先,通过多尺度特征增强模块融合可参考掩码分支和可参考RGB分支的不同尺度特征信息,增强多尺度特征的表达能力;同时,建立了全局-局部特征聚合模块,利用不同大小感受野的卷积操作来提取特征,并通过特征聚合模块来自适应地融合全局区域和局部区域的特征,这种融合方式可以更好地捕捉目标的全局特征和细节信息,提高分割的准确性;最后,设计了跨层融合模块,利用浅层特征的空间细节信息来提升分割掩码的精度,通过将浅层特征与深层特征融合,能更好地捕捉目标的细节和边缘信息。实验结果表明,在公开数据集DAVIS2016,DAVIS2017和YouTube-2018上,该文算法的综合性能分别达到91.8%、84.5%和83.0%,在单目标和多目标分割任务上都能实时运行。 展开更多
关键词 视频目标分割 记忆网络 孪生网络 特征融合 掩码细化
在线阅读 下载PDF
基于特征深层融合的吊装过程视频目标分割
5
作者 周明君 王朝立 孙占全 《上海理工大学学报》 CAS CSCD 北大核心 2024年第4期407-416,共10页
吊装事故的频繁发生,对国家、社会、人民都造成了非常大的损害。根据吊装过程的视频信息,实现无人安全监控的关键是准确度和速度,提出了一种新的基于全局编码和非对称卷积的目标分割网络,研究视频图像的半监督目标分割问题。首先,将带... 吊装事故的频繁发生,对国家、社会、人民都造成了非常大的损害。根据吊装过程的视频信息,实现无人安全监控的关键是准确度和速度,提出了一种新的基于全局编码和非对称卷积的目标分割网络,研究视频图像的半监督目标分割问题。首先,将带有标签的视频图像输入网络,分别通过全局编码器与相似性编码器提取到互为补充的特征,从而获得对目标外观的有效表示;然后,通过非对称卷积将两个分支的特征进行深层融合;最后,采用残差上采样解码生成预测掩膜,实现对目标的分割。该方法在DAVIS2017数据集上的准确度为0.675,综合指标为0.708,帧率为31帧/s;在实验用吊装数据集上的准确度为0.952,综合指标为0.976,比基线方法高5.1%,帧率为26.16帧/s。与其他网络方法进行了实验比较,验证了分割算法在准确度与速度方面的有效性。 展开更多
关键词 深度学习 视频目标分割 特征深层融合 目标外观表示 吊装
在线阅读 下载PDF
基于编码记忆网络的半监督视频目标分割方法
6
作者 尹亮 张钊 张宝鹏 《弹箭与制导学报》 北大核心 2024年第3期11-21,共11页
视频目标分割是计算机视觉中的一项关键任务,在自动驾驶、视频编码等领域具有重要意义。针对视频目标分割任务,提出使用一种高效的编码记忆网络(EMNet)实现半监督视频目标分割任务。该方法包含自适应参考帧选取模块、双路径匹配模块、... 视频目标分割是计算机视觉中的一项关键任务,在自动驾驶、视频编码等领域具有重要意义。针对视频目标分割任务,提出使用一种高效的编码记忆网络(EMNet)实现半监督视频目标分割任务。该方法包含自适应参考帧选取模块、双路径匹配模块、特征处理模块以及特征聚合模块。自适应参考帧选取模块综合考虑掩码置信度和相似度,选择包含丰富信息的参考帧。双路径匹配模块实现查询帧和参考帧之间的双向和双尺度匹配,提高目标特征匹配准确率。特征处理模块分别包含语义强化模块和特征细化模块,通过低通和高通滤波增强目标的语义和细节信息。并由特征聚合模块对各特征进行融合利用。最后通过在DAVIS2017数据集上的评估,证明所提出模型的有效性。 展开更多
关键词 视频目标分割 编码记忆网络 注意力机制 语义分割 深度学习
在线阅读 下载PDF
融合视网膜运动感知的视频目标分割
7
作者 吴婷 李椋 +3 位作者 王刚 高晋 陈明松 王以政 《计算机应用与软件》 北大核心 2024年第8期240-246,302,共8页
视频目标分割容易受到目标快速运动、目标遮挡等情形的影响,因此高精度的视频目标分割是极具挑战性的任务。利用光流可以促进物体的分割,但运动边界附近区域的光流往往计算得不准确,从而间接影响了基于光流的视频目标分割性能的提升。... 视频目标分割容易受到目标快速运动、目标遮挡等情形的影响,因此高精度的视频目标分割是极具挑战性的任务。利用光流可以促进物体的分割,但运动边界附近区域的光流往往计算得不准确,从而间接影响了基于光流的视频目标分割性能的提升。为突破上述局限,结合生物视网膜大细胞通路模型所提取的运动轮廓信息,来辅助计算运动边界区域的光流,并与传统视频目标分割方法前景-背景分割结合,交替更新光流和分割。所提方法在公开数据集DAVIS-2016、SegTrack-v2、YouTube-Objects上的实验结果表明,该方法相比于基线方法其平均分割精度分别提升了2.2百分点、1.3百分点、1.9百分点。 展开更多
关键词 视频目标分割 视网膜模型 图割模型 光流算法
在线阅读 下载PDF
一种高精度的压缩域视频目标分割算法 被引量:2
8
作者 唐志峰 王诗俊 杨树元 《电子与信息学报》 EI CSCD 北大核心 2007年第12期2965-2969,共5页
该文提出了一种工作于MPEG压缩域的快速视频目标分割算法。该算法以从MPEG1/2码流中部分解码提取的特征为输入,提取P帧中的运动目标。针对一般的压缩域算法目标边界精度不高的特点,算法采用I帧和P帧中每个块的直流DCT系数和3个交流DCT系... 该文提出了一种工作于MPEG压缩域的快速视频目标分割算法。该算法以从MPEG1/2码流中部分解码提取的特征为输入,提取P帧中的运动目标。针对一般的压缩域算法目标边界精度不高的特点,算法采用I帧和P帧中每个块的直流DCT系数和3个交流DCT系数,以及运动补偿信息,重建出P帧的原图像1/16大小的子图像,采用快速平均移聚类得到具有较高边界精度的亮度一致的区域;针对运动向量的噪声容易造成错误检测的缺点,算法结合聚类分析结果和运动块的分布,采用基于马尔可夫随机场的统计标号方法对目标和背景区域进行分类,得到每个P帧的目标掩模。该算法可以得到4×4子块的边界精度,对于CIF格式的码流,在Pentium IV 2GHz平台上可以达到每秒40帧的处理速度。 展开更多
关键词 视频目标分割 压缩域 快速平均移聚类 马尔可夫场
在线阅读 下载PDF
反馈学习高斯表观网络的视频目标分割 被引量:1
9
作者 王龙 宋慧慧 +1 位作者 张开华 刘青山 《自动化学报》 EI CAS CSCD 北大核心 2022年第3期834-842,共9页
大量基于深度学习的视频目标分割方法存在两方面局限性:1)单帧编码特征直接输入网络解码器,未能充分利用多帧特征,导致解码器输出的目标表观特征难以自适应复杂场景变化;2)常采用前馈网络结构,阻止了后层特征反馈前层进行补充学习,导致... 大量基于深度学习的视频目标分割方法存在两方面局限性:1)单帧编码特征直接输入网络解码器,未能充分利用多帧特征,导致解码器输出的目标表观特征难以自适应复杂场景变化;2)常采用前馈网络结构,阻止了后层特征反馈前层进行补充学习,导致学习到的表观特征判别力受限.为此,本文提出了反馈高斯表观网络,通过建立在线高斯模型并反馈后层特征到前层来充分利用多帧、多尺度特征,学习鲁棒的视频目标分割表观模型.网络结构包括引导、查询与分割三个分支.其中,引导与查询分支通过共享权重来提取引导与查询帧的特征,而分割分支则由多尺度高斯表观特征提取模块与反馈多核融合模块构成.前一个模块通过建立在线高斯模型融合多帧、多尺度特征来增强对外观的表征力,后一个模块则通过引入反馈机制进一步增强模型的判别力.最后,本文在三个标准数据集上进行了大量评测,充分证明了本方法的优越性能. 展开更多
关键词 视频目标分割 表观建模 反馈机制 深度学习
在线阅读 下载PDF
矩阵的低秩稀疏表达在视频目标分割中的研究
10
作者 顾菘 马争 解梅 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第2期363-368,406,共7页
提出了一种视频目标跟踪与分割的在线算法。该算法将每帧图像中的超级像素作为一个数据点,根据已知的目标和背景建立模板,当前帧中待分割的目标可以看成已知模板的稀疏线性表达。根据此线性表达的系数可以建立描述当前帧与模板的相似性... 提出了一种视频目标跟踪与分割的在线算法。该算法将每帧图像中的超级像素作为一个数据点,根据已知的目标和背景建立模板,当前帧中待分割的目标可以看成已知模板的稀疏线性表达。根据此线性表达的系数可以建立描述当前帧与模板的相似性矩阵,即表达子。由于视频图像的连续性,表达子具有低秩和稀疏的特征。因此通过求解矩阵的低秩稀疏的优化问题可以得到当前帧中所有数据点属于目标的概率分布。为了获得基于像素级的分割结果,通过能量最小框架,并利用图分割的方法最终实现目标的分割。实验结果表明该算法具有良好的分割效果。 展开更多
关键词 能量最小 分割 低秩 稀疏 视频目标分割
在线阅读 下载PDF
基于运动引导的高效无监督视频目标分割网络 被引量:2
11
作者 赵子成 张开华 +1 位作者 樊佳庆 刘青山 《自动化学报》 EI CAS CSCD 北大核心 2023年第4期872-880,共9页
大量基于深度学习的无监督视频目标分割(Unsupervised video object segmentation,UVOS)算法存在模型参数量与计算量较大的问题,这显著限制了算法在实际中的应用.提出了基于运动引导的视频目标分割网络,在大幅降低模型参数量与计算量的... 大量基于深度学习的无监督视频目标分割(Unsupervised video object segmentation,UVOS)算法存在模型参数量与计算量较大的问题,这显著限制了算法在实际中的应用.提出了基于运动引导的视频目标分割网络,在大幅降低模型参数量与计算量的同时,提升视频目标分割性能.整个模型由双流网络、运动引导模块、多尺度渐进融合模块三部分组成.具体地,首先,RGB图像与光流估计输入双流网络提取物体外观特征与运动特征;然后,运动引导模块通过局部注意力提取运动特征中的语义信息,用于引导外观特征学习丰富的语义信息;最后,多尺度渐进融合模块获取双流网络的各个阶段输出的特征,将深层特征渐进地融入浅层特征,最终提升边缘分割效果.在3个标准数据集上进行了大量评测,实验结果表明了该方法的优越性能. 展开更多
关键词 无监督视频目标分割 运动引导 局部注意力 互注意力
在线阅读 下载PDF
基于自适应模板更新与多特征融合的视频目标分割算法 被引量:5
12
作者 汪水源 侯志强 +3 位作者 王囡 李富成 蒲磊 马素刚 《光电工程》 CAS CSCD 北大核心 2021年第10期19-28,共10页
针对SiamMask不能很好地适应目标外观变化,特征信息利用不足导致生成掩码较为粗糙等问题,本文提出一种基于自适应模板更新与多特征融合的视频目标分割算法。首先,算法利用每一帧的分割结果对模板进行自适应更新;其次,使用混合池化模块... 针对SiamMask不能很好地适应目标外观变化,特征信息利用不足导致生成掩码较为粗糙等问题,本文提出一种基于自适应模板更新与多特征融合的视频目标分割算法。首先,算法利用每一帧的分割结果对模板进行自适应更新;其次,使用混合池化模块对主干网络第四阶段提取的特征进行增强,将增强后的特征与粗略掩码进行融合;最后,使用特征融合模块对粗略掩码进行逐阶段细化,该模块能够对拼接后的特征进行有效的加权组合。实验结果表明,与SiamMask相比,本文算法性能有明显提升。在DAVIS2016数据集上,本文算法的区域相似度和轮廓相似度分别为0.727和0.696,比基准算法提升了1.0%和1.8%,速度达到40.2 f/s;在DAVIS2017数据集上,本文算法的区域相似度和轮廓相似度分别为0.567和0.615,比基准算法提升了2.4%和3.0%,速度达到42.6 f/s。 展开更多
关键词 视频目标分割 模板更新 特征融合 掩码细化
在线阅读 下载PDF
基于双重金字塔网络的视频目标分割方法 被引量:4
13
作者 姜斯浩 宋慧慧 +1 位作者 张开华 汤润发 《计算机应用》 CSCD 北大核心 2019年第8期2242-2246,共5页
针对复杂视频场景中难以分割特定目标的问题,提出一种基于双重金字塔网络(DPN)的视频目标分割方法。首先,通过调制网络的单向传递让分割模型适应特定目标的外观。具体而言,从给定目标的视觉和空间信息中学习一种调制器,并通过调制器调... 针对复杂视频场景中难以分割特定目标的问题,提出一种基于双重金字塔网络(DPN)的视频目标分割方法。首先,通过调制网络的单向传递让分割模型适应特定目标的外观。具体而言,从给定目标的视觉和空间信息中学习一种调制器,并通过调制器调节分割网络的中间层以适应特定目标的外观变化。然后,通过基于不同区域的上下文聚合的方法,在分割网络的最后一层中聚合全局上下文信息。最后,通过横向连接的自左而右结构,在所有尺度中构建高阶语义特征图。所提出的视频目标分割方法是一个可以端到端训练的分割网络。大量实验结果表明,所提方法在DAVIS2016数据集上的性能与较先进的使用在线微调的方法相比,可达到相竞争的结果,且在DAVIS2017数据集上性能较优。 展开更多
关键词 视频目标分割 特征金字塔 卷积神经网络 深度学习 多尺度融合
在线阅读 下载PDF
动态外观模型和高阶能量的双边视频目标分割方法 被引量:4
14
作者 田颖 桂彦 熊达铭 《计算机科学与探索》 CSCD 北大核心 2020年第12期2108-2121,共14页
针对复杂场景下视频目标分割质量不佳和时间效率低下的问题,提出了一种动态外观模型和高阶能量的双边视频目标分割方法,将视频目标分割转换为基于双边网格单元的马尔可夫随机场(MRF)模型求解问题。首先将带关键帧标记的视频序列映射至... 针对复杂场景下视频目标分割质量不佳和时间效率低下的问题,提出了一种动态外观模型和高阶能量的双边视频目标分割方法,将视频目标分割转换为基于双边网格单元的马尔可夫随机场(MRF)模型求解问题。首先将带关键帧标记的视频序列映射至高维的双边网格,极大地减少待处理的数据。然后以非空网格单元作为图的结点并构建图割优化模型,其关键在于定义了具有置信度判别的动态外观模型,并在能量函数中引入鲁棒的高阶能量项。最后利用最大流/最小割算法进行全局优化求解,为视频像素点分配二值标签,最终获得高质量的视频目标分割结果。采用DAVIS 2016和SegTrack v2数据的实验结果表明,该方法在提供少量用户交互的情况下,不仅能在处理具有复杂场景的视频时获得理想的视频目标分割结果,而且还能显著提高视频目标分割的时间效率。 展开更多
关键词 视频目标分割 双边空间 双边网格 置信动态外观模型 高阶能量项
在线阅读 下载PDF
结合在线归纳和直推推理的快速视频目标分割方法 被引量:3
15
作者 徐凯 李国荣 +3 位作者 洪德祥 张维刚 齐元凯 黄庆明 《计算机学报》 EI CAS CSCD 北大核心 2022年第10期2117-2132,共16页
视频目标分割任务是通过算法自动获得视频序列中感兴趣目标对应的像素级区域.因为存在目标表观变化、尺度变化、相似目标干扰、遮挡等困难,所以视频目标分割是一个非常有挑战的任务.现有的方法按照对给定的视频第一帧真实标签的利用方... 视频目标分割任务是通过算法自动获得视频序列中感兴趣目标对应的像素级区域.因为存在目标表观变化、尺度变化、相似目标干扰、遮挡等困难,所以视频目标分割是一个非常有挑战的任务.现有的方法按照对给定的视频第一帧真实标签的利用方式不同可以分为两类:一类是基于在线归纳学习的方法;另一类是基于直推推理的方法.基于在线归纳学习的方法为了获得准确的结果,在测试阶段,利用给定的初始帧分割图来在线地微调整个网络,导致时间消耗较大,很难满足实时需求.此外,基于直推推理的方法在建模时序推理规则时需要使用大量的合成数据或者标注数据,增加了算法训练的成本.为了充分利用基于在线归纳学习和基于直推推理的两类算法的优点,同时避免两种方法的缺点,本文提出了一个新的结合在线归纳学习和直推推理的快速视频目标分割算法,该网络由直推推理分支和在线归纳分支组成.具体的,直推推理分支可以通过视频前若干帧图像和对应的分割图建模视频短期内的时序变换和运动信息,从而推理出当前帧的分割结果,其学到的时序特征可以指导网络提高视频分割的稳定性.直推推理分支的预训练过程中只需要使用无标注的原始视频数据,不需要使用任何的合成或标注信息.在线归纳分支根据参考帧在线训练,学到目标表观的判别性特征,提供长期的表观判别力.为了提高测试速度,不同于以往的方法,本文没有利用第一帧在线微调整个网络,而是通过在线更新一个非常轻量的模板网络.轻量模板网络提供粗略的分割结果作为注意力图作用到时序特征和当前帧的图像特征,然后经过解码网络生成最终更加精细的分割结果.通过大量的实验,表明本文的方法取得了当前较优的效果,在DAVIS-2017和YouTube-VOS数据集上分别达到了J&F指标的72.9%和73.8%,在DAVIS-2016数据集上速度达到18帧每秒. 展开更多
关键词 视频目标分割 自监督学习 注意力机制 视频预测 在线学习
在线阅读 下载PDF
视频目标分割中帧间相似性传播的研究 被引量:2
16
作者 章雪瑞 孙凤铭 袁夏 《计算机工程与应用》 CSCD 北大核心 2022年第6期227-233,共7页
目前视频目标分割算法多是基于匹配和传播策略分割目标,常常以掩模或者光流的方式利用前一帧的信息,探索了新的帧间特征传播方式,利用短时匹配模块提取前一帧信息并传播给当前帧,提出一种面向视频序列数据的目标分割模型。通过长时匹配... 目前视频目标分割算法多是基于匹配和传播策略分割目标,常常以掩模或者光流的方式利用前一帧的信息,探索了新的帧间特征传播方式,利用短时匹配模块提取前一帧信息并传播给当前帧,提出一种面向视频序列数据的目标分割模型。通过长时匹配模块和短时匹配模块分别与第一帧和前一帧做相关操作进行像素级匹配,得到的全局相似性图和局部相似性图,以及前一帧的掩模和当前帧的特征图,经过两个优化网络后通过分割网络得到分割结果。在视频目标分割公开数据集上的实验表明,所提出方法在单目标和多目标上分别取得了86.5%和77.4%的区域相似度和轮廓精度均值,每秒可计算21帧。提出的短时匹配模块比仅使用掩模更有利于提取前一帧的信息,通过长时匹配模块和短时匹配模块的结合,不使用在线微调即可实现高效的视频目标分割,适合应用于移动机器人视觉感知。 展开更多
关键词 视觉感知 视频目标分割 特征传播 长-短时匹配
在线阅读 下载PDF
深度信号引导学习混合变换器的高性能无监督视频目标分割 被引量:1
17
作者 苏天康 宋慧慧 +1 位作者 樊佳庆 张开华 《电子学报》 EI CAS CSCD 北大核心 2023年第5期1388-1395,共8页
现存的无监督视频目标分割方法通常使用光流作为运动线索来提升模型性能.然而,光流的估计常存在误差,这将导致双流网络易对噪声过拟合.为此,本文提出一种基于混合变换器的无监督视频目标分割算法,通过引入深度信号引导变换器高效融合不... 现存的无监督视频目标分割方法通常使用光流作为运动线索来提升模型性能.然而,光流的估计常存在误差,这将导致双流网络易对噪声过拟合.为此,本文提出一种基于混合变换器的无监督视频目标分割算法,通过引入深度信号引导变换器高效融合不同模态数据,以学习更加鲁棒的特征表达,从而减轻模型对噪声的过拟合.首先,设计一个新颖的混合注意力模块来获得全局感受野并对不同模态的特征进行充分交互,以增强特征的全局语义信息来提升模型的抗干扰能力.接着,为了进一步感知精细化的目标边缘,设计了一个局部-非局部语义增强模块,将局部语义的归纳偏置引入补充学习非局部语义特征,在提升模型抗干扰力的同时突出更精细化的目标区域.最后,增强后的特征输入变换器的解码器,预测得到高质量的分割结果 .与最先进的方法相比,本文所提算法在四个标准数据集上都获得了领先的性能,充分表明了本文所提方法的有效性. 展开更多
关键词 无监督视频目标分割 混合变换器 混合注意力 多模态 深度估计 鲁棒特征
在线阅读 下载PDF
基于前景感知视觉注意的半监督视频目标分割 被引量:8
18
作者 付利华 赵宇 +3 位作者 姜涵煦 赵茹 吴会贤 闫绍兴 《电子学报》 EI CAS CSCD 北大核心 2022年第1期195-206,共12页
半监督视频目标分割是计算机视觉领域中的一个研究热点.传统半监督视频目标分割方法的网络模型缺乏对相似目标的判别力,且传统的掩码传播方式对模型的指导能力较弱.本文提出一种基于前景感知视觉注意的半监督视频目标分割方法.三流孪生... 半监督视频目标分割是计算机视觉领域中的一个研究热点.传统半监督视频目标分割方法的网络模型缺乏对相似目标的判别力,且传统的掩码传播方式对模型的指导能力较弱.本文提出一种基于前景感知视觉注意的半监督视频目标分割方法.三流孪生编码器将输入图像映射到同一特征空间,使得相同目标具有相似的特征.基于前景感知的视觉注意将编码器输出的特征进行相似度匹配,并利用分割掩码突显前景特征,形成前景感知视觉注意,以此关注给定的分割目标,提升模型对待分割目标的判别力.基于残差细化的解码器采用残差学习的思想,融合当前帧图像的低阶特征,逐步改善分割细节.在公开基准数据集上的实验结果表明,本文方法可以较好地解决相似目标容易产生混淆等问题,并能较为准确地跟踪给定的分割目标. 展开更多
关键词 视频目标分割 孪生网络 特征空间 前景感知 视觉注意力
在线阅读 下载PDF
基于孪生网络的快速视频目标分割 被引量:6
19
作者 付利华 赵宇 +3 位作者 孙晓威 卢中山 王丹 杨寒雪 《电子学报》 EI CAS CSCD 北大核心 2020年第4期625-630,共6页
视频目标分割是计算机视觉领域中的一个研究热点,传统基于深度学习的视频目标分割方法在线微调深度网络,导致分割耗时长,难以满足实时的需求.本文提出一种快速的视频目标分割方法.首先,参数共享的孪生编码器子网将参考流和目标流映射到... 视频目标分割是计算机视觉领域中的一个研究热点,传统基于深度学习的视频目标分割方法在线微调深度网络,导致分割耗时长,难以满足实时的需求.本文提出一种快速的视频目标分割方法.首先,参数共享的孪生编码器子网将参考流和目标流映射到相同的特征空间,使得相同的目标具有相似的特征.然后,全局特征提取子网在特征空间中匹配给定目标相似的特征,定位目标对象.最后,解码器子网将目标特征还原,并通过连接目标流的低阶特征,提供边缘信息,最终输出目标的分割掩码.在公开基准数据集上的实验表明,本文方法的分割速度有大幅度提升,同时具有较好的分割效果. 展开更多
关键词 视频目标分割 计算机视觉 深度学习 孪生网络 特征空间
在线阅读 下载PDF
基于注意力修正的半监督视频目标分割 被引量:1
20
作者 付利华 杨寒雪 +3 位作者 张博 王俊翔 吴会贤 闫绍兴 《北京工业大学学报》 CAS CSCD 北大核心 2022年第8期822-829,共8页
针对现有半监督视频目标分割方法不能同时满足分割精度和分割效率的问题,在传统半监督视频目标分割方法上引入注意力机制对分割结果进行修正.首先,构建一个外观特征提取子网用于提取视频第1帧的特征图,并将其作为外观指导信息;然后,得... 针对现有半监督视频目标分割方法不能同时满足分割精度和分割效率的问题,在传统半监督视频目标分割方法上引入注意力机制对分割结果进行修正.首先,构建一个外观特征提取子网用于提取视频第1帧的特征图,并将其作为外观指导信息;然后,得到视频前一帧的分割结果,作为位置引导信息;最后,构建一个当前帧特征提取子网,以双分支的结构结合位置修正注意力与外观修正注意力,将位置信息和外观信息与当前帧特征图进行融合,实现目标分割.实验结果表明,该目标分割方法可以纠正视频目标分割中的传播误差,并能有效提升分割精度. 展开更多
关键词 视频目标分割 注意力机制 语义信息 通道注意力 空间注意力 半监督学习
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部