期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于多尺度记忆库的像素级无监督工业异常检测 被引量:2
1
作者 刘永江 陈斌 《计算机应用》 CSCD 北大核心 2024年第11期3587-3594,共8页
基于特征嵌入的无监督异常检测方法通常使用patch级特征定位异常。patch级特征在图像级异常检测任务上具有竞争力,但在像素级定位方面存在精度不足的问题。为解决这一问题,提出一种由多尺度记忆库与分割网络组成的像素级异常检测方法 Me... 基于特征嵌入的无监督异常检测方法通常使用patch级特征定位异常。patch级特征在图像级异常检测任务上具有竞争力,但在像素级定位方面存在精度不足的问题。为解决这一问题,提出一种由多尺度记忆库与分割网络组成的像素级异常检测方法 MemAD。首先,通过预训练的特征提取网络对训练集中的正常样本进行特征提取,构建3个尺度下的正样本特征记忆库;其次,在训练分割网络时,计算模拟的伪异常样本特征与记忆库中距离最近的正样本特征的差特征,进一步引导分割网络学习如何定位异常像素。实验结果表明,MemAD在MVTec AD(MVTec Anomaly Detection)数据集上的图像级和像素级接受者操作特征曲线下面积(AUC)分别达到了98.0%和97.4%,优于大多数的现有方法,验证了它在像素级异常定位中的准确性。 展开更多
关键词 计算机视觉 无监督异常检测 特征嵌入 记忆库 语义分割
在线阅读 下载PDF
基于多表征融合的无监督点云异常检测
2
作者 陈子和 陈斌 《计算机应用》 北大核心 2025年第5期1677-1685,共9页
随着工业自动化需求的不断增长,三维点云异常检测在产品质量控制中扮演着越来越重要的角色。然而,现有方法通常依赖单一特征,导致信息损失和精度下降。因此,提出一种基于多表征融合的无监督点云异常检测方法 MRF(Multi-Representation F... 随着工业自动化需求的不断增长,三维点云异常检测在产品质量控制中扮演着越来越重要的角色。然而,现有方法通常依赖单一特征,导致信息损失和精度下降。因此,提出一种基于多表征融合的无监督点云异常检测方法 MRF(Multi-Representation Fusion)。MRF利用多角度旋转和多种着色方案将点云渲染为多模态图像,并使用预训练的二维卷积神经网络提取丰富的语义特征;同时,还采用预训练的Point Transformer提取三维结构特征。之后,通过融合二维图像语义特征和三维结构特征,MRF能够更全面地捕捉点云信息。在异常检测阶段,MRF使用基于正样本记忆库和近邻搜索的方法,可有效地识别异常点云。在MVTec 3D AD数据集上的实验结果表明,MRF的点云级接受者操作特征曲线下面积(AUROC)为0.972,点级区域重叠度(AUPRO)为0.948,显著优于对比方法。可见,该方法的有效性和鲁棒性使它成为工业应用中极具潜力的解决方案。 展开更多
关键词 计算机视觉 点云 无监督异常检测 特征嵌入 记忆库
在线阅读 下载PDF
融合空间-傅里叶域信息的机器人低光环境抓取检测
3
作者 陈路 王怀瑶 +2 位作者 刘京阳 闫涛 陈斌 《计算机应用》 北大核心 2025年第5期1686-1693,共8页
针对现有抓取检测方法无法有效感知稀疏、微弱特征,导致低光环境下机器人抓取检测性能下降的问题,提出一种融合空间-傅里叶域信息的机器人低光环境抓取检测方法。首先,该方法的骨干网络采用编-解码器结构,在网络深层特征与浅层特征融合... 针对现有抓取检测方法无法有效感知稀疏、微弱特征,导致低光环境下机器人抓取检测性能下降的问题,提出一种融合空间-傅里叶域信息的机器人低光环境抓取检测方法。首先,该方法的骨干网络采用编-解码器结构,在网络深层特征与浅层特征融合过程中进行空间域-傅里叶域的特征提取。具体地,在空间域中通过水平和垂直方向的条带卷积捕获全局上下文信息,提取对抓取检测任务敏感的特征;在傅里叶域中分别调整振幅和相位,实现对图像细节和纹理特征的恢复。其次,引入R-CoA(Row-Column Attention)模块平衡图像全局与局部信息,并对图像进行行、列相对位置编码以强化与抓取任务相关的位置信息。最后,在低光Cornell、低光Jacquard以及所构建的低光C⁃Cornell数据集上分别进行验证,所提低光抓取检测方法最高准确率分别达到96.62%、92.01%和95.50%。在低光Cornell数据集(高斯噪声且γ=1.5)上,与GR-ConvNetv2(Generative Residual Convolutional Neural Network v2)、SE⁃ResUNet(Squeeze-and-Excitation ResUNet)相比,所提方法的准确率分别提升2.24个百分点和1.12个百分点。所提方法能够在低光环境下有效提升抓取检测的鲁棒性和准确性,为机器人在低光照条件下的抓取任务提供支持。 展开更多
关键词 机器人 抓取检测 空间-傅里叶域 注意力机制 深度神经网络
在线阅读 下载PDF
基于多粒度共享语义中心关联的文本到人物检索方法
4
作者 康斌 陈斌 +3 位作者 王俊杰 李昱林 赵军智 咸伟志 《计算机应用》 北大核心 2025年第3期808-814,共7页
基于文本的人物检索旨在通过使用文本描述作为查询来识别特定人物。现有的先进方法通常设计多种对齐机制实现跨模态数据在全局和局部的对应关系,然而忽略了不同对齐机制之间的相互影响。因此,提出一种多粒度共享语义中心关联机制,深入... 基于文本的人物检索旨在通过使用文本描述作为查询来识别特定人物。现有的先进方法通常设计多种对齐机制实现跨模态数据在全局和局部的对应关系,然而忽略了不同对齐机制之间的相互影响。因此,提出一种多粒度共享语义中心关联机制,深入探索全局对齐和局部对齐之间的促进和抑制效应。首先,引入一个多粒度交叉对齐模块,并通过增强图像-句子和局部区域-分词之间的交互,实现跨模态数据在联合嵌入空间的多层次对齐;其次,建立一个共享语义中心,将它作为一个可学习的语义枢纽,并通过全局特征和局部特征的关联,增强不同对齐机制之间的语义一致性,促进全局和局部特征的协同作用。在共享语义中心内,计算图像特征和文本特征之间的局部和全局跨模态相似性关系,提供一种全局视角与局部视角的互补度量,并最大限度地促进多种对齐机制之间的正向效应;最后,在CUHK-PEDES数据集上进行实验。结果表明:所提方法在Rank-1指标上较基线方法显著提升了8.69个百分点,平均精度均值(mAP)提升了6.85个百分点。在ICFG-PEDES和RSTPReid数据集上所提方法也取得了优异的性能,明显超越了所有对比方法。 展开更多
关键词 视觉-语言模型 人物检索 全局对齐 局部对齐 共享语义中心
在线阅读 下载PDF
基于时空注意力的空间关联三维形貌重建
5
作者 盖彦辛 闫涛 +2 位作者 张江峰 郭小英 陈斌 《计算机应用》 CSCD 北大核心 2024年第5期1570-1578,共9页
聚焦形貌恢复通过对场景深度和散焦模糊之间的潜在关系进行建模实现三维形貌重建。但现有的三维形貌重建网络无法有效利用图像序列的时序关联进行表征学习,因此,提出一种基于多景深图像序列空间关联特征的深度网络框架——三维空间相关... 聚焦形貌恢复通过对场景深度和散焦模糊之间的潜在关系进行建模实现三维形貌重建。但现有的三维形貌重建网络无法有效利用图像序列的时序关联进行表征学习,因此,提出一种基于多景深图像序列空间关联特征的深度网络框架——三维空间相关水平分析模型(3D SCHAM)进行三维形貌重建。该模型不仅可以精确捕获单帧图像中聚焦区域到离焦区域的边缘特征,而且可有效利用不同图像帧之间的空间依赖性特征。首先,通过构建深度、宽度和感受野复合扩展的网络构造三维形貌重建的时域连续模型,进而确定单点深度结果;其次,引入基于空间关联的注意力模块,充分学习帧与帧间的“邻接性”与“距离性”空间依赖关系;另外,利用残差反转瓶颈进行重采样,以保持跨尺度的语义丰富性。在DDFF 12-Scene真实场景数据集上的实验结果显示,相较于DfFintheWild模型,3D SCHAM在深度值准确度度量的3个阈值1.25,1.25^(2),1.25^(3)上的精确度分别提升了15.34%、3.62%、0.86%,验证了该模型在真实场景的鲁棒性。 展开更多
关键词 三维形貌重建 时空注意力 深度学习 空间依赖关系 深度图
在线阅读 下载PDF
基于DeformableDETR的域自适应目标检测模型在城市街道场景中的应用
6
作者 杨浩 陈斌 李科 《计算机应用》 CSCD 北大核心 2024年第S01期262-267,共6页
针对在特定环境背景条件下训练的城市街道目标检测模型直接应用在另一种环境背景条件下城市街道场景中检测性能下降的问题,提出一种基于Deformable DETR(DEtection TRansformer)的域自适应目标检测模型City-DA-DETR,通过引入域自适应模... 针对在特定环境背景条件下训练的城市街道目标检测模型直接应用在另一种环境背景条件下城市街道场景中检测性能下降的问题,提出一种基于Deformable DETR(DEtection TRansformer)的域自适应目标检测模型City-DA-DETR,通过引入域自适应模块融合主干网络特征与Transformer特征,有效实现特征对齐与知识跨域迁移。首先,域自适应模块利用Transformer解码器输出Token与编码器特征交互,生成多尺度实例特征蒙板(MSIM);其次,实例特征蒙板引导Transformer编码器特征生成多尺度空间注意力机制与通道注意力机制;最后,主干网络特征与编码器特征通过注意力机制融合生成用于跨域特征对齐的语义向量。从Cityscape到Fogy-Cityscape数据集,City-DA-DETR模型的平均精度均值(mAP)达到了43.8%,相较于基线模型SFA(Sequence Feature Alignment)提升了2.5百分点;从Sim10K到Cityscape数据集,City-DA-DETR模型的mAP达到了56.1%,相较于SFA提升了3.5百分点。实验结果表明,City-DA-DETR具有良好的域自适应性,有效实现了不同环境背景城市街道场景的跨域迁移。 展开更多
关键词 城市街道场景 DETR 目标检测 域自适应 注意力机制
在线阅读 下载PDF
改进的CloFormer模型与有序回归相结合的年龄评估方法
7
作者 付帅 郭小英 +2 位作者 白茹意 闫涛 陈斌 《计算机应用》 CSCD 北大核心 2024年第8期2372-2380,共9页
现有的年龄评估方法通常采用基于卷积神经网络(CNN)的有序回归,然而在预测相邻年龄时,CNN难以捕获全局特征表示,进而导致预测精度的下降。为了解决该问题,提出一种新的将改进的CloFormer模型与有序回归相结合的年龄评估方法。相较于传... 现有的年龄评估方法通常采用基于卷积神经网络(CNN)的有序回归,然而在预测相邻年龄时,CNN难以捕获全局特征表示,进而导致预测精度的下降。为了解决该问题,提出一种新的将改进的CloFormer模型与有序回归相结合的年龄评估方法。相较于传统的基于CNN的有序回归,CloFormer在捕捉图像特征时能够利用自注意力机制更好地捕捉图像中不同区域之间的关系,从而更好地学习相邻年龄之间的特征差异。首先,优化CloFormer模型;然后,将优化后的CloFormer模型与有序回归相结合,以便更好地利用年龄序列信息,实现更精准的年龄预测;接着,通过端到端优化训练改进后的CloFormer模型和有序回归模型,更好地学习面部特征和年龄序列的关系;最后,在多个公开数据集上对比实验。实验结果表明,所提方法在CACD、AFAD、UTKFace数据集上的均方根误差(RMSE)分别为7.36、4.62、8.28,与基于CNN的有序回归(OR-CNN)、秩一致性有序回归模型(CORAL)等现有年龄评估方法相比,在CACD数据集上分别减小了0.25、0.05,在AFAD数据集上分别减小了0.18、0.03,在UTKFace数据集上分别减小了0.97、0.53,可见所提方法取得了较好的年龄评估结果。 展开更多
关键词 年龄评估 计算机视觉 特征提取 CloFormer 有序回归 面部特征
在线阅读 下载PDF
基于自蒸馏视觉Transformer的无监督行人重识别
8
作者 贾洁茹 杨建超 +2 位作者 张硕蕊 闫涛 陈斌 《计算机应用》 CSCD 北大核心 2024年第9期2893-2902,共10页
针对视觉Transformer(ViT)缺乏归纳偏置,导致在相对小规模的行人重识别数据上难以学习有意义的视觉表征的问题,提出一种基于自蒸馏视觉Transformer的无监督行人重识别方法。首先,利用ViT的模块化架构,即每个中间块生成的特征维度相同的... 针对视觉Transformer(ViT)缺乏归纳偏置,导致在相对小规模的行人重识别数据上难以学习有意义的视觉表征的问题,提出一种基于自蒸馏视觉Transformer的无监督行人重识别方法。首先,利用ViT的模块化架构,即每个中间块生成的特征维度相同的特性,随机选择一个中间Transformer块并将它送入分类器以得到预测结果;其次,通过最小化随机选择的中间分类器输出与最终分类器输出分布之间的Kullback-Leibler散度,约束中间块的分类预测结果与最终分类器的结果保持一致,据此构建自蒸馏损失函数;最后,通过对聚类级对比损失、实例级对比损失和自蒸馏损失进行联合最小化,对模型进行优化。此外,通过从最终分类器向中间块提供软监督,有效地给ViT模型引入归纳偏置,进而有助于模型学习更鲁棒和通用的视觉表征。与基于TransReID的自监督学习(TransReID-SSL)相比,在Market-1501数据集上,所提方法的平均精度均值(mAP)和Rank-1分别提升1.2和0.8个百分点;在MSMT17数据集上,所提方法的mAP和Rank-1分别提升3.4和3.1个百分点。实验结果表明,所提方法能够有效提高无监督行人重识别的精度。 展开更多
关键词 行人重识别 无监督学习 视觉Transformer 知识蒸馏 特征表示
在线阅读 下载PDF
多模态焊缝图像像素级配准技术
9
作者 黄振荣 黄瑶 +2 位作者 涂旺 王飞 陈斌 《计算机应用》 CSCD 北大核心 2024年第S2期229-233,共5页
为了挖掘多模态工业焊缝图像视觉特征并通过模态翻译的方式进一步提高多模态工业图像的配准效果,提出一种基于模态翻译的多模态焊缝图像像素级配准网络。首先,通过设计跨模态翻译模块赋予网络捕获不同模态工业图像共享特征的感知能力;其... 为了挖掘多模态工业焊缝图像视觉特征并通过模态翻译的方式进一步提高多模态工业图像的配准效果,提出一种基于模态翻译的多模态焊缝图像像素级配准网络。首先,通过设计跨模态翻译模块赋予网络捕获不同模态工业图像共享特征的感知能力;其次,捕获共享特征以进行多模态图像配准,并利用对抗性损失和多层级对比损失提高模态翻译效果;同时,结合跨模态翻译模块与单模态图像配准模块,并通过重构损失提升像素级配准性能;最后,构建多模态工业焊缝图像数据集,并基于此数据集开展对比实验。实验结果表明,相较于DFMIR(Discriminator-Free-Medical-Image-Registration)和IMSE(Indescribable Multi-modal Spatial Evaluator)等现有的先进多模态图像配准模型,所提网络在平均交并比(mIoU)上提升了3.9、3.2个百分点,在平均欧氏距离(aEd)上提升了约16、11个像素点的配准精度,在像素级别配准上取得了较好的结果。 展开更多
关键词 工业焊缝成像 多模态图像配准 模态翻译 共享特征 多层级对比学习
在线阅读 下载PDF
融合视觉特征增强机制的机器人弱光环境抓取检测 被引量:6
10
作者 李淦 牛洺第 +3 位作者 陈路 杨静 闫涛 陈斌 《计算机应用》 CSCD 北大核心 2023年第8期2564-2571,共8页
现有的机器人抓取操作通常在良好光照条件下开展,此时目标细节清晰、区域对比度高,而在夜间、遮挡等弱光环境下目标的视觉特征微弱,会导致现有的机器人抓取检测模型的检测准确率急剧下降。为提高弱光场景下稀疏、微弱抓取特征的表征能力... 现有的机器人抓取操作通常在良好光照条件下开展,此时目标细节清晰、区域对比度高,而在夜间、遮挡等弱光环境下目标的视觉特征微弱,会导致现有的机器人抓取检测模型的检测准确率急剧下降。为提高弱光场景下稀疏、微弱抓取特征的表征能力,提出一种融合视觉特征增强机制的抓取检测模型,通过视觉增强子任务为抓取检测施加特征增强约束。对于抓取检测模块,采用仿U-Net框架的编码器-解码器结构实现特征的高效融合;对于弱光增强模块,从局部、全局层面分别提取纹理、颜色信息,以实现兼顾目标细节与视觉效果的特征增强。此外,分别构建弱光Cornell数据集和弱光Jacquard数据集两个新的弱光抓取基准数据集,并基于上述数据集开展对比实验。实验结果表明,所提弱光抓取检测模型在基准数据集上的准确率分别达到了95.5%和87.4%,与生成抓取卷积神经网络(GGCNN)、生成残差卷积神经网络(GR-ConvNet)等现有抓取检测模型相比,准确率在弱光Cornell数据集提升11.1、1.2个百分点,在弱光Jacquard数据集上提升5.5、5.0个百分点,取得了较好的抓取检测效果。 展开更多
关键词 机器人 抓取检测 弱光成像 深度神经网络 视觉增强
在线阅读 下载PDF
全局时空特征耦合的多景深三维形貌重建 被引量:1
11
作者 张江峰 闫涛 +2 位作者 陈斌 钱宇华 宋艳涛 《计算机应用》 CSCD 北大核心 2023年第3期894-902,共9页
针对现有三维形貌重建模型无法有效融合全局时空信息的问题,设计深度聚焦体积(DFV)模块保留聚焦和离焦的过渡信息,并在此基础上提出全局时空特征耦合(GSTFC)模型提取多景深图像序列的局部与全局的时空特征信息。首先,在收缩路径中穿插3D... 针对现有三维形貌重建模型无法有效融合全局时空信息的问题,设计深度聚焦体积(DFV)模块保留聚焦和离焦的过渡信息,并在此基础上提出全局时空特征耦合(GSTFC)模型提取多景深图像序列的局部与全局的时空特征信息。首先,在收缩路径中穿插3D-ConvNeXt模块和3D卷积层,捕捉多尺度局部时空特征,同时,在瓶颈模块中添加3D-SwinTransformer模块捕捉多景深图像序列局部时序特征的全局关联关系;然后,通过自适应参数层将局部时空特征和全局关联关系融合为全局时空特征,并输入扩张路径引导生成聚焦体积;最后,聚焦体积通过DFV提取序列权重信息,并保留聚焦与离焦的过渡信息,得到最终深度图。实验结果表明,GSTFC在FoD500数据集上的均方根误差(RMSE)相较于最先进的全聚焦深度网络(AiFDepthNet)下降了12.5%,并且比传统的鲁棒聚焦体积正则化的聚焦形貌恢复(RFVR-SFF)模型保留了更多的景深过渡关系。 展开更多
关键词 三维形貌重建 深度学习 有监督学习 时空特征耦合 深度图
在线阅读 下载PDF
基于深度学习的短临降水预报综述 被引量:9
12
作者 马志峰 张浩 刘劼 《计算机工程与科学》 CSCD 北大核心 2023年第10期1731-1753,共23页
短临降水预报是指短期内降水的高分辨率预测,是一项重要但又困难的任务。在深度学习的背景下,它被视为一个基于雷达回波图的时空序列预测问题。降水预测是一个复杂的自我监督任务,由于运动总是在空间和时间维度上发生显著的变化,普通模... 短临降水预报是指短期内降水的高分辨率预测,是一项重要但又困难的任务。在深度学习的背景下,它被视为一个基于雷达回波图的时空序列预测问题。降水预测是一个复杂的自我监督任务,由于运动总是在空间和时间维度上发生显著的变化,普通模型难以应对复杂的非线性时空转换,导致预测模糊。因此,如何进一步提高模型预测性能减少模糊是该领域研究的重点。目前关于短临降水预报的研究仍处于早期阶段,并且对已有的研究工作缺乏系统性的分类和讨论。因此,有必要对该领域进行全面调研。从不同维度全面总结和分析了短临降水预报领域的相关知识,并给出了未来的研究方向,具体内容如下:(1)阐明了短临降水预报的重要意义以及传统预测模型的优缺点;(2)给出了短临降水预报问题的数学定义;(3)全面总结和分析了常见的预测模型;(4)介绍了不同国家和地区的多个开源雷达数据集;(5)简单介绍了用于预测质量评估的度量指标;(6)讨论了不同模型中所使用的不同的损失函数;(7)指明了未来短临降水预报领域的研究方向。 展开更多
关键词 短临降水预报 时空序列预测 天气预报 人工智能 深度学习
在线阅读 下载PDF
熵启发的分级可微分网络架构搜索 被引量:2
13
作者 李建明 陈斌 孙晓飞 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2021年第8期22-28,共7页
网络架构是影响卷积神经网络性能的重要因素,由于传统的人工设计方法效率较低,通过算法自动设计网络架构的方法受到了越来越多的关注。可微分网络架构搜索(DARTS)方法,能高效地自动设计网络架构,但其超网络的构建和架构派生策略也存在... 网络架构是影响卷积神经网络性能的重要因素,由于传统的人工设计方法效率较低,通过算法自动设计网络架构的方法受到了越来越多的关注。可微分网络架构搜索(DARTS)方法,能高效地自动设计网络架构,但其超网络的构建和架构派生策略也存在不足之处。针对其不足之处,本文提出了改进算法。首先,通过量化分析该算法搜索过程中跳连(skip)操作数量的变化,发现共享架构参数的设置导致DARTS算法的超网络存在耦合问题;其次,针对超网络的耦合问题,设计了元胞(cell)分级的超网络,以避免不同层级间cell的相互影响;然后,针对超网络与派生架构在性能表现上存在“鸿沟”的问题,引入架构熵作为目标函数的损失项,以启发超网络的训练。最后,在CIFAR-10数据集上进行架构搜索实验,并分别在CIFAR-10和ImageNet上进行了架构评测实验。在CIFAR-10上的实验结果表明,本文提出的算法解除了不同层级cell间的耦合,提升了自动设计的架构性能,取得了仅2.69%的分类错误率;该架构在ImageNet上的分类错误率为25.9%,实验结果表明搜得的架构具有良好的迁移性。 展开更多
关键词 网络架构搜索 可微分架构搜索 分级超网络 架构熵
在线阅读 下载PDF
优化搜索空间下带约束的可微分神经网络架构搜索 被引量:2
14
作者 李建明 陈斌 +1 位作者 江志伟 覃健 《计算机应用》 CSCD 北大核心 2022年第1期44-49,共6页
可微分架构搜索(DARTS)可高效、自动地设计神经网络架构,但其超网络的构建方式与派生策略的设计之间存在性能“鸿沟”。针对上述问题,提出了优化搜索空间下带约束的可微分神经网络架构搜索算法。首先,以候选操作关联的架构参数为量化指... 可微分架构搜索(DARTS)可高效、自动地设计神经网络架构,但其超网络的构建方式与派生策略的设计之间存在性能“鸿沟”。针对上述问题,提出了优化搜索空间下带约束的可微分神经网络架构搜索算法。首先,以候选操作关联的架构参数为量化指标来分析超网络的训练过程,发现在派生架构中未生效的候选操作none占据了权重最大的架构参数,从而导致算法搜得的架构表现欠佳,针对该问题设计了优化的搜索空间;然后,分析了DARTS超网络与派生架构之间的差异后,以架构参数为基础定义了架构熵,并把架构熵作为DARTS超网络目标函数的约束项,从而促使超网络缩小与派生架构的差异;最后,在CIFAR-10数据集上进行了实验。实验结果表明,所提算法在其中搜得的架构取得了97.17%的分类准确率,综合准确率、参数量和搜索时间优于对比算法。所提出的算法是有效的,提升了搜得架构在CIFAR-10数据集上的准确率。 展开更多
关键词 卷积神经网络 网络架构搜索 可微分架构搜索 架构确定性 架构熵
在线阅读 下载PDF
基于深度对比网络的印刷缺陷检测方法 被引量:2
15
作者 王佑芯 陈斌 《计算机应用》 CSCD 北大核心 2023年第1期250-258,共9页
基于传统图像处理技术的印刷缺陷检测方法鲁棒性差,而基于深度学习的目标检测方法则不完全适用于印刷缺陷检测任务的问题。为解决上述问题,将模板匹配方法中的对比思想与深度学习中的语义特征结合,提出用于印刷缺陷检测任务的深度对比网... 基于传统图像处理技术的印刷缺陷检测方法鲁棒性差,而基于深度学习的目标检测方法则不完全适用于印刷缺陷检测任务的问题。为解决上述问题,将模板匹配方法中的对比思想与深度学习中的语义特征结合,提出用于印刷缺陷检测任务的深度对比网络(CoNet)。首先,提出基于孪生结构的深度对比模块(DCM)在语义空间提取并融合检测图像与参考图像的特征图,挖掘二者间的语义关系;然后,提出基于非对称双通路特征金字塔结构的多尺度变化检测模块(MsCDM),定位并识别印刷缺陷。在公开的印刷电路板缺陷数据集DeepPCB与立金缺陷数据集上,CoNet的平均精度均值(mAP)分别为99.1%和69.8%,与同样采用变化检测思路的最大分组金字塔池化(MP-GPP)和变化检测单次检测器(CD-SSD)相比,分别提升了0.4、3.5个百分点和0.7、2.4个百分点,CoNet的检测精度更高。此外,当输入图像分辨率为640×640时,CoNet的平均耗时为35.7 ms,可见其完全可以满足工业检测任务的实时性要求。 展开更多
关键词 印刷缺陷检测 深度学习 孪生卷积神经网络 特征金字塔 变化检测
在线阅读 下载PDF
改进YOLOv5目标检测模型在城市街道场景中的应用 被引量:1
16
作者 杨浩 陈斌 《计算机应用》 CSCD 北大核心 2023年第S02期83-88,共6页
针对城市街道场景中小目标和密集目标检测准确率不高的问题,提出一种改进的YOLOv5的目标检测模型——City-YOLO。首先利用可变形卷积和Focus模块设计了两种新的下采样模块,使骨干网络(Backbone)与Neck层提取特征信息更准确,同时融合了... 针对城市街道场景中小目标和密集目标检测准确率不高的问题,提出一种改进的YOLOv5的目标检测模型——City-YOLO。首先利用可变形卷积和Focus模块设计了两种新的下采样模块,使骨干网络(Backbone)与Neck层提取特征信息更准确,同时融合了全局特征信息;其次增加一层检测特征层,增强小目标的检测能力;随后将二阶通道注意力机制引入检测特征层,使网络更加关注目标的重要特征,提升网络对密集遮挡目标的检测能力;最后使用Kmeans算法重新设计了先验框,并将它分配到相应的检测特征层。在CityScape数据集上,City-YOLO模型的均值平均精度mAP50与mAP50:95分别达到了54.3%和30.6%;相较于YOLOv5,mAP50与mAP50:95分别提升了5.8和4.0个百分点。实验结果表明,City-YOLO模型有效地实现了高精度城市街道场景目标检测。 展开更多
关键词 城市街道场景 小目标 密集目标 YOLO 可变形卷积 注意力机制
在线阅读 下载PDF
计算机视觉中的终身学习综述 被引量:1
17
作者 陈一驰 陈斌 《计算机应用》 CSCD 北大核心 2023年第6期1785-1795,共11页
终身学习(LLL)作为一种新兴方法打破了传统机器学习的局限性,并赋予了模型能够像人类一样在学习过程中不断积累、优化并转移知识的能力。近年来,随着深度学习的广泛应用,越来越多的研究致力于解决深度神经网络中出现的灾难性遗忘问题和... 终身学习(LLL)作为一种新兴方法打破了传统机器学习的局限性,并赋予了模型能够像人类一样在学习过程中不断积累、优化并转移知识的能力。近年来,随着深度学习的广泛应用,越来越多的研究致力于解决深度神经网络中出现的灾难性遗忘问题和摆脱稳定性-可塑性困境,并将LLL方法应用于各种各样的实际场景中,以推进人工智能由弱向强的发展。针对计算机视觉领域,首先,在图像分类任务中将LLL方法归纳为四大类型:基于数据驱动的方法、基于优化过程的方法、基于网络结构的方法和基于知识组合的方法;然后,介绍了LLL方法在其他视觉任务中的典型应用和相关评估指标;最后,针对现阶段LLL方法的不足之处进行讨论并提出了LLL方法未来发展的方向。 展开更多
关键词 深度学习 终身学习 计算机视觉 灾难性遗忘 稳定性-可塑性困境
在线阅读 下载PDF
基于自监督图像对的弱监督语义分割算法 被引量:1
18
作者 侯孝振 陈斌 《计算机应用》 CSCD 北大核心 2022年第S02期53-59,共7页
为了降低语义分割任务的标注成本,提出一种基于自监督图像对的弱监督语义分割算法Co-Net。首先,将一对图像分别输入骨干网络中提取图像对特征;然后,将特征展开加入位置信息送入编码层中进行编码;接着,将编码特征送入协同注意力模块(CoAM... 为了降低语义分割任务的标注成本,提出一种基于自监督图像对的弱监督语义分割算法Co-Net。首先,将一对图像分别输入骨干网络中提取图像对特征;然后,将特征展开加入位置信息送入编码层中进行编码;接着,将编码特征送入协同注意力模块(CoAM)以及双向自注意力模块(BiAM)中进行信息相互表征;最后,将图像区域掩码模型(MRM)以及图像对匹配(IPM)两种自监督任务用于网络训练,学习图像对中的全局关联以及局部关联,以此得到更加精确的初始化种子。仅使用图像级标签进行弱监督语义分割,在Pascal VOC 2012验证和测试集上分别实现了69.8%和70.3%的平均交并比(mIoU),相较于同样为图像对输入的算法GroupWSSS(Group-Wise Semantic mining for weakly Supervised Semantic Segmentation),验证集、测试集上的mIoU分别提高了1.6、1.8个百分点。实验结果表明,所提算法可以获得更加完整的目标激活区域。 展开更多
关键词 语义分割 弱监督学习 自监督学习 弱监督的语义分割 深度学习
在线阅读 下载PDF
基于动态字典学习的含噪高光谱图像空谱融合
19
作者 杨静 赵建斌 +3 位作者 陈路 池浩田 闫涛 陈斌 《计算机应用》 2025年第9期2941-2948,共8页
针对传统高光谱图像(HSI)空谱融合算法通常采用静态光谱字典,而字典学习与图像融合过程相分离,对含有噪声的空谱融合任务处理效果不佳的问题,提出一种基于动态字典学习(DDL)的含噪HSI空谱融合算法。该算法采用迭代思想,在融合过程中动... 针对传统高光谱图像(HSI)空谱融合算法通常采用静态光谱字典,而字典学习与图像融合过程相分离,对含有噪声的空谱融合任务处理效果不佳的问题,提出一种基于动态字典学习(DDL)的含噪HSI空谱融合算法。该算法采用迭代思想,在融合过程中动态更新字典原子,从而协作完成空谱融合及噪声去除任务。首先,对输入的HSI进行粗去噪,并利用去噪结果初始化光谱字典;其次,利用上述初始化字典对两幅待融合图像进行稀疏表示,以得到中间融合结果;再次,将中间融合结果反馈给字典学习模块,不断更新字典原子,构造动态光谱字典;最后,通过迭代以上过程得到最终的输出图像。在3个遥感HSI数据集上的仿真实验结果表明,所提算法能够在提升图像空间分辨率的同时有效去除噪声。同时,在真实含噪图像波段上的实验结果表明,所提算法能够有效提高融合图像的视觉质量。在Cuprite Mine数据集上,在高斯噪声方差为0.15且放大倍数为8时,与基于广义张量核范数(GTNN)的方法和先去噪后融合的方法AL-NSSR方法相比,所提算法的峰值信噪比(PSNR)分别提升了32.48%和10.72%。 展开更多
关键词 高光谱图像 空谱融合 噪声 光谱字典学习 迭代稀疏表示
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部