期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于多尺度编码互补注意力网络的光伏缺陷检测 被引量:3
1
作者 陈海永 袁乐 +1 位作者 王世杰 赵参参 《太阳能学报》 EI CAS CSCD 北大核心 2023年第10期191-197,共7页
由于光伏组件的电致发光(EL)缺陷存在微小、微弱的特点,导致EL图像缺陷检测是一项具有挑战性的任务,因此,提出多尺度编码互补注意力网络(MCECAN)。MCECAN的主干和预测头遵从YOLO系列设计,网络颈部应用多尺度编码互补注意力模块(MCECAM)... 由于光伏组件的电致发光(EL)缺陷存在微小、微弱的特点,导致EL图像缺陷检测是一项具有挑战性的任务,因此,提出多尺度编码互补注意力网络(MCECAN)。MCECAN的主干和预测头遵从YOLO系列设计,网络颈部应用多尺度编码互补注意力模块(MCECAM)。该模块前端利用多尺度编码器聚合多尺度信息、增强全局信息,后端互补坐标注意力建立特征图通道间的依赖关系,突出缺陷特征并抑制背景干扰,提高网络对微小、微弱目标的检测能力。在包含5537张EL图像的数据集上,该方法取得了优秀的检测性能。 展开更多
关键词 光伏组件 缺陷检测 卷积神经网络 多尺度编码器 互补坐标注意力
在线阅读 下载PDF
基于单目RGB图像的三维手部姿态估计方法
2
作者 杨冰 徐楚阳 +1 位作者 姚金良 向学勤 《浙江大学学报(工学版)》 北大核心 2025年第1期18-26,共9页
现有的三维手部姿态估计方法大多基于Transformer技术,未充分利用高分辨率下的局部空间信息,为此提出基于改进FastMETRO的三维手部姿态估计方法.引入可变形注意力机制,使得编码器的设计不再受限于图像特征序列长度;引入交错更新多尺度... 现有的三维手部姿态估计方法大多基于Transformer技术,未充分利用高分辨率下的局部空间信息,为此提出基于改进FastMETRO的三维手部姿态估计方法.引入可变形注意力机制,使得编码器的设计不再受限于图像特征序列长度;引入交错更新多尺度特征编码器来融合多尺度特征,强化生成手部姿态;引入图卷积残差模块来挖掘网格顶点间的显式语义联系.为了验证所提方法的有效性,在数据集FreiHAND、HO3D V2和HO3D V3上开展训练及评估实验.结果表明,所提方法的回归精度优于现有先进方法,在FreiHAND、HO3D V2、HO3D V3上的普鲁克对齐-平均关节点误差分别为5.8、10.0、10.5 mm. 展开更多
关键词 三维手部姿态估计 TRANSFORMER 可变形注意力机制 交错更新多尺度特征编码器 神经网络
在线阅读 下载PDF
BDMFuse:Multi-scale network fusion for infrared and visible images based on base and detail features
3
作者 SI Hai-Ping ZHAO Wen-Rui +4 位作者 LI Ting-Ting LI Fei-Tao Fernando Bacao SUN Chang-Xia LI Yan-Ling 《红外与毫米波学报》 2025年第2期289-298,共10页
The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method f... The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method for infrared and visible image fusion is proposed.The encoder designed according to the optimization objective consists of a base encoder and a detail encoder,which is used to extract low-frequency and high-frequency information from the image.This extraction may lead to some information not being captured,so a compensation encoder is proposed to supplement the missing information.Multi-scale decomposition is also employed to extract image features more comprehensively.The decoder combines low-frequency,high-frequency and supplementary information to obtain multi-scale features.Subsequently,the attention strategy and fusion module are introduced to perform multi-scale fusion for image reconstruction.Experimental results on three datasets show that the fused images generated by this network effectively retain salient targets while being more consistent with human visual perception. 展开更多
关键词 infrared image visible image image fusion encoder-decoder multi-scale features
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部