期刊文献+
共找到913篇文章
< 1 2 46 >
每页显示 20 50 100
多尺度特征提取与融合的红外图像增强算法 被引量:5
1
作者 李牧 张一朗 柯熙政 《红外与激光工程》 北大核心 2025年第2期240-253,共14页
针对传统的特征融合算法多从单一的尺度上抽取图像的特征,并且在红外图像亮度增强过程中可能导致局部特征信息的丢失与退化而引起红外图像细节分辨率不高的问题,提出了多尺度特征提取与融合的红外图像增强算法,主要由多尺度自适应特征... 针对传统的特征融合算法多从单一的尺度上抽取图像的特征,并且在红外图像亮度增强过程中可能导致局部特征信息的丢失与退化而引起红外图像细节分辨率不高的问题,提出了多尺度特征提取与融合的红外图像增强算法,主要由多尺度自适应特征提取模块、亮度增强迭代函数以及特征融合和图像重建模块构成。首先,提出的多尺度自适应特征提取融合模块保存和融合了来自不同卷积层特征的多尺度信息;然后,改进的亮度增强迭代函数使用了融合特征作为逐像素参数,用于红外图像亮度增强;最后,通过提出的特征融合和图像重建模块,增强了特征在网络中的传播能力,并保持了局部信息的完整性。实验结果表明:多尺度特征提取与融合的红外图像增强算法与其它表现较好的网络相比,峰值信噪比、余弦相似度以及信息熵分别提高了3.7%、1.3%、1.6%。且在测试数据集上根据引用的火灾隐患检测算法判断是否存在火灾隐患进行早期火灾检测,其准确率为97.86%,说明了提出的多尺度特征提取与融合的红外图像增强算法的有效性与可行性。 展开更多
关键词 红外图像 图像增强 深度学习 特征融合 注意力机制
在线阅读 下载PDF
SDENet:基于多尺度注意力质量感知的合成缺陷数据评价网络 被引量:2
2
作者 卢洋 陈林慧 +1 位作者 姜晓恒 徐明亮 《图学学报》 北大核心 2025年第1期94-103,共10页
通过对数据扩增方式合成的缺陷数据进行质量评估,有助于实现缺陷数据高质量扩充,进而缓解缺陷数据不足导致的检测模型性能不佳问题。针对现有质量评价算法在评估合成缺陷数据质量时更关注数据的失真特性而忽略了对数据缺陷属性考量的问... 通过对数据扩增方式合成的缺陷数据进行质量评估,有助于实现缺陷数据高质量扩充,进而缓解缺陷数据不足导致的检测模型性能不佳问题。针对现有质量评价算法在评估合成缺陷数据质量时更关注数据的失真特性而忽略了对数据缺陷属性考量的问题,提出一种基于注意力特征增强(AFE)和多尺度注意力质量感知(MAQP)的模型SDENet,综合考虑数据的失真特性和缺陷属性进行质量评价。首先,AFE通过双分支池化操作提高模型对不同尺寸、位置缺陷的泛化能力,并结合注意力机制增强模型对特征的表达。其次,MAQP对AFE增强后的特征进行向量化与融合处理,以更好地感知合成缺陷数据质量。最后,对融合后的特征进行质量评估,得到最终的评估分数。在构建的合成道路裂缝缺陷数据集上进行实验,结果表明,SDENet模型在RMSE,RMAE,PLCC和SROCC指标上均取得最优结果,比次优模型依次提升10.7%,5.0%,1.8%和1.8%,验证了模型的有效性。在失真数据集TID2013上,SDENet模型也取得较有竞争的结果,在PLCC和SROCC指标上依次达到0.902和0.876。 展开更多
关键词 注意力机制 特征增强 特征融合 合成缺陷数据 质量评价
在线阅读 下载PDF
基于注意力机制和特征融合的井下轻量级人员检测方法 被引量:1
3
作者 王帅 杨伟 +2 位作者 李宇翔 吴佳奇 杨维 《煤炭科学技术》 北大核心 2025年第4期383-392,共10页
煤矿井下环境复杂,安全隐患较多,人员检测是保障煤矿安全生产和建设智慧矿山的重要内容。常用的检测算法不仅参数量大,对设备算力要求高,而且在煤矿低照度环境下的应用效果不理想。针对上述问题,基于YOLOv5提出一种用于煤矿井下的轻量... 煤矿井下环境复杂,安全隐患较多,人员检测是保障煤矿安全生产和建设智慧矿山的重要内容。常用的检测算法不仅参数量大,对设备算力要求高,而且在煤矿低照度环境下的应用效果不理想。针对上述问题,基于YOLOv5提出一种用于煤矿井下的轻量级人员检测方法YOLOv5-CWG。首先,在骨干网络中嵌入坐标注意力机制(Coordinate Attention)自适应的调整特征图中每个通道的权重,增强特征的表达能力,提高模型在低照度、粉尘影响严重以及对比度低的不利条件下对待检测人员目标的关注度,更精确地定位和识别人员目标。其次,通过加权多尺度特征融合模块(Weighted multiscale feature fusion moule)引入可学习的权重赋予特征层不同的关注度,使网络有效融合浅层位置特征和高层语义信息,增强模型的信息提取能力,更好地区分目标区域和背景噪声,从而提高模型的抗干扰能力。增加1个P2层的检测头,提升较小目标的检测和定位精度。引入SIoU损失函数代替原损失函数加快模型收敛。最后,引入Ghost模块优化骨干网络,可以在不损失模型性能的前提下降低模型的参数量,提高检测速度,使得模型更容易部署在资源受限的设备上。结果表明,提出的YOLOv5-CWG算法在煤矿井下人员检测数据集(UMPDD)上的mAP达到了97.5%,相较于YOLOv5s提高了7.3%,计算量减少了27.6%,FPS提高了6.3。所提算法显著提高了煤矿井下人员检测精度,有效解决了亮度低和光照不均引起的人员检测困难问题。 展开更多
关键词 人员检测 YOLOv5 注意力机制 轻量化 特征融合
在线阅读 下载PDF
MC-Res2UNet网络在盐体识别中的应用 被引量:1
4
作者 王新 张傲 +1 位作者 张薇 陈同俊 《石油地球物理勘探》 北大核心 2025年第1期21-29,共9页
精确识别埋藏在地表下的盐体对于石油和天然气勘探有重大意义。传统的语义分割算法依然存在对盐体的识别精度较低、边缘识别效果较差、识别效率低等问题。文中提出一种基于MC-Res2UNet网络的盐体识别方法,该网络整体架构由U-Net网络改... 精确识别埋藏在地表下的盐体对于石油和天然气勘探有重大意义。传统的语义分割算法依然存在对盐体的识别精度较低、边缘识别效果较差、识别效率低等问题。文中提出一种基于MC-Res2UNet网络的盐体识别方法,该网络整体架构由U-Net网络改进。首先,使用Res2Net网络作为编码器提取盐体特征信息;然后,在解码层中的卷积之后引入CBAM注意力模块重新分配盐体空间信息和通道信息,抑制不重要的信息;最后,利用多尺度特征融合模块融合空间信息和语义信息,提高盐体识别精度。将文中提出的MC-Res2UNet模型用于TGS盐体数据集进行验证,像素准确率可达到96.6%,交并比可达到86.8%,优于传统的DeepLabV3+、DANet等语义分割方法,对地下盐体有更好的识别效果。 展开更多
关键词 盐体识别 U-Net 多尺度特征融合 注意力机制
在线阅读 下载PDF
基于GAN和多尺度空间注意力的多模态医学图像融合 被引量:3
5
作者 林予松 李孟娅 +1 位作者 李英豪 赵哲 《郑州大学学报(工学版)》 CAS 北大核心 2025年第1期1-8,共8页
针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图... 针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图像;其次,整个对抗网络框架采用双鉴别器结构,使得生成器生成的融合图像同时保留多个模态图像的显著特征;最后,构建一种多尺度空间注意力作为编码器进行特征提取的基本模块,利用多尺度结构充分捕获并保留源图像的多尺度特征,并且引入空间注意力更好地保留源图像的结构和细节信息。全脑图谱数据库上的实验结果表明:所提算法生成的融合图像不仅纹理细节更为丰富,有助于人类视觉观察,而且在3种不同类型的医学图像融合任务上平均梯度、峰值信噪比、互信息、视觉信息保真度等客观评价指标的平均值分别达到0.3023、20.7207、1.4414、0.6498,与其他先进的算法相比具有一定的优势。 展开更多
关键词 图像融合 多模态医学图像 生成对抗网络 特征金字塔 注意力机制
在线阅读 下载PDF
多域时空层次图神经网络的空气质量预测 被引量:4
6
作者 马汉达 吴亚东 《计算机应用》 北大核心 2025年第2期444-452,共9页
在协同融合气象、空间和时间三大信息的时空混合模型中,时间变化建模通常在一维空间中完成。针对一维序列局限于滑动窗口和缺乏对多尺度特征的灵活提取的问题,提出一种多域时空层次图神经网络(MST-HGNN)模型。首先,构建城市全局尺度和... 在协同融合气象、空间和时间三大信息的时空混合模型中,时间变化建模通常在一维空间中完成。针对一维序列局限于滑动窗口和缺乏对多尺度特征的灵活提取的问题,提出一种多域时空层次图神经网络(MST-HGNN)模型。首先,构建城市全局尺度和站点局部尺度的两级层次图,从而进行空间关系学习;其次,将一维空气质量序列转换为一组基于多个周期的二维张量,并在二维空间上通过多尺度卷积进行周期解耦以捕获频域特征;同时,在一维空间中利用长短期记忆(LSTM)网络拟合时域特征;最后,为避免聚合冗余信息,设计一种门控机制融合模块用于频域和时域特征的多域特征融合。在Urban-Air数据集和长三角城市群数据集上的实验结果表明,相较于多视图多任务时空图卷积网络模型(M2),所提模型在预测第1 h、3 h、6 h、12 h空气质量的平均绝对误差(MAE)和均方根误差(RMSE)均低于对比模型。可见,MST-HGNN能在频域上解耦复杂时间模式,利用频域信息弥补时域特征建模的局限性,并结合时域信息更全面地预测空气质量变化。 展开更多
关键词 空气质量预测 多域特征融合 时空特征 周期解耦 门控机制融合 图神经网络
在线阅读 下载PDF
基于多模态信息融合的中文隐式情感分析 被引量:4
7
作者 张换香 李梦云 张景 《计算机工程与应用》 北大核心 2025年第2期179-190,共12页
隐式情感表达中缺乏显式情感词,给隐式情感分析带来一定的挑战。为有效解决此问题,借助外部信息是有效解决隐式情感分析的方法之一。与现有的主要借助单一文本信息的研究不同,提出一种融合多模态信息(包括语音和视频)的隐式情感分析方... 隐式情感表达中缺乏显式情感词,给隐式情感分析带来一定的挑战。为有效解决此问题,借助外部信息是有效解决隐式情感分析的方法之一。与现有的主要借助单一文本信息的研究不同,提出一种融合多模态信息(包括语音和视频)的隐式情感分析方法。通过从语音中提取音调、强度等声学特征,以及从视频中捕捉面部表情等视觉特征,辅助理解隐式情感。利用BiLSTM网络挖掘各单模态内部的上下文信息;结合多头互注意力机制分别捕捉与文本相关的语音和视觉特征,并通过迭代优化,减少非文本模态的低阶冗余信息。此外,通过设计以文本为中心的交叉注意融合模块,强化隐式文本特征表示,并处理模态间的异质性,增强隐式情感分析的综合性能。在CMUMOSI、CMU-MOSEI、MUMETA数据集上的实验结果表明,所提出的模型优于其他基线模型。这种针对隐式情感分析的多模态处理策略,充分利用语音和视觉外部知识,更全面、准确地捕捉隐式情感表达,有效提升了隐式情感分析的准确率。 展开更多
关键词 隐式情感分析 深度神经网络 多模态 注意力机制 特征融合
在线阅读 下载PDF
融合多尺度特征与注意力的小样本目标检测 被引量:1
8
作者 张英俊 甘望阳 +1 位作者 谢斌红 张睿 《小型微型计算机系统》 北大核心 2025年第3期689-696,共8页
针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatia... 针对现有小样本目标检测模型存在的尺度变化问题,支持集与查询集之间的外观变化、遮挡导致的误检与漏检问题,本文提出一种融合多尺度特征与注意力的小样本目标检测模型.首先,采用ResNet-101网络进行特征提取,同时引入ASPP(Atrous Spatial Pyramid Pooling)模块获取不同的感受野,以捕获目标细节信息的多尺度特征.其次,采用Bi-FPN网络进行多尺度特征融合,获得更具代表性的查询特征与支持特征,有效缓解尺度变化问题.然后,利用提出的注意力引导特征增强模块对查询特征与支持特征进行自身关注,使得它们具有更好的判别能力,由此促进查询特征与支持特征的融合,以更好地应对外观变化和遮挡带来的挑战,从而缓解误检、漏检问题.最后,将分类头与边界框回归头进行解耦,分别对RPN网络基于细粒度查询特征产生的候选区域进行目标分类与目标定位.在PASCAL VOC与MS COCO数据集上的实验结果表明,所提模型的检测性能优于主流的小样本目标检测模型,相较于基线模型DCNet,mAP平均分别提升了3.5%与2.1%. 展开更多
关键词 小样本学习 元学习 目标检测 多尺度特征融合 注意力机制
在线阅读 下载PDF
结合注意力特征融合的路面裂缝检测 被引量:2
9
作者 谢永华 厉涛 柏勇 《计算机工程与设计》 北大核心 2025年第1期307-313,共7页
为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重... 为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重,突出有用信息,解决裂缝漏检问题;在编码器部分,改进浅层特征与深层特征的选取方式,提升特征融合效果和检测精度。实验结果表明,该网络在各项指标上均优于其它对比网络,具有较高的检测精度。 展开更多
关键词 裂缝检测 深度学习 语义分割 卷积网络 注意力机制 特征融合 特征提取
在线阅读 下载PDF
基于注意力机制的特征融合推荐模型 被引量:1
10
作者 马汉达 李腾飞 《计算机工程与科学》 北大核心 2025年第5期902-911,共10页
针对目前推荐系统难以获得特征信息,缺乏有效的方法来表示特征信息的权重的问题,提出了一种基于注意力机制与特征融合的推荐模型FFADeepCF_SPS。首先,针对特征表示不够充分的问题,使用因子分解机融合特征,将特征从一维扩展到高维,从而... 针对目前推荐系统难以获得特征信息,缺乏有效的方法来表示特征信息的权重的问题,提出了一种基于注意力机制与特征融合的推荐模型FFADeepCF_SPS。首先,针对特征表示不够充分的问题,使用因子分解机融合特征,将特征从一维扩展到高维,从而获得特征的低阶表示,然后使用深度神经网络学习高阶特征,并通过一个全连接层将2种特征组合起来,以获得所需的特征表示;其次,针对单头注意力机制过度倾斜权重的问题,使用将输入切分成多个单头分别计算其注意力权重的多头注意力机制,再经由线性变换将各结果进行拼接,获得最终的输出;最后,结合上述2点构建了基于注意力机制与特征融合的推荐模型。为了验证模型的有效性,在4个公开数据集上与基线模型GMF、DeepCF_SPS和CNN-BiLSTM进行了对比实验以及消融实验。实验结果表明,在不同规模的数据集上,所提模型与基线模型相比在MSE、RMSE、MAE评价指标上表现出的性能均更优。 展开更多
关键词 注意力机制 特征融合 推荐模型 评分预测
在线阅读 下载PDF
改进Faster R-CNN的钢材表面缺陷检测 被引量:1
11
作者 冷岳峰 刘正 +1 位作者 徐宝祎 李志轩 《机械科学与技术》 北大核心 2025年第1期75-83,共9页
钢材表面缺陷检测是工业生产中至关重要的一项检测工作,针对钢材表面缺陷检测中漏检以及对于细小缺陷检测精度不佳等问题,提出了一种改进Faster R-CNN算法。在FPN(Feature pyramid networks)与RPN(Region proposal network)之间引入特... 钢材表面缺陷检测是工业生产中至关重要的一项检测工作,针对钢材表面缺陷检测中漏检以及对于细小缺陷检测精度不佳等问题,提出了一种改进Faster R-CNN算法。在FPN(Feature pyramid networks)与RPN(Region proposal network)之间引入特征融合模块与轻量化通道注意力模块,增加模型对精细特征的捕捉能力。改进模型在NEU-DET数据集上的实验结果显示,最终mAP(Mean average precision,记为m_(AP))值为80.2%,比原始模型提高了12.6%,FPS提高了40.9%。该算法能够有效提升钢材表面缺陷的检测精度,为钢材表面缺陷自动检测提供参考。 展开更多
关键词 缺陷检测 特征融合 通道注意力机制 改进Faster R-CNN算法
在线阅读 下载PDF
基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法 被引量:1
12
作者 李海燕 乔仁超 +1 位作者 李海江 陈泉 《东北大学学报(自然科学版)》 北大核心 2025年第1期26-34,共9页
为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均... 为解决现有图像去雾算法因缺乏全局上下文信息、处理分布不均匀的雾时效果差且复用细节信息时引入噪声的缺陷,提出了基于全局残差注意力和门控特征融合的CNN-Transformer去雾算法.首先,引入全局残差注意力机制编码模块自适应地提取非均匀雾区的细节特征,设计跨维度通道空间注意力优化信息权重.然后,提出全局建模Transformer模块加深编码器的特征提取过程,设计带有并行卷积的Swin Transformer捕捉特征之间的依赖关系.最后,设计门控特征融合解码模块复用图像重建所需的纹理信息,滤除不相关的雾噪声,提高去雾性能.在4个公开数据集上进行定性和定量实验,实验结果表明:所提算法能够有效地处理非均匀雾区域,重建纹理细腻且语义丰富的高保真无雾图像,其峰值信噪比和结构相似性指数都优于经典对比算法. 展开更多
关键词 图像去雾 全局残差注意力机制 CNN-Transformer架构 门控特征融合 图像重建
在线阅读 下载PDF
基于LDF-YOLO的小目标检测方法
13
作者 刘洋 任旭虎 +1 位作者 刘宝弟 刘伟锋 《电子测量技术》 北大核心 2025年第12期156-165,共10页
小目标检测是计算机视觉中极具挑战性的任务,现有的检测算法复杂度高、计算量大且检测精度低导致了漏检和误检的问题,本文针对小目标的独有特征提出了LDF-YOLO算法以提高检测精度并降低漏检率。首先是对Head部分的改进,在特征融合网络... 小目标检测是计算机视觉中极具挑战性的任务,现有的检测算法复杂度高、计算量大且检测精度低导致了漏检和误检的问题,本文针对小目标的独有特征提出了LDF-YOLO算法以提高检测精度并降低漏检率。首先是对Head部分的改进,在特征融合网络中引入了特征转换模块,设计了针对微小物体的检测头LP-Detect;其次,借鉴残差门控机制和局部特征增强机制设计了LR-C2f模块,增强模型提取局部特征的能力;最后,融入了局部特征增强模块,以强化骨干网络提取小目标信息的能力。在公开数据集Tiny Person上,LDF-YOLO比原YOLOv8在mAP0.5上提高了4.5%,召回率提高了5.5%,实验结果验证了改进方法的有效性,同时在NWPU VHR-10和VisDrone2019数据集上做了泛化对比实验,经实验表明各项指标均有提升。 展开更多
关键词 小目标检测 YOLOv8 残差门控机制 特征转换 特征融合
在线阅读 下载PDF
基于自适应特征增强和融合的舰载机着舰拉制状态识别
14
作者 王可 刘奕阳 +3 位作者 杨杰 鲁爱国 李哲 徐明亮 《上海交通大学学报》 北大核心 2025年第2期274-282,共9页
拉制状态识别能辅助着舰信号官及时准确地形成后续指挥决策,是舰载机着舰引导的重要环节.提出一种基于自适应特征增强和融合的拉制状态识别方法,包含基于注意力机制的特征增强模块,通过分割特征图、串联空间域和通道域增强视觉表征能力... 拉制状态识别能辅助着舰信号官及时准确地形成后续指挥决策,是舰载机着舰引导的重要环节.提出一种基于自适应特征增强和融合的拉制状态识别方法,包含基于注意力机制的特征增强模块,通过分割特征图、串联空间域和通道域增强视觉表征能力;利用多尺度特征融合模块,将高分辨率浅层特征与语义信息丰富的深层特征进行融合,充分利用上下文语义信息.基于所提方法,设计基于可穿戴增强现实设备的着舰拉制状态识别原型系统;构建着舰作业虚实融合数据集以评估方法性能.结果表明,所提算法综合性能优于基线算法,能满足拉制状态识别的应用需求. 展开更多
关键词 舰载机 阻拦着舰 特征融合 注意力机制 状态识别
在线阅读 下载PDF
三维人体姿态估计中的多尺度时空特征融合
15
作者 张宇 刘骊 +2 位作者 付晓东 刘利军 彭玮 《计算机辅助设计与图形学学报》 北大核心 2025年第1期75-88,共14页
针对视频输入的单人三维人体姿态估计中表征不精确、融合不充分、结果不平滑的问题,提出三维人体姿态估计的多尺度时空特征融合方法.首先在空域定义关节点、肢体和上/下身人体标记并通过位置嵌入表示人体的空间多尺度特征;然后结合自注... 针对视频输入的单人三维人体姿态估计中表征不精确、融合不充分、结果不平滑的问题,提出三维人体姿态估计的多尺度时空特征融合方法.首先在空域定义关节点、肢体和上/下身人体标记并通过位置嵌入表示人体的空间多尺度特征;然后结合自注意力机制和多层感知机构建空间多尺度特征融合模块,融合关节点、肢体和上/下身三个空间多尺度特征,得到初步姿态特征序列;最后建立时序多尺度编码进行时序特征融合获得最终姿态特征序列,并通过时序解码,优化生成细化的三维人体姿态.在Human3.6M数据集上的实验结果表明,所提方法的平均每关节位置P-MPJPE和速度误差MPJVE分别为33.6和2.4,较对比方法降低了2.3%和4.0%,能够降低计算复杂度,提高三维人体姿态估计精度,生成准确、平滑的三维人体姿态估计结果.此外,在HumanEva-I数据集的测试结果表明,所提方法也具有一定的泛化性. 展开更多
关键词 三维人体姿态估计 多尺度特征 自注意力机制 时空特征融合 时序编码
在线阅读 下载PDF
基于改进SNN的列车轮对踏面缺陷识别方法
16
作者 何静 黄聪聪 +1 位作者 张昌凡 贾林 《铁道学报》 北大核心 2025年第1期91-100,共10页
列车轮对踏面缺陷识别是保障列车轮轨系统安全服役的关键步骤。然而,轮对踏面缺陷类型多样复杂、类别不平衡,现有卷积神经网络算法难以对其进行准确识别。为此,提出基于改进脉冲神经网络(SNN)的列车轮对不平衡踏面缺陷识别方法。采用混... 列车轮对踏面缺陷识别是保障列车轮轨系统安全服役的关键步骤。然而,轮对踏面缺陷类型多样复杂、类别不平衡,现有卷积神经网络算法难以对其进行准确识别。为此,提出基于改进脉冲神经网络(SNN)的列车轮对不平衡踏面缺陷识别方法。采用混合卷积编码模块,通过提高特征多样性稀疏表达,减少编码细节信息丢失;提出脉冲金字塔拆分注意网络,考虑多尺度空间信息跨通道交互能力,以提取缺陷的多尺度特征;提出一种新的交叉注意力模块,提取不同层级特征的空间全局信息,通过交叉校准以增强输入特征,抑制噪声等无用特征;通过不平衡比例达10∶1的踏面缺陷数据集对该识别方法进行试验验证。验证结果表明,该方法能够有效提高模型的识别精度,并且对少数类别缺陷也有较高的识别率。 展开更多
关键词 轮对踏面 缺陷识别 脉冲神经网络 特征融合 注意力机制
在线阅读 下载PDF
基于多重注意力机制的图像雨滴去除方法
17
作者 陈羽中 林闽沪 +1 位作者 陈友昆 牛玉贞 《计算机辅助设计与图形学学报》 北大核心 2025年第5期894-904,共11页
图像雨滴去除任务的目标是对于给定的雨滴图像去除其镜头上遮挡的附着雨滴,还原出真实的干净图像,其在计算机视觉下游任务中有着至关重要的作用.由于已有的图像雨滴去除方法没有考虑雨滴所具有的空间位置局部性和尺度多样性,雨滴去除效... 图像雨滴去除任务的目标是对于给定的雨滴图像去除其镜头上遮挡的附着雨滴,还原出真实的干净图像,其在计算机视觉下游任务中有着至关重要的作用.由于已有的图像雨滴去除方法没有考虑雨滴所具有的空间位置局部性和尺度多样性,雨滴去除效果不理想.为缓解上述问题,提出一种基于多重注意力机制的图像雨滴去除方法.首先,为了适应雨滴的空间位置局部性和尺度多样性,提出结合多尺度特征提取模块和多重注意力模块构建编码器-解码器架构,其中多重注意力模块融合了像素、通道和空间注意力,能够自适应地匹配雨滴的空间位置局部性.此外,设计了一种迭代式图像特征融合模块,在融合解码器特征和雨滴图像得到初步去雨图像后,采用初步去雨图像加强解码器特征,得到进一步的细化特征,再融合初步去雨图像和细化特征得到最终去雨图像.在雨滴图像测试集Raindrop上实验结果表明,与其他方法相比,所提方法能够有效地去除图像中的雨滴,进一步提升雨滴去除的性能,比对比方法中最优的方法在PSNR指标上提升了0.25 dB. 展开更多
关键词 图像雨滴去除 注意力机制 多尺度特征 特征融合
在线阅读 下载PDF
融合CNN与Transformer的遥感影像道路信息提取
18
作者 曲海成 王莹 +1 位作者 刘腊梅 郝明 《自然资源遥感》 北大核心 2025年第1期38-45,共8页
利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络... 利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络(convolutional neural networks,CNN)和Transformer中,然后,采用了双分支融合模块(shuffle attention dual branch fusion block,SA-DBF)来有效地结合这2个分支学习到的特征,从而实现全局信息与局部信息的融合。其中,双分支融合模块通过细粒度交互对这2个分支的特征进行建模,同时利用多重注意力机制充分提取特征图的通道和空间信息,并抑制掉无效的噪声信息。在公共数据集Massachusetts道路数据集上对模型进行测试,准确率(overall accuracy,OA)、交并比(intersection over union,IoU)和F 1等评价指标分别达到98.04%,88.03%和65.13%;与主流方法U-Net和TransRoadNet等进行比较,IoU分别提升了2.01个百分点和1.42个百分点,实验结果表明所提出的方法优于其他的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 级联神经网络 TRANSFORMER 特征融合 注意力机制
在线阅读 下载PDF
跨模态自适应特征融合的视觉问答方法
19
作者 陈巧红 项深祥 +1 位作者 方贤 孙麒 《哈尔滨工业大学学报》 北大核心 2025年第4期94-104,共11页
为提高视觉问答(VQA)中跨模态融合与交互的精确度,减少多模态特征信息的丢失,提出了一种新颖的基于跨模态自适应特征融合的视觉问答方法。首先,该方法设计了卷积自注意力单元,包含自注意力层和空洞卷积层,前者用于捕捉全局特征信息,后... 为提高视觉问答(VQA)中跨模态融合与交互的精确度,减少多模态特征信息的丢失,提出了一种新颖的基于跨模态自适应特征融合的视觉问答方法。首先,该方法设计了卷积自注意力单元,包含自注意力层和空洞卷积层,前者用于捕捉全局特征信息,后者用于捕捉视觉对象间的空间关系。其次,通过自适应特征融合层,将全局关系与空间关系进行有效结合,使模型在处理图像特征时能够同时考虑全局关系和视觉对象之间的关联性,从而克服了传统注意力机制忽视空间关系的问题。最后,基于不同模态特征在答案预测中贡献程度的差异,该方法还构建了多模态门控融合模块,根据多模态特征间的重要程度自适应地融合特征,减少多模态信息的丢失,同时不会带来额外的计算资源开销。研究结果表明,该方法在未使用额外数据集预训练的情况下,在VQA2.0的测试-开发集、测试-标准集和GQA数据集上的整体准确率分别达到71.58%、72.00%、58.14%,显著优于传统自注意力方法,该研究成果可为跨模态特征融合领域提供了重要的参考和借鉴。 展开更多
关键词 视觉问答(VQA) 特征融合 多模态 注意力机制 门控机制
在线阅读 下载PDF
改进ConvNeXt的无线胶囊内镜图像分类模型
20
作者 王向 崔倩倩 +3 位作者 张晓明 王建超 王震洲 宋佳霖 《计算机应用》 北大核心 2025年第6期2016-2024,共9页
针对无线胶囊内镜(WCE)图像分类模型存在的仅针对单一疾病或局限于某个特定器官,而难以适应临床需求的问题,提出一种改进ConvNeXt-T(ConvNeXt Tiny)的WCE图像分类模型。首先,在模型特征提取过程中引入简单无参注意力模块(SimAM),使模型... 针对无线胶囊内镜(WCE)图像分类模型存在的仅针对单一疾病或局限于某个特定器官,而难以适应临床需求的问题,提出一种改进ConvNeXt-T(ConvNeXt Tiny)的WCE图像分类模型。首先,在模型特征提取过程中引入简单无参注意力模块(SimAM),使模型关注WCE图像的关键区域,从而精准捕捉病变区域边界和纹理等细节特征;其次,设计全局上下文多尺度特征融合(GC-MFF)模块;先通过全局上下文模块(GC Block)优化模型的全局上下文建模能力,再融合浅层和深层的多尺度特征以获得更具表征能力的WCE图像特征;最后,针对WCE图像类内差异大的问题,优化交叉熵(CE)损失函数。在WCE数据集上的实验结果表明,相较于原始模型ConvNeXt-T,所提模型在准确率和F1值上分别提升了2.96和3.16个百分点;与主流分类模型中性能表现最好的Swin-B(Swin Transformer Base)模型相比,所提模型在参数量上减少了67.4%,在准确率和F1值上分别提升了0.51和0.67个百分点。以上表明所提模型具有更好的分类性能,能有效辅助医生进行准确的消化道疾病诊断。 展开更多
关键词 胶囊内镜 图像分类 ConvNeXt 注意力机制 多尺度特征融合
在线阅读 下载PDF
上一页 1 2 46 下一页 到第
使用帮助 返回顶部