期刊文献+
共找到109篇文章
< 1 2 6 >
每页显示 20 50 100
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
1
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
自适应卷积注意力与掩码结构协同的显著目标检测
2
作者 朱磊 袁金垚 +1 位作者 王文武 蔡小嫚 《电子与信息学报》 北大核心 2025年第1期260-270,共11页
显著目标检测(SOD)旨在模仿人类视觉系统注意力机制和认知机制来自动提取场景中的显著物体。虽然现有基于卷积神经网络(CNN)或Transformer的模型不断刷新该领域方法的性能,但较少研究关注以下两个问题:(1)此领域多数方法常采用逐像素点... 显著目标检测(SOD)旨在模仿人类视觉系统注意力机制和认知机制来自动提取场景中的显著物体。虽然现有基于卷积神经网络(CNN)或Transformer的模型不断刷新该领域方法的性能,但较少研究关注以下两个问题:(1)此领域多数方法常采用逐像素点的密集预测方式以获取像素显著值,然而该方式不符合基于人类视觉系统的场景解析机制,即人眼通常对语义区域进行整体分析而非关注像素级信息;(2)增强上下文信息关联在SOD任务中受到广泛关注,但通过Transformer主干结构获取长程关联特征不一定具有优势。SOD应更关注目标在适当区域内其中心-邻域差异性而非全局长程依赖。针对上述问题,该文提出一种新的显著目标检测模型,将CNN形式的自适应注意力和掩码注意力集成到网络中,以提高显著目标检测的性能。该算法设计了基于掩码感知的解码模块,通过将交叉注意力限制在预测的掩码区域来感知图像特征,有助于网络更好地聚焦于显著目标的整体区域。同时,该文设计了基于卷积注意力的上下文特征增强模块,与Transformer逐层建立长程关系不同,该模块仅捕获最高层特征中的适当上下文关联,避免引入无关的全局信息。该文在4个广泛使用的数据集上进行了实验评估,结果表明,该文提出的方法在不同场景下均取得了显著的性能提升,具有良好的泛化能力和稳定性。 展开更多
关键词 显著目标检测 卷积神经网络形式的自适应注意力 掩码注意力 特征增强
在线阅读 下载PDF
基于特征对齐融合的双波段图像描述生成方法
3
作者 顾梦瑶 蔺素珍 +1 位作者 晋赞霞 李烽源 《现代电子技术》 北大核心 2025年第7期65-71,共7页
为了获得更准确、全面的现场信息,采用红外和可见光同步成像探测复杂场景已成为常态,但现有图像描述研究仍集中于可见光图像,无法全面而准确地描述已探测到的场景信息。为此,文中提出一种基于特征对齐融合的可见光⁃红外双波段图像描述... 为了获得更准确、全面的现场信息,采用红外和可见光同步成像探测复杂场景已成为常态,但现有图像描述研究仍集中于可见光图像,无法全面而准确地描述已探测到的场景信息。为此,文中提出一种基于特征对齐融合的可见光⁃红外双波段图像描述生成方法。首先,利用Faster⁃RCNN分别提取可见光图像的区域特征和红外图像的网格特征;其次,以Transformer为基本架构,在可见光⁃红外图像对齐融合(VIIAF)编码器中引入位置信息做桥接,进行可见光⁃红外图像特征的对齐与融合;接着,将融合得到的视觉信息输入Transformer解码器中得到粗粒度文本的隐藏状态;最后将编码器输出的视觉信息、解码器得到的隐藏状态与经训练的Bert输出的语言信息输入所设计的自适应模块,使视觉信息和语言信息参与文本预测,实现文本由粗到细的图像描述。在可见光图像⁃红外图像描述数据集上进行的多组实验表明:所提方法不仅能够精确捕捉到可见光和红外图像间的互补信息,而且与使用Transformer的最优模型相比,其性能在BLEU⁃1、BLEU⁃2、BLEU⁃3、BLEU⁃4、METROR、ROUGE以及CIDEr指标上分别提高1.9%、2.1%、2.0%、1.8%、1.3%、1.4%、4.4%。 展开更多
关键词 图像描述 双波段 特征对齐融合 注意力机制 TRANSFORMER 语言模型 Bert 自适应
在线阅读 下载PDF
并行池化注意力及多特征融合增强目标检测方法
4
作者 程杰 卞长智 +2 位作者 张婧 李小霞 丁楠 《现代电子技术》 北大核心 2025年第5期59-67,共9页
针对通道注意力降维时导致细节信息损失和特征融合不充分的问题,提出一种并行池化注意力及多特征融合增强方法。首先,对输入图像使用两种池化模块并行处理,实现特征注意力增强。其中:熵引导池化模块利用通道信息熵生成特征权重系数,加... 针对通道注意力降维时导致细节信息损失和特征融合不充分的问题,提出一种并行池化注意力及多特征融合增强方法。首先,对输入图像使用两种池化模块并行处理,实现特征注意力增强。其中:熵引导池化模块利用通道信息熵生成特征权重系数,加强边缘纹理等细节信息;方向感知池化模块捕获图像在垂直和水平方向上的空间方向信息,再计算通道均值实现逐步降维保留关键特征。其次,多特征融合增强模块利用特征图尺度的对数函数自适应选取卷积核的大小,再将卷积后的特征分组重塑为与输入图像维度相同的通道、高度和宽度方向上的三个特征子图,并进行元素相乘获得增强特征图。最后,增强特征图与输入图像加权融合,同时增强目标的位置和细节信息。实验结果表明,文中方法在参数量不变的情况下,在VOC2007数据集上,mAP@0.5较YOLOX和YOLOv7分别提升4.62%、4.46%,在COCO数据集上,mAP@0.5较YOLOX和YOLOv7分别提升4.57%、4.63%。 展开更多
关键词 通道注意力 降维 并行池化 多特征融合增强 自适应 目标检测
在线阅读 下载PDF
基于改进YOLOv8n的井下人员多目标检测
5
作者 问永忠 贾澎涛 +2 位作者 夏敏高 张龙刚 王伟峰 《工矿自动化》 北大核心 2025年第1期31-37,77,共8页
针对井下危险区域人员监测视频存在光照不均匀、目标尺度不一致、遮挡等复杂情况,基于YOLOv8n网络结构,提出一种改进的井下人员多目标检测算法—YOLOv8n-MSMLAS。该算法对YOLOv8n的Neck层进行改进,添加多尺度空间增强注意力机制(MultiSE... 针对井下危险区域人员监测视频存在光照不均匀、目标尺度不一致、遮挡等复杂情况,基于YOLOv8n网络结构,提出一种改进的井下人员多目标检测算法—YOLOv8n-MSMLAS。该算法对YOLOv8n的Neck层进行改进,添加多尺度空间增强注意力机制(MultiSEAM),以增强对遮挡目标的检测性能;在C2f模块中引入混合局部通道注意力(MLCA)机制,构建C2f-MLCA模块,以融合局部和全局特征信息,提高特征表达能力;在Head层检测头中嵌入自适应空间特征融合(ASFF)模块,以增强对小尺度目标的检测性能。实验结果表明:(1)与Faster R-CNN,SSD,RT-DETR,YOLOv5s,YOLOv7等主流模型相比,YOLOv8n-MSMLAS综合性能表现最佳,mAP@0.5和mAP@0.5:0.95分别达到93.4%和60.1%,FPS为80.0帧/s,参数量为5.80×106个,较好平衡了模型的检测精度和复杂度。(2)YOLOv8n-MSMLAS在光照不均、目标尺度不一致、遮挡等条件下表现出较好的检测性能,适用于现场检测。 展开更多
关键词 煤矿井下危险区域 井下人员多目标检测 YOLOv8n 多尺度空间增强注意力机制 自适应空间特征融合 轻量化混合局部通道注意力机制
在线阅读 下载PDF
基于改进YOLOv7的输电线路多类缺陷目标检测
6
作者 毕含嘉 杨楚睿 +1 位作者 王小雨 黄悦华 《电子科技》 2025年第4期16-24,共9页
针对在复杂背景下输电线路多尺度缺陷目标检测精度较低的问题,文中提出一种基于改进YOLOv7(You Only Look Once version 7)的输电线路多类缺陷目标检测模型。对于复杂背景造成缺陷目标较低的问题,在Backbone部分引入改进的Swin Transfor... 针对在复杂背景下输电线路多尺度缺陷目标检测精度较低的问题,文中提出一种基于改进YOLOv7(You Only Look Once version 7)的输电线路多类缺陷目标检测模型。对于复杂背景造成缺陷目标较低的问题,在Backbone部分引入改进的Swin Transformer模块,通过使用多头注意力机制提升对全局特征的提取效果来提高模型的检测精度。对于待检测目标的多尺度特性,在特征金字塔基础上引入自适应特征融合模块,提升了Neck部分特征融合网络对多类不同尺度缺陷目标的检测能力。使用SIoU(Structured Intersection over Union)损失函数在提高预测框回归精度的同时加快了模型的收敛。实验结果表明,相较于YOLOv5、YOLOv7和Faster R-CNN(Faster Region with Convolutional Neural Network)模型,改进YOLOv7模型具有较高的检测精度,其平均检测精度可达96.4%,检测速度为29.6 frame·s^(-1),能够为输电线路多类缺陷目标检测提供参考。 展开更多
关键词 YOLOv7 深度学习 输电线路缺陷检测 小目标检测 多尺度融合 Swin Transformer β-dropout 自适应特征融合 损失函数
在线阅读 下载PDF
融合Mobile Vit和倒置门控编解码的视网膜血管分割算法
7
作者 梁礼明 阳渊 +2 位作者 朱晨锟 何安军 吴健 《北京航空航天大学学报》 北大核心 2025年第3期712-723,共12页
针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域... 针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域维度减少图像特征信息缺失,精确分割血管前景像素;提出特征自适应融合模块,建立血管纹理上下文依赖关系,提高血管分割灵敏度;优化编解码结构,设计倒置门控编解码模块,进一步捕获空间信息与深层语义信息,提高视网膜血管图像分割精度。在公共数据集DRIVE、STARE和CHASE_DB1上对所提算法进行实验,特异性分别为0.9863、0.9897和0.9873,准确度分别为0.9709、0.9754和0.9760,敏感度分别为0.8109、0.8010和0.8079。仿真实验证明,所提网络对视网膜血管分割具有较好的分割效果,为眼科疾病的诊断提供了新窗口。 展开更多
关键词 视网膜血管 Mobile Vit模块 离散余弦变换 倒置门控编解码模块 特征自适应融合
在线阅读 下载PDF
基于改进YOLOv5的矿山遥感图像去噪方法
8
作者 裴丹 房坤 +1 位作者 庆宇东 陈沛 《工矿自动化》 北大核心 2025年第3期148-155,共8页
典型露天矿场景的图像呈现多类型复合噪声特征,信噪比较低且具有显著的空间异质性,现有深度学习模型大多直接迁移自然图像去噪架构,忽视了矿山遥感图像特有的噪声分布规律。针对该问题,提出了一种基于改进YOLOv5的矿山遥感图像去噪方法... 典型露天矿场景的图像呈现多类型复合噪声特征,信噪比较低且具有显著的空间异质性,现有深度学习模型大多直接迁移自然图像去噪架构,忽视了矿山遥感图像特有的噪声分布规律。针对该问题,提出了一种基于改进YOLOv5的矿山遥感图像去噪方法。针对传统YOLOv5在高噪声环境下性能不稳定的问题,引入了多尺度特征融合模块,以增强模型对不同尺寸噪声的识别能力,同时结合残差注意力机制,提升了模型对有用特征的提取能力,增强了去噪效果的鲁棒性。采用自适应噪声估计技术,根据图像不同区域的噪声特性动态调整去噪参数,实现了更为精准的噪声抑制。实验结果表明:改进YOLOv5在峰值信噪比(PSNR)和结构相似性指数(SSIM)上均显著优于其他经典去噪方法,相较原始YOLOv5,PSNR提高2.5 dB,SSIM提高了0.05;改进YOLOv5在所有噪声类型下均表现出色,尤其是在高斯噪声环境中,其PSNR和SSIM分别达32.5 dB和0.95,显著优于其他经典去噪方法。 展开更多
关键词 矿山遥感图像去噪 YOLOv5 多尺度特征融合 残差注意力机制 自适应噪声估计
在线阅读 下载PDF
基于窗口自注意力网络与YOLOv5融合的输电线路通道异物检测
9
作者 薛昂 姜恩宇 +2 位作者 张文涛 林顺富 米阳 《上海交通大学学报》 北大核心 2025年第3期413-423,共11页
针对输电线路通道异物检测背景复杂以及小目标情况下检测效果不佳等问题,提出一种基于窗口自注意力网络与YOLOv5模型融合的输电线路通道安全检测算法.首先,选用窗口自注意力(S-T)网络优化主干网络,扩大模型感受视野,增强提取有效信息的... 针对输电线路通道异物检测背景复杂以及小目标情况下检测效果不佳等问题,提出一种基于窗口自注意力网络与YOLOv5模型融合的输电线路通道安全检测算法.首先,选用窗口自注意力(S-T)网络优化主干网络,扩大模型感受视野,增强提取有效信息的能力.其次,改进自适应空间特征融合(ASFF)模块,增强多尺度特征融合能力.最后,考虑到真实框与预测框不匹配的问题,引入结构相似性交并比(SIoU),优化边界误差,提高小目标定位准确性.实验结果表明,本文模型对线路通道多目标入侵检测精度达到90.2%,且提升了小目标检测效果;与主流目标检测算法相比,可以更好地满足输电线路通道中的异物检测需求. 展开更多
关键词 智能化巡检 输电线路通道 目标检测 窗口自注意力网络 自适应空间特征融合
在线阅读 下载PDF
改进YOLOv8n的林业害虫检测方法
10
作者 陈万志 袁航 《北京林业大学学报》 北大核心 2025年第2期119-131,共13页
【目的】针对现有林业害虫检测方法检测速度慢,检测类别少,小目标害虫检测效果差等问题,提出了一种改进YOLOv8n的林业害虫检测方法。【方法】首先,采用高效多尺度级联注意力特征提取网络EfficientViT作为改进模型的主干网络,降低计算复... 【目的】针对现有林业害虫检测方法检测速度慢,检测类别少,小目标害虫检测效果差等问题,提出了一种改进YOLOv8n的林业害虫检测方法。【方法】首先,采用高效多尺度级联注意力特征提取网络EfficientViT作为改进模型的主干网络,降低计算复杂度,提高检测速度;其次,通过构建多尺度自适应特征融合模块DA-C2F提升模型在复杂背景下害虫目标的聚焦能力和识别精度,此外新增的小目标检测头XSH能够进一步提升小目标害虫的检测能力;最后,采用基于最小点距离交并比损失函数MPDIoU作为模型的边界框损失,提升网络收敛速度,进一步增强害虫目标的定位准确率。【结果】改进模型的检测精确率、召回率、平均精度、平均精度均值(mAP50-95)和F_(1)分数分别达到98.6%、95.7%、98.3%、85.6%和0.979,前4者较原模型分别提升了3.9、2.6、2.8、2.5个百分点,F_(1)分数提升了4.4%;检测速度(帧率)达到了95帧/秒,提升了15.9%,优于更轻量级的模型。此外,对比其他检测模型,改进模型对飞蛾类害虫的检测精确率提升了11.2个百分点,并且两种独立飞蛾害虫综合检测的表现也更为优异。【结论】本研究提出的方法对于林业害虫的检测准确度更高,检测速度更快,且对多类别害虫的检测精度更高,改进模型的泛化能力更强。 展开更多
关键词 深度学习 卷积神经网络(CNN) 林业害虫检测 YOLOv8n 多尺度级联注意力特征提取网络 多尺度自适应特征融合 小目标检测头
在线阅读 下载PDF
采用多尺度自适应选择卷积神经网络的轴承故障诊断研究 被引量:4
11
作者 张玺君 尚继洋 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第2期127-135,共9页
针对轴承故障诊断方法中传统多尺度卷积神经网络对不同尺度的特征只是简单拼接,而未考虑不同尺度的特征差异的问题,提出一种多尺度自适应选择卷积神经网络轴承故障诊断模型(MSASCNN)。通过不同大小的宽卷积筛选原始轴承振动信号中的特征... 针对轴承故障诊断方法中传统多尺度卷积神经网络对不同尺度的特征只是简单拼接,而未考虑不同尺度的特征差异的问题,提出一种多尺度自适应选择卷积神经网络轴承故障诊断模型(MSASCNN)。通过不同大小的宽卷积筛选原始轴承振动信号中的特征,合并为初始特征;构建多尺度自适应选择卷积块,提取不同尺度的特征,利用改进的注意力机制自适应调整不同尺度的特征权重,加入残差连接,防止模型退化;通过分类器完成轴承故障诊断。在凯斯西储大学轴承数据集和XJTU-SY轴承数据集上的实验结果表明:在模型改进实验中,与没有改进注意力机制的模型相比,所提模型的轴承故障诊断准确率提升了1.98%;在不同信噪比的噪声干扰环境中,所提模型的轴承故障诊断准确率均高于93%。 展开更多
关键词 轴承故障诊断 卷积神经网络 自适应融合 注意力机制 多尺度特征
在线阅读 下载PDF
一种密集多尺度特征引导代价聚合的改进立体匹配网络 被引量:1
12
作者 张博 张美灵 +1 位作者 李雪 朱磊 《西安工程大学学报》 CAS 2024年第1期121-130,共10页
针对目前立体匹配算法在重复纹理、无纹理、边缘等不适定性区域仍存在匹配不准确的问题,提出了一种基于PSMNet的密集多尺度特征引导代价聚合的立体匹配算法—DGNet(Dense multi-scale features Guided aggregation Network)。首先,基于... 针对目前立体匹配算法在重复纹理、无纹理、边缘等不适定性区域仍存在匹配不准确的问题,提出了一种基于PSMNet的密集多尺度特征引导代价聚合的立体匹配算法—DGNet(Dense multi-scale features Guided aggregation Network)。首先,基于密集连接空洞空间金字塔池化结构设计了密集多尺度特征提取模块,该模块利用不同膨胀率的空洞卷积提取不同尺度的区域级特征,并通过密集连接方式有效整合不同尺度的图像特征,使网络捕获丰富的上下文关系;其次,在每个视差等级下将左右特征图串联形成初始代价体,再提出密集多尺度特征引导代价聚合结构,在聚合代价体的同时自适应融合代价体和密集多尺度特征,从而使后续的解码层在多尺度上下文信息的引导下解码出更加精确和高分辨率的几何信息;最后,将全局优化后的高分辨率代价体送入视差回归模块以获得视差图。实验结果表明:所提算法在KITTI 2015和KITTI 2012数据集上的误匹配率分别降至1.76%和1.24%,SceneFlow数据集上的端点误差降至0.56 px,与GWCNet、CPOP-Net等先进算法相比,所提算法在不适定区域有明显改善。 展开更多
关键词 双目视觉 立体匹配 密度多尺度特征 自适应融合
在线阅读 下载PDF
基于深度学习的铁路异物侵限快速检测方法 被引量:5
13
作者 王辉 姜朱丰 +3 位作者 吴雨杰 范自柱 罗国亮 杨辉 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第5期2086-2098,共13页
针对列车运行环境内因意外突发事件所造成的异物侵限而影响列车安全运行的问题,在被广泛应用于工业领域的YOLOv3目标检测模型的基础之上,提出一种融合轨道限界和侵限异物识别的快速检测方法。首先,以ResNet-18网络作为铁路限界检测的主... 针对列车运行环境内因意外突发事件所造成的异物侵限而影响列车安全运行的问题,在被广泛应用于工业领域的YOLOv3目标检测模型的基础之上,提出一种融合轨道限界和侵限异物识别的快速检测方法。首先,以ResNet-18网络作为铁路限界检测的主干网络,利用辅助检测模块提升限界检测精度,达到特征提取速度快,语义信息丰富充足等目标。同时采用基于行锚框的分割算法检测轨道线坐标位置,结合标准轨距下的限界定义确定铁路异物入侵限界的范围,以减少侵限异物检测的区域。其次,设计基于Octave卷积的层内多尺度残差模块,将单通道卷积变为基于图像频率的双通道卷积,以降低卷积计算量,进一步提升异物侵限算法的检测速度。最后,引入空间金字塔模块和特征自适应融合模块,实现高、低级语义信息交换,从而增加网络对不同尺度目标的感知能力,并减少语义冲突问题。通过对比实验验证异物侵限检测算法的精度、速度和有效性。实验结果表明,所述方法能以172帧/s的速度对轨道位置和限界区域进行检测,精确度达98.12%。与其他算法相比,在大中小3种目标尺度上都超越了其他对比算法。所提出的融合轨道限界和侵限异物检测的方法,在保证精度的前提下,速度达到YOLOv3算法的2倍,能够满足列车对侵限异物的实时检测需求。 展开更多
关键词 异物侵限检测 Octave卷积 行锚框 铁路限界检测 空间金字塔 特征自适应融合
在线阅读 下载PDF
基于自适应特征融合和注意力机制的变电设备红外图像识别 被引量:1
14
作者 王媛彬 吴冰超 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第9期3749-3756,共8页
针对变电设备红外图像复杂背景下多目标、小目标及遮挡目标识别效果差的问题,该文提出一种基于中心点网络(CenterNet)的变电设备红外图像识别方法。通过将自适应特征融合模块(ASFF)和特征金字塔(FPN)相结合,构建ASFF+FPN结构的特征融合... 针对变电设备红外图像复杂背景下多目标、小目标及遮挡目标识别效果差的问题,该文提出一种基于中心点网络(CenterNet)的变电设备红外图像识别方法。通过将自适应特征融合模块(ASFF)和特征金字塔(FPN)相结合,构建ASFF+FPN结构的特征融合网络,增强了模型对多目标和小目标的跨尺度特征融合能力,排除背景信息;针对网络对遮挡目标特征捕捉能力差的问题,在特征融合网络中添加全局注意力机制,增强目标显著度;为实现模型轻量化,引入深度可分离卷积,减少参数量和推理时间;最后,通过引入分布焦点损失函数,克服了原损失函数对遮挡目标敏感性差的问题,提升了模型收敛速度和识别精度。在包含7种红外变电设备图像的自建数据集上进行测试。实验表明该算法与原始算法相比,识别精度提升了3.55%,达到了95.19%,模型参数量仅为32.52M,与4种主流目标识别算法对比,该算法在识别精度和算法复杂度上具有明显优势。 展开更多
关键词 变电设备 红外图像识别 中心点网络 自适应特征融合 注意力机制
在线阅读 下载PDF
基于注意力机制及多分支特征融合的实时语义分割算法
15
作者 蒋锐 陈儒娜 +2 位作者 王小明 李大鹏 徐友云 《南京邮电大学学报(自然科学版)》 北大核心 2024年第2期91-100,共10页
为了合理平衡语义分割中的精确度与实时性,基于快速卷积神经网络模型(Fast-SCNN)提出了一种基于注意力机制及多分支特征融合的实时语义分割算法模型。该算法模型首先通过注意力模块捕获空间特征之间的相互联系,增强空间细节信息;然后合... 为了合理平衡语义分割中的精确度与实时性,基于快速卷积神经网络模型(Fast-SCNN)提出了一种基于注意力机制及多分支特征融合的实时语义分割算法模型。该算法模型首先通过注意力模块捕获空间特征之间的相互联系,增强空间细节信息;然后合理设计融合模块,最大化利用各分支信息,实现深层特征与浅层特征更好的融合;最后引入自适应特征增强注意力模块,捕获长距离像素间的相互依赖关系。实验结果表明,文中算法模型在Cityscapes数据集上获得了71.55%的分割精度,推理速度FPS达到97.6帧/s,模型参数量为1.39 M,验证了该算法所构成网络模型的有效性。 展开更多
关键词 实时语义分割 通道注意力 空间注意力 特征融合 自适应注意力
在线阅读 下载PDF
基于双分支网络的表面肌电信号识别方法
16
作者 王万良 潘杰 +1 位作者 王铮 潘家宇 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第11期2208-2218,2229,共12页
针对目前表面肌电信号(sEMG)手势识别细节信息提取不充分,对相似手势区分困难的问题,提出基于加强二维化特征的双分支网络(ETDTBN)模型.该模型通过加强二维化方法生成二维特征图,使用多层卷积神经网络(ML-CNN)提取sEMG的空间特征,利用... 针对目前表面肌电信号(sEMG)手势识别细节信息提取不充分,对相似手势区分困难的问题,提出基于加强二维化特征的双分支网络(ETDTBN)模型.该模型通过加强二维化方法生成二维特征图,使用多层卷积神经网络(ML-CNN)提取sEMG的空间特征,利用双向门控循环单元(Bi-GRU)提取原始信号的时序特征.考虑到不同的特征对网络的影响程度不同,引入自适应特征融合机制对不同分支进行融合,强化有用特征并弱化无用特征,提高表面肌电识别的准确率.实验在电极偏移和不同受试者2种情况下对ETDTBN进行训练与测试,与主流的肌电手势识别模型进行对比.可知,ETDTBN的总体识别准确率分别为86.95%和84.15%,准确率均为最优,证明了该模型的有效性. 展开更多
关键词 表面肌电信号(sEMG) 手势识别 加强二维化特征 双分支网络 自适应特征融合机制
在线阅读 下载PDF
基于改进的相关滤波卫星视频抗遮挡跟踪方法
17
作者 李孟歆 王宝锋 +2 位作者 姜政 李志秀 朴东辉 《火力与指挥控制》 CSCD 北大核心 2024年第6期128-134,共7页
卫星视频中的目标存在背景复杂、尺寸较小、容易受遮挡等问题,这将影响跟踪的准确性,甚至导致跟踪失败。提出了用改进的核相关滤波算法来解决卫星视频中目标遮挡问题,并对目标进行有效跟踪。该算法通过提取目标的HOG特征、LBP特征和SIF... 卫星视频中的目标存在背景复杂、尺寸较小、容易受遮挡等问题,这将影响跟踪的准确性,甚至导致跟踪失败。提出了用改进的核相关滤波算法来解决卫星视频中目标遮挡问题,并对目标进行有效跟踪。该算法通过提取目标的HOG特征、LBP特征和SIFT特征共同描述目标,并以融合特征减少背景变化的影响。提出自适应卡尔曼滤波算法解决跟踪过程中目标被遮挡的问题,通过ITCI值判断目标是否被遮挡,并对被遮挡的目标进行位置预测,选用核相关滤波算法以满足跟踪的实时性和准确性。实验结果表明,改进的核相关滤波算法解决了目标遮挡问题,对目标背景变化有较好表现,同时跟踪的精度和成功率也有很大提高。 展开更多
关键词 核相关滤波 特征融合 自适应卡尔曼滤波 目标跟踪 卫星视频
在线阅读 下载PDF
基于双流自适应时空增强图卷积网络的手语识别
18
作者 金彦亮 吴筱溦 《应用科学学报》 CAS CSCD 北大核心 2024年第2期189-199,共11页
针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使... 针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使用人体身体、手部和面部节点作为输入,构造基于人体关节和骨骼的双流结构。通过自适应时空图卷积模块生成不同部位之间的连接,并充分利用其中的位置和方向信息。同时采用残差连接方式设计自适应多尺度时空注意力模块,进一步增强该网络在空域和时域的卷积能力。将双流网络提取到的有效特征进行加权融合,可以分类输出手语词汇。最后在公开的中文手语孤立词数据集上进行实验,在100类词汇和500类词汇分类任务中准确率达到了95.57%和89.62%。 展开更多
关键词 骨架数据 双流结构 自适应时空图卷积模块 自适应多尺度时空注意力模块 特征融合
在线阅读 下载PDF
基于空洞卷积和增强型多尺度特征自适应融合的滚动轴承故障诊断 被引量:2
19
作者 韩康 战洪飞 +1 位作者 余军合 王瑞 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第6期1285-1295,共11页
传统卷积神经网络(CNN)在识别故障类型时存在从原始振动信号中提取特征不足以及提取特征过程中需要更大的感受野以充分捕获信号的时间相关性的局限.针对轴承振动信号固有的多尺度特征,提出基于空洞卷积和增强型多尺度自适应特征融合的模... 传统卷积神经网络(CNN)在识别故障类型时存在从原始振动信号中提取特征不足以及提取特征过程中需要更大的感受野以充分捕获信号的时间相关性的局限.针对轴承振动信号固有的多尺度特征,提出基于空洞卷积和增强型多尺度自适应特征融合的模型(DC-MAFFM).利用空洞卷积的大感受野提取信号特征,同时引入残差连接来减少卷积层上的信息损失,从而有效过滤信号中的噪声;设计改进的多尺度特征提取模块,在不同尺度上捕获互补的诊断特征,同时在各层都进行不同尺度特征融合,充分学习信号的高频和低频特征;利用提出的特征自适应融合模块对不同尺度的特征自适应赋予权重,增强判别特征学习的能力.在2个轴承数据集上进行验证,结果表明所提模型在噪声和变工况下有较强的诊断能力.在强噪声情况下,故障诊断准确率分别达到88.08%和75.56%,与其他方法相比有显著优势. 展开更多
关键词 故障诊断 空洞卷积 残差连接 多尺度特征提取 自适应融合
在线阅读 下载PDF
适用于图像超分辨率的多路径融合增强网络 被引量:1
20
作者 沈俊晖 薛丽霞 +1 位作者 汪荣贵 杨娟 《微电子学与计算机》 2024年第3期59-70,共12页
卷积神经网络(Convolutional Neural Network,CNN)在单幅图像的超分辨率重建方面表现出了非常强大的能力,相比传统方法有着明显的改进。然而,尽管这些方法非常成功,但是由于需要大量的计算资源,直接应用于一些边缘设备并不现实。为了解... 卷积神经网络(Convolutional Neural Network,CNN)在单幅图像的超分辨率重建方面表现出了非常强大的能力,相比传统方法有着明显的改进。然而,尽管这些方法非常成功,但是由于需要大量的计算资源,直接应用于一些边缘设备并不现实。为了解决该问题,设计了一种轻量级的图像超分辨率重建网络——多路径融合增强网络(Multi-path Fusion Enhancement Network,MFEN)。具体来说,提出了一个新颖的融合注意力增强模块(Fusion Attention Enhancement Block,FAEB)作为多路径融合增强网络的主要构建模块。融合注意力增强模块由一条主干分支和两条层级分支构成:主干分支由堆叠的增强像素注意力模块组成,负责对特征图实现深度特征学习;层级分支则负责提取并融合不同大小感受野的特征图,从而实现多尺度特征学习。层级分支的融合方式则是以相邻的增强像素注意力模块输出为分支输入,通过自适应注意力模块(Self-Adaptive Attention Module,SAAM)来动态地增强不同大小感受野特征的融合程度,进一步补全特征信息,从而实现更全面、更精准的特征学习。大量实验表明,该多路径融合增强网络在基准测试集上具有更高的准确性。 展开更多
关键词 多路径融合增强网络 轻量化图像超分辨率重建 多尺度特征融合 自适应注意力 卷积神经网络
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部