期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
结合互注意力空间自适应和特征对集成判别的细粒度图像分类
1
作者 李志欣 匡文兰 《广西师范大学学报(自然科学版)》 北大核心 2025年第4期69-82,共14页
细粒度图像具有类间差异小和类内区别大的特点,许多研究利用Vision Transformer挖掘关键区域特征来提升细粒度图像分类的精度,但其仍存在2个主要问题:首先,网络挖掘关键性分类线索时背景区域也考虑在内,给模型带来额外噪声干扰;其次,输... 细粒度图像具有类间差异小和类内区别大的特点,许多研究利用Vision Transformer挖掘关键区域特征来提升细粒度图像分类的精度,但其仍存在2个主要问题:首先,网络挖掘关键性分类线索时背景区域也考虑在内,给模型带来额外噪声干扰;其次,输入的图像局部嵌入特征之间欠缺空间联系,模型缺乏物体结构认知能力,导致提取的类别特征不准确。针对此问题,本文提出互注意力空间自适应和特征对集成判别2个模块。先通过互注意力空间自适应模块学习不同嵌入层的互注意力增强权重,用于选择更佳的判别性区域,通过图卷积网络自适应学习不同区域的邻接关系;再利用特征对集成判别模块考虑图像对之间的线索交互,减少细粒度图像间的混淆,在令牌特征增强策略下得出最终预测结果。本文方法在CUB-200-2011、Stanford Dogs和NABirds等3个基准数据集上测试准确率分别达到92.5%、93.3%和91.8%,优于现有许多先进方法。 展开更多
关键词 细粒度图像分类 注意力空间自适应 特征对集成判别 图卷积网络 令牌特征增强
在线阅读 下载PDF
基于窗口自注意力网络与YOLOv5融合的输电线路通道异物检测 被引量:2
2
作者 薛昂 姜恩宇 +2 位作者 张文涛 林顺富 米阳 《上海交通大学学报》 北大核心 2025年第3期413-423,共11页
针对输电线路通道异物检测背景复杂以及小目标情况下检测效果不佳等问题,提出一种基于窗口自注意力网络与YOLOv5模型融合的输电线路通道安全检测算法.首先,选用窗口自注意力(S-T)网络优化主干网络,扩大模型感受视野,增强提取有效信息的... 针对输电线路通道异物检测背景复杂以及小目标情况下检测效果不佳等问题,提出一种基于窗口自注意力网络与YOLOv5模型融合的输电线路通道安全检测算法.首先,选用窗口自注意力(S-T)网络优化主干网络,扩大模型感受视野,增强提取有效信息的能力.其次,改进自适应空间特征融合(ASFF)模块,增强多尺度特征融合能力.最后,考虑到真实框与预测框不匹配的问题,引入结构相似性交并比(SIoU),优化边界误差,提高小目标定位准确性.实验结果表明,本文模型对线路通道多目标入侵检测精度达到90.2%,且提升了小目标检测效果;与主流目标检测算法相比,可以更好地满足输电线路通道中的异物检测需求. 展开更多
关键词 智能化巡检 输电线路通道 目标检测 窗口自注意力网络 自适应空间特征融合
在线阅读 下载PDF
细粒度标记的结点自适应方面情感三元组抽取
3
作者 赵园春 韩虎 徐学锋 《计算机工程与应用》 北大核心 2025年第13期208-216,共9页
情感分析在自然语言处理领域扮演着重要的角色,作为情感分析的子任务,方面情感三元组抽取能够从评论中抽取用户对产品或服务的意见,从而在商家做决策时提供关键性数据支撑,因此具有较大的研究价值。然而现有的方面情感三元组抽取方法存... 情感分析在自然语言处理领域扮演着重要的角色,作为情感分析的子任务,方面情感三元组抽取能够从评论中抽取用户对产品或服务的意见,从而在商家做决策时提供关键性数据支撑,因此具有较大的研究价值。然而现有的方面情感三元组抽取方法存在词对边界考虑不足、词对标记冗余和语言学特征利用有限的问题。为了解决这些问题,提出了一种基于细粒度标记的结点自适应方面情感三元组抽取算法。设计细粒度词对标记方案,项的首尾边界使用相异的标记,去除项中冗余的词间标记。在两个通道上使用结点自适应网络分别对句法依赖信息与句法类型信息进行挖掘,同时使用卷积注意力捕捉评论文本的全局与局部语义依赖关系,从而增强模型对语言学特征的提取。最后,使用推理层获取词间关系,使用解码层获取方面-意见-情感三元组。实验结果表明,该模型不仅解决了现有标记方案存在的问题,还能高效挖掘语言学特征,在4个公开数据集上其综合评级指标值取得了较优的结果。 展开更多
关键词 方面情感三元组抽取 细粒度词对标记 结点自适应网络 句法依赖树 卷积注意力
在线阅读 下载PDF
并行池化注意力及多特征融合增强目标检测方法 被引量:1
4
作者 程杰 卞长智 +2 位作者 张婧 李小霞 丁楠 《现代电子技术》 北大核心 2025年第5期59-67,共9页
针对通道注意力降维时导致细节信息损失和特征融合不充分的问题,提出一种并行池化注意力及多特征融合增强方法。首先,对输入图像使用两种池化模块并行处理,实现特征注意力增强。其中:熵引导池化模块利用通道信息熵生成特征权重系数,加... 针对通道注意力降维时导致细节信息损失和特征融合不充分的问题,提出一种并行池化注意力及多特征融合增强方法。首先,对输入图像使用两种池化模块并行处理,实现特征注意力增强。其中:熵引导池化模块利用通道信息熵生成特征权重系数,加强边缘纹理等细节信息;方向感知池化模块捕获图像在垂直和水平方向上的空间方向信息,再计算通道均值实现逐步降维保留关键特征。其次,多特征融合增强模块利用特征图尺度的对数函数自适应选取卷积核的大小,再将卷积后的特征分组重塑为与输入图像维度相同的通道、高度和宽度方向上的三个特征子图,并进行元素相乘获得增强特征图。最后,增强特征图与输入图像加权融合,同时增强目标的位置和细节信息。实验结果表明,文中方法在参数量不变的情况下,在VOC2007数据集上,mAP@0.5较YOLOX和YOLOv7分别提升4.62%、4.46%,在COCO数据集上,mAP@0.5较YOLOX和YOLOv7分别提升4.57%、4.63%。 展开更多
关键词 通道注意力 降维 并行池化 多特征融合增强 自适应 目标检测
在线阅读 下载PDF
基于通道和帧级特征注意力模型的环境声音识别 被引量:8
5
作者 苏瑞轩 葛动元 姚锡凡 《科学技术与工程》 北大核心 2024年第16期6792-6798,共7页
为了对环境声音进行更好的识别,提出基于通道和帧级特征注意力的环境声音识别卷积神经网络模型。该模型针对声音特征特点选取一维卷积以提高模型对声音特征信息的提取能力,并引入SE-Res2Net模块实现对声音特征细粒度上的全局感受并帮助... 为了对环境声音进行更好的识别,提出基于通道和帧级特征注意力的环境声音识别卷积神经网络模型。该模型针对声音特征特点选取一维卷积以提高模型对声音特征信息的提取能力,并引入SE-Res2Net模块实现对声音特征细粒度上的全局感受并帮助模型关注特征通道间的信息,在全连接层前加入注意力统计池化模块,增强模型对表征不同声音类别的关键帧级特征的学习以提高模型识别性能。采用Urbansound8K数据集,实验结果表明:所提模型在测试集上的训练准确率达到94.5%,即模型可以有效学习声音特征中表征不同环境声音的关键信息并进行正确预测。对消融实验结果分析可得,所提模型的设计可使其分类错误率的下降率达到43.8%,表明模型对一维卷积的应用和各个模块的引入是有效的,可见所提环境声音识别模型性能优越。 展开更多
关键词 声音识别 细粒度 通道加权 帧级特征 注意力统计池化
在线阅读 下载PDF
MEC-Net:基于运动捕捉和通道注意力的行为识别方法 被引量:1
6
作者 郭志鑫 冯秀芳 《计算机工程与设计》 北大核心 2024年第6期1805-1811,共7页
针对视频行为识别过程中面临的特征信息利用不充分、计算量过大的问题,提出一种基于运动捕捉和通道注意力的行为识别模型。模型利用卷积和池化层提高关键特征的利用率,利用空间通道注意力模块在通道维度利用自适应学习参数聚合信息,降... 针对视频行为识别过程中面临的特征信息利用不充分、计算量过大的问题,提出一种基于运动捕捉和通道注意力的行为识别模型。模型利用卷积和池化层提高关键特征的利用率,利用空间通道注意力模块在通道维度利用自适应学习参数聚合信息,降低背景冗余信息的影响,引入时空注意力机制融合特征信息获得分类结果。所提模型在公开数据集UCF101、Kinetics-400以及HMDB51上分别获得了94.5%、80.2%和61.9%的精确度,对比其它模型具有更加精准的识别结果以及更少的计算量,验证了模型的有效性。 展开更多
关键词 行为识别 视频 混合模型 注意力机制 时空特征 自适应 通道
在线阅读 下载PDF
基于动态反投影网络的细粒度交通流推断模型
7
作者 许明 齐光尧 奇格奇 《系统仿真学报》 北大核心 2025年第3期657-666,共10页
为解决现有细粒度城市流推断模型在复杂交通区域中的推断结果存在较大误差的问题,提出一种基于动态反投影网络的细粒度交通流推断模型。计算输入粗粒度交通流与外部因素之间的多维交互,将交互结果与粗粒度交通流进行动态自适应融合,使... 为解决现有细粒度城市流推断模型在复杂交通区域中的推断结果存在较大误差的问题,提出一种基于动态反投影网络的细粒度交通流推断模型。计算输入粗粒度交通流与外部因素之间的多维交互,将交互结果与粗粒度交通流进行动态自适应融合,使其特征之间能够相互影响和调整,以协助模型推理。结合深度卷积和自注意力机制来学习局部信息和全局信息,提高后续模块对输入数据的理解能力。通过反投影算法和门控交叉注意力机制,实现在细粒度层次中学习复杂区域的交通流特征。在流量归一化机制的基础上引入了非线性变换通路,旨在利用不同层次信息实施空间结构约束,进一步提升模型推断结果的准确性。实验结果表明:所提算法在主观评价和客观度量上均优于同类模型,特别是在市中心入口、桥梁区域等复杂交通区域下的表现尤为出色。 展开更多
关键词 细粒度交通流推断 动态自适应融合 反投影算法 门控交叉注意力 注意力
在线阅读 下载PDF
针对多农作物病虫害的一种深度细粒度识别方法
8
作者 顾洁 缪艺缘 +3 位作者 高尚 李文杰 邵长斌 秦斌 《江苏农业科学》 北大核心 2025年第5期258-265,共8页
多农作物场景下的病虫害识别任务存在农作物与病虫害间“多对多”的对应关系,加剧了病虫害识别中类内差异大及类间差异小的问题。本研究以深度残差网络为骨干架构,提出一种深度细粒度病虫害识别方法。针对训练数据稀缺问题,采用动态数... 多农作物场景下的病虫害识别任务存在农作物与病虫害间“多对多”的对应关系,加剧了病虫害识别中类内差异大及类间差异小的问题。本研究以深度残差网络为骨干架构,提出一种深度细粒度病虫害识别方法。针对训练数据稀缺问题,采用动态数据增强技术增加样本数据的多样性。针对农作物在叶片纹理等表象特征存在细微差异的问题,在网络结构中注入通道注意力机制模块,增强模型对细节性信息的表征能力。在训练实施方面,利用间隔余弦损失来代替常规交叉熵损失函数;该损失通过在嵌入特征层面加大类间空余度,强化类间分离度,进而间接增进类内聚集度。以自组数据集(10种作物及其对应的27种病害图像样本)为研究对象,开展多农作物场景下病虫害识别的方法实践。试验结果证明本研究方法有效,相较于典型ResNet18、AlexNet、VGG16、ResNet50、DenseNet模型,本研究方法在识别精确度上分别提高1.80、2.13、1.88、2.38、1.72百分点。对于多农作物场景下病虫害识别的难点,本研究方法从数据增广、模型结构改进、损失函数设计3个层面给出针对性解决方案,期待其为农作物智能识别技术提供理论基础。 展开更多
关键词 农作物病虫害 细粒度图像识别 余弦相似度损失 通道注意力
在线阅读 下载PDF
基于注意力机制及多分支特征融合的实时语义分割算法
9
作者 蒋锐 陈儒娜 +2 位作者 王小明 李大鹏 徐友云 《南京邮电大学学报(自然科学版)》 北大核心 2024年第2期91-100,共10页
为了合理平衡语义分割中的精确度与实时性,基于快速卷积神经网络模型(Fast-SCNN)提出了一种基于注意力机制及多分支特征融合的实时语义分割算法模型。该算法模型首先通过注意力模块捕获空间特征之间的相互联系,增强空间细节信息;然后合... 为了合理平衡语义分割中的精确度与实时性,基于快速卷积神经网络模型(Fast-SCNN)提出了一种基于注意力机制及多分支特征融合的实时语义分割算法模型。该算法模型首先通过注意力模块捕获空间特征之间的相互联系,增强空间细节信息;然后合理设计融合模块,最大化利用各分支信息,实现深层特征与浅层特征更好的融合;最后引入自适应特征增强注意力模块,捕获长距离像素间的相互依赖关系。实验结果表明,文中算法模型在Cityscapes数据集上获得了71.55%的分割精度,推理速度FPS达到97.6帧/s,模型参数量为1.39 M,验证了该算法所构成网络模型的有效性。 展开更多
关键词 实时语义分割 通道注意力 空间注意力 特征融合 自适应注意力
在线阅读 下载PDF
基于自适应特征融合的小样本细粒度图像分类 被引量:2
10
作者 解耀华 章为川 +1 位作者 任劼 景军锋 《计算机工程与应用》 CSCD 北大核心 2023年第3期184-192,共9页
现有的小样本学习算法未能充分提取细粒度图像的特征,导致细粒度图像分类准确率较低。为了更好地对基于度量的小样本细粒度图像分类算法中提取的特征进行建模,提出了一种基于自适应特征融合的小样本细粒度图像分类算法。在特征提取网络... 现有的小样本学习算法未能充分提取细粒度图像的特征,导致细粒度图像分类准确率较低。为了更好地对基于度量的小样本细粒度图像分类算法中提取的特征进行建模,提出了一种基于自适应特征融合的小样本细粒度图像分类算法。在特征提取网络上设计了一种自适应特征融合嵌入网络,可以同时提取深层的强语义特征和浅层的位置结构特征,并使用自适应算法和注意力机制提取关键特征。在训练特征提取网络上采用单图训练和多图训练方法先后训练,在提取样本特征的同时关注样本之间的联系。为了使得同一类的特征向量在特征空间中的距离更加接近,不同类的特征向量的距离更大,对所提取的特征向量做特征分布转换、正交三角分解和归一化处理。提出的算法与其他9种算法进行实验对比,在多个细粒度数据集上评估了5 way 1 shot的准确率和5 way 5 shot的准确率。在Stanford Dogs数据集上的准确率提升了5.27和2.90个百分点,在Stanford Cars数据集上的准确率提升了3.29和4.23个百分点,在CUB-200数据集上的5 way 1 shot的准确率只比DLG略低0.82个百分点,但是5 way5 shot上提升了1.55个百分点。 展开更多
关键词 小样本学习 细粒度图像分类 自适应特征融合 注意力机制
在线阅读 下载PDF
基于频率通道注意力网络的花生图像识别 被引量:1
11
作者 王春龙 蒋仲铭 +3 位作者 鲍安红 龚凤 李丹 高涛 《花生学报》 北大核心 2022年第3期69-76,82,共9页
为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进。首先,在每个残差结构中引入频率通道注意力(Frequency Channel Attention,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;... 为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进。首先,在每个残差结构中引入频率通道注意力(Frequency Channel Attention,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;其次,通过可学习的自适应激活函数(Activate or Not,ACON)进行激活,动态地学习了激活函数的非线性程度,激活过程更加稳健而有效;最后,利用梯度集中(Gradient Centralization)的动量梯度下降算法优化损失函数。同等实验条件下对比VGG16、AlexNet和未改进的ResNet50模型,该模型性能最优,模型参数大小为127 MB,单张图耗时0.31 s,测试集上平均识别准确率为98%,高出模型改进前2.46个百分点。FAG-ResNet50模型可以很好地解决花生果分类问题,为智能花生果分级设备的开发奠定了技术基础。 展开更多
关键词 图像识别 频率通道注意力 自适应激活函数 梯度集中 花生分级
在线阅读 下载PDF
基于自适应三线性池化网络的细粒度图像分类 被引量:3
12
作者 石进 徐杨 曹斌 《计算机工程》 CAS CSCD 北大核心 2023年第5期239-246,254,共9页
细粒度图像分类的关键在于提取图像中微妙的特征。现有基于弱监督方式的细粒度图像识别方法大多使用专家标注的边界注释辅助定位关键区域,存在标注成本高、训练过程复杂等问题。基于弱监督的双线性卷积神经网络方法因其学习到的特征空... 细粒度图像分类的关键在于提取图像中微妙的特征。现有基于弱监督方式的细粒度图像识别方法大多使用专家标注的边界注释辅助定位关键区域,存在标注成本高、训练过程复杂等问题。基于弱监督的双线性卷积神经网络方法因其学习到的特征空间更符合细粒度图像特性而具有一定的有效性,但忽略了层间的相互作用。针对细粒度图像识别领域存在的关键区域识别困难和层间交互关联弱的问题,融合二阶协方差通道注意力机制、自适应特征掩码与自适应三线性池化,提出自适应三线性池化网络ATP-Net,用于细粒度图像分类任务。通过二阶协方差通道注意力机制学习通道上的注意力向量,构建自适应特征掩码模块学习空间维上的注意力矩阵,设计自适应三线性池化模块学习特征的最终表示,以充分利用空间维、通道维上的信息。在CUB-200、Cars-196和Aircraft-1003个细粒度图像分类数据集上的实验结果表明,ATP-Net的分类精度分别为89.30%、94.20%和91.80%。 展开更多
关键词 细粒度图像分类 注意力机制 特征掩码 自适应三线性池化 高阶交互
在线阅读 下载PDF
基于路侧相机的自适应空间变换车辆检测方法
13
作者 华家宝 张京瑞 +1 位作者 朱福民 陈璐 《计算机工程》 北大核心 2025年第6期349-359,共11页
为了提高基于路侧相机的车辆检测的准确性和效率,研究了融合卷积神经网络(CNN)与Transformer模型的车辆检测模型。针对复杂的交通场景,设计了自适应空间Transformer,将其与ResNet50结合构建了可以应对车辆视角和尺度变换的主干网络。设... 为了提高基于路侧相机的车辆检测的准确性和效率,研究了融合卷积神经网络(CNN)与Transformer模型的车辆检测模型。针对复杂的交通场景,设计了自适应空间Transformer,将其与ResNet50结合构建了可以应对车辆视角和尺度变换的主干网络。设计了基于角度和距离的位置编码,优化Transformer模型输入,使模型充分利用图像中的空间信息,并采用了通道空间注意力模块,以更好地捕获图像中的上下文信息。在解码器部分,去除了自回归机制,允许模型并行解码多个目标,并引入了目标查询集嵌入,使其更适应车辆检测任务。实验结果表明,所提模型在UA-DETRAC、IITM-hetra和自采数据集上的mAP@0.5分别达到96.42%、87.82%和98.64%,在所有尺寸上均超越了其他对比模型。消融实验进一步验证了各模块对性能的关键贡献。 展开更多
关键词 自适应空间变换 TRANSFORMER 车辆检测 通道空间注意力机制 路侧相机
在线阅读 下载PDF
基于动态自适应的电梯钢带典型故障检测算法
14
作者 周泽丞 李琛 +2 位作者 徐峰 张才 黄堪飞 《现代电子技术》 北大核心 2025年第16期161-166,共6页
针对传统电梯钢带典型故障检测实时性差、精度低和流程复杂的问题,提出一种基于动态自适应的电梯钢带典型故障检测算法DSMA-YOLO。首先,采用可变形卷积DCNv2替换传统卷积层,更好地适应故障的形状和结构变化;其次,构造多尺度大核分离(ML... 针对传统电梯钢带典型故障检测实时性差、精度低和流程复杂的问题,提出一种基于动态自适应的电梯钢带典型故障检测算法DSMA-YOLO。首先,采用可变形卷积DCNv2替换传统卷积层,更好地适应故障的形状和结构变化;其次,构造多尺度大核分离(MLKS)模块,增强模型对不同特征尺度和空间变化的自适应能力;然后,提出一种双通道注意力(DPCA)机制,强化模型在通道维度上的特征感知、提取和融合能力;最后,设计动态共享对齐(DSA)检测头,优化定位和分类任务中的特征独立性、特征无关性及特征间冲突问题。实验结果表明,在电梯钢带典型故障数据集上,DSMA-YOLO的mAP@0.5和mAP@0.5~0.95比基准算法YOLOv8n提升了4.4%和10.1%,优于其他对比目标检测算法,并满足电梯钢带典型故障检测的实时性要求,可为电梯故障诊断方法及应用提供参考。 展开更多
关键词 电梯钢带 故障检测 动态自适应 YOLOv8n 可变形卷积 通道注意力机制 特征共享
在线阅读 下载PDF
基于残差编解码器的通道自适应超声图像去噪方法 被引量:7
15
作者 曾宪华 李彦澄 +1 位作者 高歌 赵雪婷 《电子与信息学报》 EI CSCD 北大核心 2022年第7期2547-2558,共12页
超声图像去噪对提高超声图像的视觉质量和完成其他相关的计算机视觉任务都至关重要。超声图像中的特征信息与斑点噪声信号较为相似,用已有的去噪方法对超声图像去噪,容易造成超声图像纹理特征丢失,这会对临床诊断的准确性产生严重的干... 超声图像去噪对提高超声图像的视觉质量和完成其他相关的计算机视觉任务都至关重要。超声图像中的特征信息与斑点噪声信号较为相似,用已有的去噪方法对超声图像去噪,容易造成超声图像纹理特征丢失,这会对临床诊断的准确性产生严重的干扰。因此,在去除斑点噪声的过程中,需尽量保留图像的边缘纹理信息才能更好地完成超声图像去噪任务。该文提出一种基于残差编解码器的通道自适应去噪模型(RED-SENet),能有效去除超声图像中的斑点噪声。在去噪模型的解码器部分引入注意力反卷积残差块,使本模型可以学习并利用全局信息,从而选择性地强调关键通道的内容特征,抑制无用特征,能提高模型去噪的性能。在2个私有数据集和2个公开数据集上对该模型进行定性评估和定量分析,与一些先进的方法相比,该模型的去噪性能有显著提升,并在噪声抑制以及结构保持方面具有良好的效果。 展开更多
关键词 图像去噪 超声图像 深度学习 通道自适应 注意力反卷积残差块
在线阅读 下载PDF
基于特征融合和注意力机制的图像语义分割 被引量:2
16
作者 马冬梅 黄欣悦 李煜 《计算机工程与科学》 CSCD 北大核心 2023年第3期495-503,共9页
针对目前高精度语义分割模型需要大量计算资源,难以在硬件存储和计算力有限的嵌入式平台上部署,提出了一种基于特征融合和注意力机制的图像语义分割模型。首先,对基于DeepLabV3+的模型进行优化,采用通道剪枝对MobileNetV2骨干网络轻量化... 针对目前高精度语义分割模型需要大量计算资源,难以在硬件存储和计算力有限的嵌入式平台上部署,提出了一种基于特征融合和注意力机制的图像语义分割模型。首先,对基于DeepLabV3+的模型进行优化,采用通道剪枝对MobileNetV2骨干网络轻量化;然后,在轻量化后的模型中引入拆分三重注意力模块(STA)来提高特征图内部维度相关性;最后,在解码部分增加细粒度上采样模块完善边缘细节信息。在PASCAL VOC 2012和Cityscapes数据集上的实验中,本文模型的参数量仅为4.15×106,浮点计算量为10.23 GFLOPs,平均交并比分别为70.98%和72.26%,表明该模型在计算资源、内存占用和准确性之间达到了较好的均衡。 展开更多
关键词 图像处理 语义分割 DeepLabV3+ 通道剪枝 拆分三重注意力 细粒度上采样
在线阅读 下载PDF
基于自适应融合的实时车辆检测 被引量:1
17
作者 陈婷 朱熟康 +3 位作者 高涛 李浩 涂辉招 李子琦 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第4期532-540,共9页
针对传统的车辆检测技术检测速度慢和精度低的问题,提出了一种融合注意力的自适应金字塔网络的交通目标检测算法(fusion attentiont adaptive pyramid network,FAAP-Net),可以显著降低交通事故的发生率。为了降低计算复杂度,设计了一种... 针对传统的车辆检测技术检测速度慢和精度低的问题,提出了一种融合注意力的自适应金字塔网络的交通目标检测算法(fusion attentiont adaptive pyramid network,FAAP-Net),可以显著降低交通事故的发生率。为了降低计算复杂度,设计了一种轻量级的互补池化结构(CPS),该结构在宽度和高度上采用了两组不同的池化组合,在保持高精度的同时,显著降低了网络的浮点运算数(GFLOPs)和参数量。为了解决智能交通系统特征图生成过程中的信息损失问题,通过将自适应注意力模块(AAM)和特征增强模块(FEM)引入自适应融合特征金字塔网络(AF-FPN),以融入车辆检测的形状特征。针对车辆细节特征表征弱的问题,引入了一种按通道维度分组的注意力(SA)机制,以增强主干网络对不同车辆检测细节特征的关注,有效提取车辆细节的显著特征。在BDD100K数据集上的实验结果表明,FAAP-Net算法相比于传统算法,平均精度从30.3%提升到43.7%。 展开更多
关键词 目标检测 车辆检测 互补池化 自适应融合 通道维度分组注意力
在线阅读 下载PDF
多层次精细化无人机图像目标检测
18
作者 肖振久 赖思宇 曲海成 《光电工程》 北大核心 2025年第5期34-49,共16页
针对无人机图像中背景复杂、光线多变、目标遮挡及尺度不一导致的漏检、误检问题,提出一种多层次精细化无人机图像目标检测算法。首先,结合多尺度特征提取与特征融合增强策略,设计CSP-SMSFF(cross stage partial selective multi-scale ... 针对无人机图像中背景复杂、光线多变、目标遮挡及尺度不一导致的漏检、误检问题,提出一种多层次精细化无人机图像目标检测算法。首先,结合多尺度特征提取与特征融合增强策略,设计CSP-SMSFF(cross stage partial selective multi-scale feature fusion)模块,该模块通过递增卷积核与通道融合,精确捕获多尺度目标特征。其次,引入AFGCAttention(adaptive fine-grained channel attention)机制,通过动态调优机制优化通道特征表达,增强算法对多尺度重要样本特征的感知力与判别力及细粒度映射信息的保留能力,抑制背景噪声,改善漏检情况。而后,设计SGCE-Head(shared group convolution efficient head)检测头,利用EMSPConv(efficient multi-scale convolution)卷积实现对空间通道维度中全局重要特征与局部细节信息的精准捕获,增强对多尺度特征的定位与识别能力,改善误检问题。最后,提出Inner-Powerful-IoUv2损失函数,通过动态梯度加权与分层IoU优化,平衡不同质量样本的定位权重,增强模型对模糊目标的检测能力。采用数据集VisDrone2019和VisDrone2021进行实验,结果表明,该方法mAP@0.5数值达到了47.5%和45.3%,较基线模型分别提升5.7%和4.7%,优于对比算法。 展开更多
关键词 无人机图像 目标检测 多尺度特征提取与融合 自适应细粒度通道注意力 EMSPConv
在线阅读 下载PDF
基于局部特征融合的细粒度车辆识别 被引量:3
19
作者 张晶晶 雷景生 《计算机工程与设计》 北大核心 2022年第4期1173-1178,共6页
为有效提高基于局部检测的细粒度图像分类方法的工作效率,提出一个自适应通道分配模块,能主动分组表达相同语义信息的特征通道。此过程的学习由设计的判别性和多样性损失函数监督完成,利用多尺度深度可分离卷积,从已提取的全局图像特征... 为有效提高基于局部检测的细粒度图像分类方法的工作效率,提出一个自适应通道分配模块,能主动分组表达相同语义信息的特征通道。此过程的学习由设计的判别性和多样性损失函数监督完成,利用多尺度深度可分离卷积,从已提取的全局图像特征中检测有助于分类的多样化局部信息。通过训练的网络具有强大的特征分配能力,在全局对象定位的基础上进一步实现对细节的定位。图像的融合表示综合考虑各个部分对分类的贡献,有效分类细粒度车型,在公开的Stanford Cars和CompCars数据集上的对比实验结果验证了该方法表现良好。 展开更多
关键词 细粒度图像分类 自适应通道分配 损失函数 多尺度深度可分离卷积 局部检测 融合表示
在线阅读 下载PDF
基于自适应特征融合和任务对齐的小目标检测算法
20
作者 郑有凯 胡君红 田春欣 《激光杂志》 CAS 北大核心 2024年第2期36-42,共7页
小目标检测是计算机视觉领域具有挑战性的研究任务。针对小目标物体尺寸小、特征不明显、目标聚集等问题,提出了一种基于自适应特征融合和任务对齐的小目标检测算法C-SODNET。该算法在TOOD基础上进行优化与改进,引入ConvNeXt作为骨干网... 小目标检测是计算机视觉领域具有挑战性的研究任务。针对小目标物体尺寸小、特征不明显、目标聚集等问题,提出了一种基于自适应特征融合和任务对齐的小目标检测算法C-SODNET。该算法在TOOD基础上进行优化与改进,引入ConvNeXt作为骨干网络,通过嵌入CBAM注意力机制和自适应特征融合模块的特征金字塔结构提升兴趣区域的特征提取能力,同时在检测头加入可变形卷积,显著改善了对于小目标物体的检测能力,最后引入CIoU回归损失函数来训练模型。实验结果表明,C-SODNET在VisDrone2019小目标检测数据集mAP_(50)为51.2%,相较于TOOD算法准确率提升了9.4%,小目标物体的精确率APs提高了7.3%,验证了算法的有效性。该算法可为高空或远距离场景小目标检测应用提供了有效解决方案。 展开更多
关键词 小目标检测 注意力机制 任务对齐 通道注意力 自适应特征融合
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部