期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
通道-空间多尺度增强与双池化注意的表情识别网络
1
作者 刘娟 张民扬 +2 位作者 胡敏 黄忠 江巨浪 《计算机应用研究》 北大核心 2025年第10期3182-3191,共10页
针对自然场景下表情特征提取仅关注通道-空间单一尺度信息以及平均池化易丢失局部显著性语义的问题,提出一种通道-空间多尺度增强与双池化注意的表情识别网络。首先,为捕获通道-空间整体多尺度增强语义,设计通道对称级联多尺度模块和空... 针对自然场景下表情特征提取仅关注通道-空间单一尺度信息以及平均池化易丢失局部显著性语义的问题,提出一种通道-空间多尺度增强与双池化注意的表情识别网络。首先,为捕获通道-空间整体多尺度增强语义,设计通道对称级联多尺度模块和空间多尺度特征提取模块,并以此构建基于通道-空间多尺度结构的整体特征增强子网。然后,为表征通道-空间区域双池化显著语义,将高效局部注意力机制改进为高效通道-空间注意力机制,并嵌入到区域特征注意子网。最后,为获取整体多尺度增强语义与区域双池化显著语义之间的潜在相关性,采用交叉注意力机制进行整体特征与区域特征之间的特征交互,并设计特征融合子网完成两类特征的模型级融合。实验结果表明,在人脸表情数据集RAF-DB和FERPlus上,其表情识别率分别达到89.97%和90.26%,比基线网络分别提升了13.54和10.95个百分点。与其他网络相比,提出的网络在自然场景下具有较好的表情识别性能。 展开更多
关键词 人脸表情识别 多尺度增强 双池化注意 通道-空间多尺度结构 高效通道-空间注意力机制
在线阅读 下载PDF
融合PVTv2和DenseNet121的双注意力视网膜病变分级算法
2
作者 梁礼明 钟奕 +1 位作者 陈康泉 王成斌 《光电工程》 北大核心 2025年第4期15-29,共15页
针对视网膜眼底病变图像数据集类间分布不均和病灶区域识别困难的问题,提出一种融合金字塔视觉变压器(pyramid vision transformer v2,PVTv2)和DenseNet121双注意力视网膜病变分级算法。首先,该算法经由PVTv2和DenseNet121组成的双分支... 针对视网膜眼底病变图像数据集类间分布不均和病灶区域识别困难的问题,提出一种融合金字塔视觉变压器(pyramid vision transformer v2,PVTv2)和DenseNet121双注意力视网膜病变分级算法。首先,该算法经由PVTv2和DenseNet121组成的双分支网络,对视网膜图像的全局和局部信息进行初步提取;其次,在PVTv2和DenseNet121输出处分别采用空间通道协同注意力模块和多频率多尺度模块,优化局部特征细节,突显微小病灶特征,增强模型对复杂微小病变特征敏感性和病灶的定位感知;再次设计神经元交叉融合模块,建立病灶区域宏观布局和微观纹理信息之间的远程依赖关系,进而提高视网膜病变分级准确率;最后,利用混合损失函数缓解样本分布不均所导致的各等级之间模型关注度不平衡情况。在IDRID和APTOS 2019数据集上进行实验验证,其二次加权系数分别为90.68%和90.35%,IDRID数据集上的准确率和APTOS 2019数据集ROC曲线下方面积分别为80.58%和93.22%。实验结果表明,所提算法在视网膜病变分级领域具有一定应用价值。 展开更多
关键词 视网膜病变分级 空间通道协同注意力模块 多频率多尺度注意力模块 神经元交叉融合模块
在线阅读 下载PDF
基于空间通道注意力机制与多尺度融合的交通标志识别研究 被引量:9
3
作者 黄志强 李军 《南京邮电大学学报(自然科学版)》 北大核心 2022年第2期93-102,共10页
通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图... 通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图的语义信息,将第19层卷积层通过上采样后与第7层卷积层相连接,多尺度融合后输入YOLO层形成新的特征金字塔,以此提高小目标的识别率。同时,为使网络更加关注交通标志的细节信息,在特征金字塔网络中增添能够增强前景信息降低背景信息的空间通道注意力机制。使用Kmeans聚类算法对数据集作聚类处理,获得一组先验框。在长沙理工大学交通标志数据集上进行测试,实验结果表明,改进后算法的识别率达到91.8%,与YOLOV3-tiny算法相比提高了24.9个百分点,而与YOLOV3算法相比,每张图片的检测时间降低至0.133s,降低了49.6%,该算法具有较强的实时性和准确性。 展开更多
关键词 交通标志 轻量化网络 YOLOV3-3ctiny 多尺度融合 特征金字塔 空间通道注意力机制
在线阅读 下载PDF
CSM-YOLO:一种面向飞机表面缺陷检测的轻量化高精度网络
4
作者 介战铎 张争明 +2 位作者 黄浩然 郝明 赵俭邦 《空军工程大学学报》 北大核心 2025年第5期11-21,共11页
针对现有基于视觉的飞机机体表面缺陷检测方法普遍存在检测精度低、参数量和计算量大,且难以同时兼顾精度提高和模型轻量化,提出一种新的同时兼顾高精度和轻量化的飞机机体表面缺陷检测方法(CSM-YOLO)。首先,通过设计C2f-SCSA模块替换... 针对现有基于视觉的飞机机体表面缺陷检测方法普遍存在检测精度低、参数量和计算量大,且难以同时兼顾精度提高和模型轻量化,提出一种新的同时兼顾高精度和轻量化的飞机机体表面缺陷检测方法(CSM-YOLO)。首先,通过设计C2f-SCSA模块替换主干网络C2f模块以动态增强多尺度特征、提高模型对关键特征信息的捕获、提取、利用能力,解决因下采样引起的特征信息丢失问题。其次,使用跨层直连方式改进Slim-Neck特征融合网络应用于模型颈部,实现提高模型计算效率的同时减少信息丢失,提高检测精度。最后,使用最小点距离交并比损失(MPDIoU Loss)提高边界框回归精确性,有效提高小目标缺陷检测精度,减少误检和漏检情况。实验结果表明,CSM-YOLO模型兼顾高精度、轻量化,对机体表面缺陷取得最高检测精度88.34%,较基线模型YOLOv8n提高2.92%,较YOLOv3-tiny、YOLOv5n、YOLOv5s、YOLOv7-tiny、YOLOv9t、YOLOv12n算法提升明显。在模型参数量和计算量方面,CSM-YOLO的参数量和计算量分别为2.67×10^(6)/s和7.68×10^(9)/s,较基线模型YOLOv8n分别减少0.34×10^(6)/s和0.41×10^(9)/s,实现了同时兼顾精度提高和模型轻量化。CSM-YOLO在飞机机体表面缺陷检测数据集上取得了显著的性能提升,为机体表面缺陷的自动化检测提供了有效的解决方案。 展开更多
关键词 飞机表面缺陷检测 YOLOv8 模型轻量化 空间-通道协同注意力 MPDIoU损失 Slim-Neck
在线阅读 下载PDF
基于双注意力编码-解码器架构的视网膜血管分割 被引量:5
5
作者 李天培 陈黎 《计算机科学》 CSCD 北大核心 2020年第5期166-171,共6页
眼底视网膜血管的分割提取对于糖尿病、视网膜病、青光眼等眼科疾病的诊断具有重要的意义。针对视网膜血管图像中的血管难以提取、数据量较少等问题,文中提出了一种结合注意力模块和编码-解码器结构的视网膜血管分割方法。首先对编码-... 眼底视网膜血管的分割提取对于糖尿病、视网膜病、青光眼等眼科疾病的诊断具有重要的意义。针对视网膜血管图像中的血管难以提取、数据量较少等问题,文中提出了一种结合注意力模块和编码-解码器结构的视网膜血管分割方法。首先对编码-解码器卷积神经网络的每个卷积层添加空间和通道注意力模块,加强模型对图像特征的空间信息和通道信息(如血管的大小、形态和连通性等特点)的利用,从而改善视网膜血管的分割效果。其中,空间注意力模块关注于血管的拓扑结构特性,而通道注意力模块关注于血管像素点的正确分类。此外,在训练过程中采用Dice损失函数解决了视网膜血管图像正负样本不均衡的问题。在3个公开的眼底图像数据库DRIVE,STARE和CHASE_DB1上进行了实验,实验数据表明,所提算法的准确率、灵敏度、特异性和AUC值均优于已有的视网膜血管分割方法,其AUC值分别为0.9889,0.9812和0.9831。实验证明,所提算法能够有效提取健康视网膜图像和病变视网膜图像中的血管网络,能够较好地分割细小血管。 展开更多
关键词 视网膜血管分割 通道注意力 空间注意力 编码-解码器结构 特征可视化
在线阅读 下载PDF
基于半监督空间-通道选择性卷积核网络的极化SAR图像地物分类 被引量:3
6
作者 王睿川 王岩飞 《雷达学报(中英文)》 CSCD 北大核心 2021年第4期516-530,共15页
针对极化合成孔径雷达(极化SAR)图像地物分类中标注样本数量少的问题,该文提出一种基于空间-通道选择性卷积核全卷积网络(SCSKFCN)和预选-联合优化半监督学习(SPUO)的极化SAR图像地物分类方法。SCSKFCN通过使用空间和通道注意力机制,对... 针对极化合成孔径雷达(极化SAR)图像地物分类中标注样本数量少的问题,该文提出一种基于空间-通道选择性卷积核全卷积网络(SCSKFCN)和预选-联合优化半监督学习(SPUO)的极化SAR图像地物分类方法。SCSKFCN通过使用空间和通道注意力机制,对不同感受野的特征进行自适应加权融合,有效提升了模型的分类性能。SPUO能够高效地利用标注样本,挖掘无标注样本中蕴含的信息。它采用K-Wishart距离进行样本预选并生成伪标签,然后在联合优化阶段使用真实标注样本和伪标注样本同时对模型进行优化。在模型优化过程中,SPUO对伪标注样本进行两步验证并筛选可靠的伪标注样本参与优化。实验结果表明,该方法能够在只使用少量标注样本的条件下实现高精度、高效率的极化SAR图像地物分类。 展开更多
关键词 极化SAR图像地物分类 全卷积网络 注意力机制 半监督学习 空间-通道选择性卷积核网络
在线阅读 下载PDF
混合扩张卷积和注意力机制的路面裂缝检测 被引量:6
7
作者 瞿中 李明 《计算机工程与设计》 北大核心 2023年第8期2425-2431,共7页
针对复杂背景下路面裂缝检测困难的问题,提出一种基于混合扩张卷积和空间-通道注意力机制的路面裂缝检测算法。基于改进的U-Net网络,在编码阶段,使用空间-通道注意力机制增强裂缝特征,抑制非裂缝特征;在网络中间部分,使用混合扩张卷积... 针对复杂背景下路面裂缝检测困难的问题,提出一种基于混合扩张卷积和空间-通道注意力机制的路面裂缝检测算法。基于改进的U-Net网络,在编码阶段,使用空间-通道注意力机制增强裂缝特征,抑制非裂缝特征;在网络中间部分,使用混合扩张卷积实现在不增加额外模块的前提下增大网络的感受野;在解码阶段,融合多层次和多尺度特征使最终预测结果更接近路面真实情况。实验结果表明,所提算法能够快速准确地对路面裂缝进行检测,具有较强的鲁棒性。 展开更多
关键词 裂缝检测 深度学习 卷积神经网络 编码-解码结构 混合扩张卷积 空间-通道注意力机制 多尺度特征融合
在线阅读 下载PDF
基于注意力和多级特征融合的铁路场景小尺度行人检测算法 被引量:9
8
作者 石瑞姣 陈后金 +3 位作者 李居朋 李艳凤 李丰 万成凯 《铁道学报》 EI CAS CSCD 北大核心 2022年第5期76-83,共8页
行人入侵是影响铁路行车安全的重要因素。为有效解决短焦距摄像机在大视场中小尺度行人检测精度低的问题,提出一种注意力机制引导下的多级特征融合网络模型。首先,将YOLOv3作为主干网络,针对多次降采样后行人特征丢失的问题,设计四倍降... 行人入侵是影响铁路行车安全的重要因素。为有效解决短焦距摄像机在大视场中小尺度行人检测精度低的问题,提出一种注意力机制引导下的多级特征融合网络模型。首先,将YOLOv3作为主干网络,针对多次降采样后行人特征丢失的问题,设计四倍降采样分支以利用高分辨率特征有效提取小尺度行人信息。其次,特征融合阶段引入通道-空间注意力机制以抑制低层特征中背景噪声干扰。最后,引入CIoU损失函数用于行人目标框的回归,解决均方误差损失函数存在的优化不一致及尺度敏感问题。实验结果表明,相较于经典YOLOv3以及现阶段主流目标检测算法,本算法具有更高的检测精度,在自建铁路私有数据集和Caltech公开数据集的各子集上对数平均漏检率均有明显降低。 展开更多
关键词 铁路行车安全 小尺度行人检测 多级特征融合 通道-空间注意力 CIoU损失函数
在线阅读 下载PDF
钢轨表面缺陷检测Mask R-CNN算法研究与优化 被引量:2
9
作者 孟瑞锋 梁桢 +2 位作者 贾超 乔志 赵晨 《都市快轨交通》 北大核心 2024年第5期68-77,共10页
为有效防止城市轨道交通事故发生,更好地保障运行安全,钢轨表面缺陷检测技术在巡检工作中发挥着重要作用。针对现有钢轨缺陷检测技术中检测精度差、小目标敏感度低等问题,在Mask R-CNN(mask region-based convolutional neural network... 为有效防止城市轨道交通事故发生,更好地保障运行安全,钢轨表面缺陷检测技术在巡检工作中发挥着重要作用。针对现有钢轨缺陷检测技术中检测精度差、小目标敏感度低等问题,在Mask R-CNN(mask region-based convolutional neural network)算法模型基础上,提出一种融合注意力机制的模型改进方案。该方案在特征提取网络中引入通道-空间复合注意力机制(channel-wise spatial module,CSM)用于实例分割缺陷检测,有效剔除干扰信息,获得多尺度特征表达,得到更多空间信息以及更优的浅层信息,从而提升对钢轨表面缺陷边缘检测能力。在相同的实验环境下,相对于Mask R-CNN算法,加入CSM后,Mask R-CNN模型的平均精度均值(mean average precision,mAP)提高了6.5%。其中,对钢轨“凹陷”“裂纹”以及“疲劳磨损”缺陷识别的平均精度(average precision,AP)分别提高了6.3%、6.9%和6.1%。横向对比发现,加入CSM后的Mask R-CNN模型,相较于Fast R-CNN模型,三种缺陷的分割效果分别提升了11.6%、12.5%和12.9%。同时,相较于Faster R-CNN模型,三种缺陷的分割效果分别提升了8.8%、10.0%和10.3%。加入CSM后的Mask R-CNN模型可以更好地识别三类缺陷,提升检测精度和小目标敏感度,为轨道智能巡检提供更安全有力的技术支持和保障。 展开更多
关键词 城市轨道交通 通道-空间注意力机制 钢轨缺陷 实例分割 Mask R-CNN算法
在线阅读 下载PDF
复杂战场环境下改进YOLOv5军事目标识别算法研究 被引量:11
10
作者 宋晓茹 刘康 +2 位作者 高嵩 陈超波 阎坤 《兵工学报》 EI CAS CSCD 北大核心 2024年第3期934-947,共14页
复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战... 复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战场军事单元的识别锚框进行重新聚类,以提升模型对于目标大小适应度,加速模型收敛;采用通道-空间并行注意力机制,增加模型对复杂战场环境下目标特征信息与位置信息关注度;在特征融合网络部分使用BiFPN以提升模型对于特征的融合能力与速度;采用Alpha_IoU损失函数加速模型收敛,解决当真实框与预测框重合时IoU计算退化问题。实验结果表明,在自建军事目标数据集下,改进算法与主流目标识别算法相比,在保证模型空间复杂度的同时,mAP值达到了90.17%。消融实验对比结果表明,改进后网络较原模型精度提升11.57%,具有较好的识别性能,能够为战场情报获取提供有效的技术支撑。 展开更多
关键词 军事目标识别 通道-空间并行注意力机制 特征融合 损失函数
在线阅读 下载PDF
基于2D CNN和Transformer的人体动作识别 被引量:17
11
作者 朱相华 智敏 殷雁君 《电子测量技术》 北大核心 2022年第15期123-129,共7页
人体动作识别是计算机视觉领域的研究热点之一,在人机交互、视频监控等方面具有深远的理论研究意义。为了解决2D CNN无法有效获取时间关系等问题,利用Transformer在建模长期依赖关系上的优势,引入Transformer架构并将其与2D CNN相结合... 人体动作识别是计算机视觉领域的研究热点之一,在人机交互、视频监控等方面具有深远的理论研究意义。为了解决2D CNN无法有效获取时间关系等问题,利用Transformer在建模长期依赖关系上的优势,引入Transformer架构并将其与2D CNN相结合用于人体动作识别,以更好地捕获上下文时间信息。首先使用融合通道-空间注意力模块的2D CNN提取强化的帧内空间特征,其次利用Transformer捕捉帧间的时间特征,最后应用MLP Head进行动作分类。实验结果表明在HMDB-51数据集和UCF-101数据集上分别达到了69.4%和95.5%的识别准确度。 展开更多
关键词 人体动作识别 2D CNN 通道-空间注意力模块 TRANSFORMER
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部