期刊文献+
共找到110篇文章
< 1 2 6 >
每页显示 20 50 100
基于DenseNet和卷积注意力模块的高精度手势识别 被引量:5
1
作者 赵雅琴 宋雨晴 +3 位作者 吴晗 何胜阳 刘璞秋 吴龙文 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期967-976,共10页
非接触的手势识别是一种新型人机交互方式,在增强现实(AR)/虚拟现实(VR)、智能家居、智能医疗等方面有着广阔的应用前景,近年来成为一个研究热点。由于需要利用毫米波雷达进行更精确的微动手势识别,该文提出一种新型的基于MIMO毫米波雷... 非接触的手势识别是一种新型人机交互方式,在增强现实(AR)/虚拟现实(VR)、智能家居、智能医疗等方面有着广阔的应用前景,近年来成为一个研究热点。由于需要利用毫米波雷达进行更精确的微动手势识别,该文提出一种新型的基于MIMO毫米波雷达的微动手势识别方法。采用4片AWR1243雷达板级联而成的毫米波级联(MMWCAS)雷达采集手势回波,对手势回波进行时频分析,基于距离-多普勒(RD)图和3D点云检测出人手目标。通过数据预处理,提取手势目标的距离-时间谱图(RTM)、多普勒-时间谱图(DTM)、方位角-时间谱图(ATM)和俯仰角-时间谱图(ETM),更加全面地表征手势的运动特征,并形成混合特征谱图(FTM),对12种微动手势进行识别。设计了基于DenseNet和卷积注意力模块的手势识别网络,将混合特征谱图作为网络的输入,创新性地融合了卷积注意力模块(CBAM),实验表明,识别准确率达到99.03%,且该网络将注意力放在手势动作的前半段,实现了高精度的手势识别。 展开更多
关键词 手势识别 毫米波雷达 卷积神经网络 卷积注意力模块
在线阅读 下载PDF
基于卷积注意力模块的端到端遥感图像分类 被引量:10
2
作者 徐风 苗哲 业巧林 《林业工程学报》 CSCD 北大核心 2020年第4期133-138,共6页
随着图像信息处理技术的发展,大量由各式飞行器对地观测所采集的遥感图像数据被应用于各领域实际生产生活中。传统遥感图像分类方法包含一系列复杂的处理流程,在处理效率和效果上已经难以满足当下的需求。随着人工智能相关技术的发展,... 随着图像信息处理技术的发展,大量由各式飞行器对地观测所采集的遥感图像数据被应用于各领域实际生产生活中。传统遥感图像分类方法包含一系列复杂的处理流程,在处理效率和效果上已经难以满足当下的需求。随着人工智能相关技术的发展,基于卷积神经网络的遥感图像分类方法开始占据主导地位。为减少算法流程中的复杂处理与提高分类的精度,笔者提出一种基于卷积注意力模块的端到端遥感图像分类框架,该框架采用卷积神经网络框架ResNet101作为整个框架的主干网络。在ResNet101网络4个阶段的卷积模块之间嵌入卷积注意力模块,使得模型关注于最具有类别区分度的区域,从而得到更好的分类结果。在模型训练阶段,采用开源的深度学习开源框架Pytorch对训练数据进行在线增广处理,对训练数据进行随机角度旋转,防止训练过程中发生过拟合现象。本研究基于PatternNet与NWPU-RESISC45两个公开数据集,并仅划分少量数据用于模型训练。结果表明:相比已有的方法,本研究提出的框架能够在GPU加速的环境中,以更高的精度分类遥感图像,满足了实时处理的需求,且支持端到端对遥感图像进行分类,不需要复杂的处理流程。 展开更多
关键词 卷积神经网络 遥感图像 卷积注意力模块 图像分类
在线阅读 下载PDF
基于卷积注意力模块和双通道网络的微表情识别算法 被引量:15
3
作者 牛瑞华 杨俊 +1 位作者 邢斓馨 吴仁彪 《计算机应用》 CSCD 北大核心 2021年第9期2552-2559,共8页
微表情是一种人类在试图隐藏自己真实情感时作出的面部动作,具有持续时间短、幅度小的典型特点。针对微表情识别难度大、识别效果不理想的问题,提出一种基于卷积注意力模块(CBAM)和双通道网络(DPN)的微表情识别算法——CBAM-DPN。首先,... 微表情是一种人类在试图隐藏自己真实情感时作出的面部动作,具有持续时间短、幅度小的典型特点。针对微表情识别难度大、识别效果不理想的问题,提出一种基于卷积注意力模块(CBAM)和双通道网络(DPN)的微表情识别算法——CBAM-DPN。首先,进行典型微表情数据集的数据融合;然后,分析序列帧中像素的变化值以确定顶点帧位置,再对顶点帧进行图像增强处理;最后,基于CBAM-DPN对图像增强后的微表情顶点帧进行特征的有效提取,并构建分类器对微表情进行识别。优化后模型的未加权F1值(UF1)和未加权平均召回率(UAR)分别可以达到0.7203和0.7293,相较于DPN模型分别提高了0.0489和0.0379,相较于CapsuleNet模型分别提高了0.0683和0.0787。实验结果表明,CBAM-DPN算法融合了CBAM和DPN的共同优势,可增强微小特征的信息提取能力,有效改善微表情识别性能。 展开更多
关键词 微表情识别 双通道网络 卷积注意力模块 顶点帧 结构优化
在线阅读 下载PDF
基于卷积注意力模块和无锚框检测网络的行人跟踪算法 被引量:9
4
作者 张红颖 贺鹏艺 《电子与信息学报》 EI CSCD 北大核心 2022年第9期3299-3307,共9页
针对多目标跟踪过程中遮挡严重时的目标身份切换、跟踪轨迹中断等问题,该文提出一种基于卷积注意力模块(CBAM)和无锚框(anchor-free)检测网络的行人跟踪算法。首先,在高分辨率特征提取网络HrnetV2的基础上,对stem阶段引入注意力机制,以... 针对多目标跟踪过程中遮挡严重时的目标身份切换、跟踪轨迹中断等问题,该文提出一种基于卷积注意力模块(CBAM)和无锚框(anchor-free)检测网络的行人跟踪算法。首先,在高分辨率特征提取网络HrnetV2的基础上,对stem阶段引入注意力机制,以提取更具表达力的特征,从而加强对重识别分支的训练;其次,为了提高算法的运算速度,使检测和重识别分支共享特征权重且并行运行,同时减少头网络的卷积通道数以降低参数运算量;最后,设定合适的参数对网络进行充分的训练,并使用多个测试集对算法进行测试。实验结果表明,该文算法相较于FairMOT在2DMOT15,MOT17,MOT20数据集上的精确度分别提升1.1%,1.1%,0.2%,速度分别提升0.82,0.88,0.41 fps;相较于其他几种主流算法拥有最少的目标身份切换次数。该文算法能够更好地适用于遮挡严重的场景,实时性也有所提高。 展开更多
关键词 目标身份切换 高分辨率特征提取网络 卷积注意力模块 无锚框检测网络 头网络 FairMOT
在线阅读 下载PDF
融合高效卷积注意力的时域卷积网络短期负荷预测模型
5
作者 孙东磊 李文升 +1 位作者 梁露 张智晟 《山东科技大学学报(自然科学版)》 北大核心 2025年第5期83-90,共8页
为避免时域卷积网络中膨胀卷积结构导致的负荷信息不连续现象,进一步提升预测模型对重要负荷特征的提取能力,本研究提出一种融合高效卷积注意力模块的混合膨胀卷积改进时域卷积网络(ECBAM-HTCN)的短期负荷预测模型。该模型以具备并行计... 为避免时域卷积网络中膨胀卷积结构导致的负荷信息不连续现象,进一步提升预测模型对重要负荷特征的提取能力,本研究提出一种融合高效卷积注意力模块的混合膨胀卷积改进时域卷积网络(ECBAM-HTCN)的短期负荷预测模型。该模型以具备并行计算能力的时域卷积网络为基础学习负荷数据特征,通过构建混合膨胀卷积层改进时域卷积网络残差块,利用不同膨胀系数的卷积自适应地捕获不同距离下全部负荷数据,避免信息不连续;同时,引入能够自适应调整卷积核大小的一维卷积改进传统卷积注意力模块,高效捕获负荷数据空间和通道两个维度的重要信息。基于实际电网负荷数据仿真实验表明,在短期负荷预测任务中,所提出的ECBAM-HTCN模型具有较高的预测精度和较好的稳定性。 展开更多
关键词 短期负荷预测 时域卷积网络 混合膨胀卷积 高效卷积注意力模块
在线阅读 下载PDF
基于卷积注意力机制的阀门内漏声发射识别方法 被引量:2
6
作者 黄鑫 屈文忠 肖黎 《振动与冲击》 EI CSCD 北大核心 2024年第9期105-114,共10页
阀门结构作为核电厂的关键设备部件之一,因长期处于高温高压环境下,其闸板或阀瓣易发生热变形或磨损导致密封不良,进而引发内漏事故。实时在线识别阀门的内漏状态,对提升核电机组热效率、提高阀门可靠性具有重要意义。因实际工业现场的... 阀门结构作为核电厂的关键设备部件之一,因长期处于高温高压环境下,其闸板或阀瓣易发生热变形或磨损导致密封不良,进而引发内漏事故。实时在线识别阀门的内漏状态,对提升核电机组热效率、提高阀门可靠性具有重要意义。因实际工业现场的基底噪声极易掩盖阀门内漏的声发射信号,进而造成阀门内漏状态的误判。为实现阀门内漏状态的快速准确识别,搭建了阀门内漏检测试验台架,开发了基于声发射方法的阀门内漏检测分析系统,将卷积注意力机制引入卷积神经网络中,实现高效快速地识别阀门内漏状态。结果表明,基于阀门内漏的声发射信号频域数据,利用卷积注意力机制神经网络能有效准确地识别阀门内漏状态,在内漏率为26 L/h时,识别准确率高达98%,并且具有较好的可靠性和鲁棒性。 展开更多
关键词 阀门结构 内漏 声发射 卷积注意力模块 卷积神经网络
在线阅读 下载PDF
噪声背景下梅尔频率倒谱系数与多注意力网络在电机故障诊断中的应用
7
作者 宋恩哲 朱仁杰 +2 位作者 靖海国 姚崇 柯赟 《哈尔滨工程大学学报》 北大核心 2025年第3期475-485,共11页
针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模... 针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模块的自适应调节能力及多特征融合策略进一步减少噪声对故障诊断的干扰。通过电机台架数据验证了该方法在噪声条件下诊断的可行性,然而该方法受梅尔频率倒谱系数参数与网络结构的直接影响,因此具体分析了不同参数条件对抗噪性能的影响。实验结果表明:在信噪比-10 dB噪声背景下,梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络相结合的故障诊断方法仍保持90%以上的诊断精度。 展开更多
关键词 电机 故障诊断 噪声环境 梅尔频率倒谱系数 卷积神经网络 多尺度 卷积注意力模块 特征融合
在线阅读 下载PDF
域对抗图卷积注意力变工况故障研究
8
作者 邢如意 尹洪申 《组合机床与自动化加工技术》 北大核心 2024年第3期172-176,共5页
针对滚动轴承在变工况环境中网络特征提取能力不足的问题,提出了一种域对抗图卷积注意力迁移学习的故障诊断方法(DAGRESL)。首先,通过残差神经网络(residual network, Resnet)提取输入的轴承故障信息特征并通过Simam注意力模块增强Resne... 针对滚动轴承在变工况环境中网络特征提取能力不足的问题,提出了一种域对抗图卷积注意力迁移学习的故障诊断方法(DAGRESL)。首先,通过残差神经网络(residual network, Resnet)提取输入的轴承故障信息特征并通过Simam注意力模块增强Resnet的特征表达能力;其次,利用图生成层学习Resnet的特征数据并挖掘样本结构特征之间的关系来构造实例图;然后,利用图卷积网络(graph convolutional network, GCN)对实例图进行建模;最后,利用域判别器和局部最大平均差异(local maximum mean discrepancy, LMMD)对齐子域和全局域之间的分布并通过标签分类网络完成故障分类。通过在SQI-MFS轴承数据集的实验结果证明了所提出的DAGRESL模型能够精准地区分变工况轴承故障类型,有效解决了滚动轴承在变工况环境中网络特征提取能力不足的问题。 展开更多
关键词 故障诊断 变工况 卷积注意力模块 卷积
在线阅读 下载PDF
融合注意力机制和卷积神经网络的电网暂态电压稳定评估及可解释性分析 被引量:4
9
作者 张哲 秦博宇 +2 位作者 高鑫 丁涛 张逸兴 《电网技术》 EI CSCD 北大核心 2024年第11期4648-4657,I0057,I0056,共12页
提升复杂多变运行场景下电网稳定评估的时效性和准确性,提出一种融合注意力机制和卷积神经网络(convolutional neural network,CNN)的暂态电压稳定评估及可解释性分析方法。首先,采用卷积块注意力模块(convolutional block attention mo... 提升复杂多变运行场景下电网稳定评估的时效性和准确性,提出一种融合注意力机制和卷积神经网络(convolutional neural network,CNN)的暂态电压稳定评估及可解释性分析方法。首先,采用卷积块注意力模块(convolutional block attention module,CB AM)提升传统CNN的特征捕获能力,考虑模型特性和网络结构设计CBAMCNN组合模块。其次,建立基于CBAM-CNN的电网暂态电压稳定评估模型,揭示运行工况多变场景下系统关键电气量和稳定状态之间的映射关系。最后,基于沙普利值加性解释(Shapley additive explanations,SHAP)理论提出数据驱动模型评估结果的可解释性分析框架,提炼影响样本稳定状态的主导特征,评估各输入特征量对模型输出结果的贡献程度。在典型受端电网仿真系统中验证了所提稳定评估方法的准确性和可解释性分析方法的有效性。 展开更多
关键词 卷积注意力模块-卷积神经网络 暂态电压稳定评估 沙普利值加性解释理论 可解释性分析
在线阅读 下载PDF
融合注意力机制的解耦对比聚类
10
作者 刘合兵 孔玉杰 +1 位作者 席磊 尚俊平 《计算机工程与科学》 CSCD 北大核心 2024年第12期2261-2270,共10页
为解决对比聚类正负样本之间负正耦合的问题,提出融合注意力机制的解耦对比聚类DCCIAM方法。首先,使用数据增强手段将图像数据进行扩充得到正样本对和负样本对;其次,在骨干网络中加入卷积注意力模块CBAM使网络更加关注目标特征,并将扩... 为解决对比聚类正负样本之间负正耦合的问题,提出融合注意力机制的解耦对比聚类DCCIAM方法。首先,使用数据增强手段将图像数据进行扩充得到正样本对和负样本对;其次,在骨干网络中加入卷积注意力模块CBAM使网络更加关注目标特征,并将扩充后的图像数据输入骨干网络得到特征;再次,将特征经过神经网络投影头,分别计算实例损失和聚类损失;最后,联合实例损失和聚类损失进行特征表示及聚类分配。为验证DCCIAM方法的有效性,在公共图像数据集CIFAR-10、STL-10和ImageNet-10上进行实验,聚类准确率分别达到了80.2%,77.0%和90.4%。结果表明,融合注意力机制的解耦对比聚类方法在图像聚类任务中的性能表现突出。 展开更多
关键词 对比学习 解耦对比损失 卷积注意力模块 图像聚类 数据增强
在线阅读 下载PDF
基于卷积注意力机制的运动想象脑电信号识别 被引量:4
11
作者 杜秀丽 马振倩 +1 位作者 邱少明 吕亚娜 《计算机工程与应用》 CSCD 北大核心 2021年第18期181-185,共5页
针对多类别运动想象脑电信号识别精度不高的问题,提出了一种融合注意力模块的卷积神经网络模型。该模型利用注意力模块充分挖掘脑电信号的通道和空间特征,建立其与识别任务之间的重要程度关系,从而提高运动想象脑电信号的识别准确率。... 针对多类别运动想象脑电信号识别精度不高的问题,提出了一种融合注意力模块的卷积神经网络模型。该模型利用注意力模块充分挖掘脑电信号的通道和空间特征,建立其与识别任务之间的重要程度关系,从而提高运动想象脑电信号的识别准确率。信号经过共空间模式提高信噪比,利用小波变换将信号转换成二维时频图,通过注意力模块中通道和空间两个维度进行特征的调整,以强化有用特征弱化无用特征,使卷积网络充分提取更高层次的抽象特征,并最终执行运动想象任务的识别。分别在BCI竞赛IVDatasets 2a和BCI竞赛III-IIIa数据集上进行了有效性评价,并与卷积神经网络以及其他算法进行了比较。实验结果表明,提出的方法可达到良好的准确率,能够有效提高脑电信号运动想象任务的识别准确率。 展开更多
关键词 运动想象 共空间模式 小波变换 卷积神经网络 卷积注意力模块
在线阅读 下载PDF
基于注意力增强YOLOv5l的矿粉品位识别算法优化研究
12
作者 丁鹏益 徐振洋 +1 位作者 郭连军 王雪松 《金属矿山》 CAS 北大核心 2024年第11期151-157,共7页
现阶段传统化学分析方法获取品位存在费时费力等问题,通过图像识别分析块状矿石品位又存在形状干扰严重的问题,为此提出了一种基于YOLOv5针对矿石矿粉特征的图像识别方法。同时,在训练过程中添加卷积注意力模块(Convolutional Block Att... 现阶段传统化学分析方法获取品位存在费时费力等问题,通过图像识别分析块状矿石品位又存在形状干扰严重的问题,为此提出了一种基于YOLOv5针对矿石矿粉特征的图像识别方法。同时,在训练过程中添加卷积注意力模块(Convolutional Block Attention Module,CBAM)、挤压和激发模块(Squeeze and Excitation Module,SENet)进入训练网络,通过注意力机制增强学习矿粉具体特征的能力,将注意力聚焦于矿粉明显细节,忽略矿粉图中无用信息,提高识别精度;其次通过修改损失函数增强其分类效果,研究损失函数对矿粉识别效果的影响。研究表明:在铁矿粉品位识别中,添加CBAM注意力模块的网络模型识别矿粉的训练精度达到86%,使用SENet注意力模块的网络训练精度为80%,均略高于原有模型的79%,修改损失函数的网络模型训练精度降低了5%,得出YOLOv5l+CBAM且损失函数设置为0.5的网络模型最佳。研究结果反映出所提方法对矿粉特征图像识别具有一定的适用性。 展开更多
关键词 铁矿 矿石品位 YOLOv5 图像识别 卷积注意力模块 挤压和激发模块
在线阅读 下载PDF
基于注意力机制的U-Net叶片缺陷图像分割 被引量:7
13
作者 祁雷 李宁 +2 位作者 梁伟 王峥 刘子梁 《中国安全科学学报》 CAS CSCD 北大核心 2024年第5期139-146,共8页
为解决风力发电机叶片表面缺陷检测存在分类困难和微小缺陷分割模糊的难题,构建一种基于扩张卷积和卷积注意力模块的改进U-Net语义分割网络。该网络基于网络模型的编码-解码结构,使用可迁移的VGG16的特征提取层代替U-Net网络的编码部分... 为解决风力发电机叶片表面缺陷检测存在分类困难和微小缺陷分割模糊的难题,构建一种基于扩张卷积和卷积注意力模块的改进U-Net语义分割网络。该网络基于网络模型的编码-解码结构,使用可迁移的VGG16的特征提取层代替U-Net网络的编码部分,在编码-解码之间的跳跃模块加入卷积注意力模块。通过对微小缺陷信息选取加强全局权重,使用扩张卷积增强网络特征,采用VGG16预训练模型实现迁移学习。开展Focal与Dice结合的混合损失函数验证,对比分析DeeplabV3+、PSPnet、HRNet、U-Net这4种模型。结果表明:对于叶片缺陷数据集,改进的U-Net网络模型对叶片缺陷的分类和分割任务具有更高的精度,均交并比、均像素精度和召回率等指标值分别为83.60%、92.84%和88.50%。改进U-Net网络的均交并比值比DeeplabV3+模型高13.98%,比标准U-Net模型高9.38%,能够提高叶片缺陷检测的灵敏度,有效降低检测结果的误报警率,有助于准确检测风机叶片缺陷。 展开更多
关键词 注意力机制 U-Net网络 风机叶片缺陷 图像分割 语义分割 迁移学习 卷积注意力模块(CBAM)
在线阅读 下载PDF
多尺度特征融合注意力新冠肺炎病灶分割网络 被引量:2
14
作者 林洁沁 黄新 《激光杂志》 CAS 北大核心 2024年第3期168-174,共7页
新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Atte... 新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Attention Network),以图像分割效果较为出色的U-Net网络为基础,通过全局池化层和设置空洞卷积的采样率,增大网络感受野,捕获多尺度信息,实现对大目标的有效分割;使用通道注意力与空间注意力,在空间维度上建模,有效提取图像深层特征。测试结果表明,改进后的算法与U-Net网络相比,分割的平均交并比提升了1.46%,类别平均像素准确率提升了0.8%,准确率提升了1.17%。 展开更多
关键词 图像处理 特征提取 卷积注意力模块 空洞空间卷积池化金字塔 U-Net结构 多尺度特征融合
在线阅读 下载PDF
基于注意力机制轻量化模型的植物病害识别方法 被引量:1
15
作者 苏航 陈旭昊 +3 位作者 寿德荣 张朝阳 许彪 孙丙宇 《江苏农业学报》 CSCD 北大核心 2024年第8期1389-1399,共11页
针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可... 针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可分离卷积进行特征提取。为了防止网络传播过程中的梯度消失并增强病害像素特征融合,在特征提取层中引入了大卷积核倒置残差结构(IRBCKS)模块。此外,在特征增强层集成了轻量级卷积块注意力模块(CBAM)注意力机制,以捕捉植物病害相关图像中像素之间的关系,增强关键信息的提取。最后,采用剪枝技术剔除模型中冗余特征信息,从而再次减少模型参数量,形成最终的轻量级网络模型Cut-MobileNet。为验证该模型的先进性,将其与轻量化模型(MobileNet V2、SqueezeNet、GoogLeNet)和非轻量化模型(Vision Transformer、AlexNet)进行性能对比,研究结果表明,Cut-MobileNet在浮点运算量、准确率、单张图片推理时间、参数量、F1值和模型大小等性能指标上都取得了较优的效果。 展开更多
关键词 模型剪枝 卷积注意力模块(CBAM)注意力机制 卷积核倒置残差结构(IRBCKS)模块 植物病害 轻量化网络
在线阅读 下载PDF
基于多注意力机制与跨特征融合的语义分割算法 被引量:1
16
作者 闵莉 董冰洁 安冬 《计算机工程》 CAS CSCD 北大核心 2024年第8期282-289,共8页
图像语义分割技术在缺陷检测、医疗诊断、无人驾驶等领域广泛应用。针对现有语义分割模型普遍存在训练成本过高、目标轮廓分割效果不佳以及对小目标误分割、漏分割等问题,基于DeepLabv3+网络框架,提出多注意力机制与跨特征融合相结合的... 图像语义分割技术在缺陷检测、医疗诊断、无人驾驶等领域广泛应用。针对现有语义分割模型普遍存在训练成本过高、目标轮廓分割效果不佳以及对小目标误分割、漏分割等问题,基于DeepLabv3+网络框架,提出多注意力机制与跨特征融合相结合的图像语义分割算法。该算法选取轻量级网络MobileNetv2作为主干,以缩短训练时间;通过优化空洞空间金字塔池化模块中空洞卷积的膨胀率,改善多尺度语义特征的提取效果,提高模型对小目标的分割能力,并将兼具通道与空间的卷积块注意力机制引入其中,更加关注对分割起决定作用的区域,从而加强对目标边界的提取;在编码器中设计跨特征融合模块,以聚合不同层次特征图的空间信息和语义信息,提高网络学习特征的能力;在编码和解码部分均引入坐标注意力机制,以分解全局平均池化的方式将位置信息嵌入到通道中,从而得到分割目标的准确位置。实验结果表明,所提算法F3crc-DeepLabv3+在PASCAL VOC 2012增强数据集和Cityspaces数据集上的平均交并比分别达到了75.06%和73.06%,平均精度分别达到了84.16%和82.05%,精确率分别达到了86.18%和85.43%,训练时间分别为10 h和13.8 h,具有较优的网络性能。 展开更多
关键词 语义分割 DeepLabv3+网络 MobileNetv2网络 坐标注意力 卷积注意力模块 跨特征融合
在线阅读 下载PDF
KMeans++与注意力机制融合的苹果叶片病害识别方法
17
作者 黄贻望 王国帅 +1 位作者 毛志 刘声 《江苏农业科学》 北大核心 2024年第20期190-198,共9页
为解决复杂环境下小尺度苹果叶片病害识别精度不高、鲁棒性不强的问题,在YOLO v5s的基础上提出一种新的改进方法。该方法首先在模型训练之前使用KMeans++聚类算法生成更接近真实框的锚框;其次在骨干网络中加入卷积块注意几模块(convolut... 为解决复杂环境下小尺度苹果叶片病害识别精度不高、鲁棒性不强的问题,在YOLO v5s的基础上提出一种新的改进方法。该方法首先在模型训练之前使用KMeans++聚类算法生成更接近真实框的锚框;其次在骨干网络中加入卷积块注意几模块(convolutional block attention module,CBAM),来提升复杂环境下小目标特征的提取能力;再次为了增强颈部网络对不同大小病害多尺度特征的有效识别,选择ConvNeXtBlock模块替换C3(CSP bottleneck with 3 convolutions)模块,并在颈部网络中融入坐标注意力模块(coordinate attention,CA),来加强模型对关键空间位置的响应,使得不同尺度的特征都能被更有效地利用;最后使用ECIoU损失函数替换原始的CIoU损失函数,来提高模型的收敛速度和精度。与Faster R-CNN、SSD、YOLO v5s、YOLO v7、YOLO v8目标检测模型相比,改进后模型的平均精度均值(mean average precision,mAP 0.5)值分别提升0.6、4.6、6.3、1.7、1.3百分点,同时在强光照、模糊、暗光的复杂场景下具有较强的鲁棒性。该模型可以为复杂环境下苹果叶片病害的识别提供行之有效的方案。 展开更多
关键词 苹果 叶片病害 病害检测 注意力机制 ConvNeXtBlock 卷积注意力模块(CBAM) CA
在线阅读 下载PDF
注意力机制与复合卷积在手写识别中的应用 被引量:10
18
作者 卓天天 桑庆兵 《计算机科学与探索》 CSCD 北大核心 2022年第4期888-897,共10页
将图片切分成单“字”识别再连接成“串”是脱机手写图像识别的一种方法,但由于手写字符间易存在粘连,切分方法不易实现。卷积循环神经网络(CRNN)虽解决了整张文本图片输入,标签却不易对齐的问题,但由于不同人脱机手写风格的严重差异,... 将图片切分成单“字”识别再连接成“串”是脱机手写图像识别的一种方法,但由于手写字符间易存在粘连,切分方法不易实现。卷积循环神经网络(CRNN)虽解决了整张文本图片输入,标签却不易对齐的问题,但由于不同人脱机手写风格的严重差异,网络提取出的特征表示力不够。对此提出了加强型卷积块注意力模块和复合卷积,并将其加入处理脱机文本识别的CRNN+CTC主流框架中。加强型卷积块注意力模块增大输入特征图的贡献权重且并联地使用通道注意力、空间注意力,丰富了细化特征图语义信息的同时避免了通道注意力模块对空间注意力模块的权重干扰,使得网络更聚焦图片中的有用特征而非无用的拖拽字迹特征。而嵌入在网络深层的复合卷积采用的多卷积核卷积意味着不同尺度的特征融合,增强了网络的泛化性。基于加强型卷积块注意力模块和复合卷积的CRNN+CTC框架在具有语义信息的IAM数据集上准确率达到85.7748%,字符错误率为8.6%;在RIMES数据集上准确率达到92.8728%,字符错误率为3.9%,比起当前主流的脱机文本识别算法,性能进一步提升。 展开更多
关键词 脱机英文手写单词识别 加强型卷积注意力模块 复合卷积 卷积循环神经网络(CRNN)
在线阅读 下载PDF
引入注意力机制的自监督光流计算 被引量:3
19
作者 安峰 戴军 +1 位作者 韩振 严仲兴 《图学学报》 CSCD 北大核心 2022年第5期841-848,共8页
光流计算是诸多计算机视觉系统的关键模块,广泛应用于动作识别、机器人定位与导航等领域。但目前端到端的光流计算仍受限于数据源的缺少,尤其是真实场景下的光流数据难以获取。人工合成的光流数据占绝大多数,且合成数据不能完全反应真... 光流计算是诸多计算机视觉系统的关键模块,广泛应用于动作识别、机器人定位与导航等领域。但目前端到端的光流计算仍受限于数据源的缺少,尤其是真实场景下的光流数据难以获取。人工合成的光流数据占绝大多数,且合成数据不能完全反应真实场景(如树叶晃动、行人倒影等),难以避免过拟合等情况。无监督或自监督方法可以利用海量的视频数据进行训练,摆脱了对数据集的依赖,是解决数据集缺少的有效途径。基于此搭建了一个自监督学习光流计算网络,其中的“Teacher”模块和“Student”模块集成了最新光流计算网络:稀疏相关体网络(SCV),减少了计算冗余量;同时引入注意力模型作为网络的一个节点,以提高图像特征在通道和空间上的维度属性。将SCV与注意力机制集成在自监督学习光流计算网络之中,在KITTI 2015数据集上的测试结果达到或超过了常见的有监督训练网络。 展开更多
关键词 光流计算 自监督学习 卷积注意力模块 空间/通道注意力 稀疏相关体
在线阅读 下载PDF
基于多层注意力机制的图文双模态情感分析 被引量:6
20
作者 周婷 杨长春 《计算机工程与设计》 北大核心 2023年第6期1853-1859,共7页
针对在图文双模态情感分析任务中,容易忽略通道信息,造成关键信息遗漏以及特征融合不充分、不考虑各模态权重的问题,提出一种基于多层注意力机制的图文双模态情感分析模型(multi-level attention mechanism fusion,MAMF)。使用BERT模型... 针对在图文双模态情感分析任务中,容易忽略通道信息,造成关键信息遗漏以及特征融合不充分、不考虑各模态权重的问题,提出一种基于多层注意力机制的图文双模态情感分析模型(multi-level attention mechanism fusion,MAMF)。使用BERT模型和双向长短时记忆网络结合的方式获得文本特征;在图片特征抽取中,引入卷积注意力模块(convolutional block attention module,CBAM)生成视觉注意特征;利用视觉引导的文本注意力和文本引导的视觉注意力重构特征向量,在特征融合中使用注意力机制对不同模态加权以区别其影响,最后输出进行分类。在多模态情感数据集MVSA上的实验验证了模型的有效性。 展开更多
关键词 图文情感分析 深度学习 卷积神经网络 卷积注意力模块 注意力机制 模态融合 多模态识别
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部