期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
基于空洞卷积与注意力模块的立体匹配算法 被引量:3
1
作者 刘志浩 孟凡云 +1 位作者 王金鹤 张楠 《计算机工程》 CAS CSCD 北大核心 2023年第8期223-231,共9页
基于卷积神经网络的立体匹配算法大多需要较大的感受野,但多数算法在扩大感受野的同时参数量也容易剧增,导致算法对训练数据的规模要求较高。提出一种基于空洞卷积和注意力模块的立体匹配算法,采用空洞卷积模块,将残差结构和空洞卷积相... 基于卷积神经网络的立体匹配算法大多需要较大的感受野,但多数算法在扩大感受野的同时参数量也容易剧增,导致算法对训练数据的规模要求较高。提出一种基于空洞卷积和注意力模块的立体匹配算法,采用空洞卷积模块,将残差结构和空洞卷积相结合,以在较少参数量的情况下扩大网络的感受野。使用注意力模块,通过不同层次的卷积整合多层次的信息,增加所提取信息的完整性。采用空间金字塔池化模块,通过帯权的金字塔池化扩大模型的感受野,并赋予不同层次信息不同的重要性程度。实验结果表明,在相同数据集和训练次数的情况下,所提算法相对于DispNetC等其他算法具有较快的收敛速度,且结构简单,参数量较少,适用于小样本数据。 展开更多
关键词 立体匹配 小样本数据 空洞卷积 注意力模块 金字塔池化
在线阅读 下载PDF
基于空洞空间金字塔池化U-Net的遥感图像多目标检测方法 被引量:4
2
作者 张善文 许新华 齐国红 《弹箭与制导学报》 北大核心 2023年第5期1-8,共8页
针对遥感图像(RSI)中的目标相对较小、形变多样,且包含分布不均匀的非目标和背景等问题,提出一种基于空洞空间金字塔池化U-Net的遥感图像多目标检测方法。该方法利用空洞多尺度卷积提取多尺度目标的分类特征,运用空洞空间池化金字塔模... 针对遥感图像(RSI)中的目标相对较小、形变多样,且包含分布不均匀的非目标和背景等问题,提出一种基于空洞空间金字塔池化U-Net的遥感图像多目标检测方法。该方法利用空洞多尺度卷积提取多尺度目标的分类特征,运用空洞空间池化金字塔模块扩大卷积特征图的感受野,提取更充分的目标特征,并采用注意力机制、残差连接和长跳跃连接充分保留卷积层提取的RSI的敏感特征。在公开遥感图像数据库EORSSD上的实验结果表明,所提出的方法能够从复杂多样的RSI中检测多尺度目标,检测精度为96.56%。 展开更多
关键词 遥感图像多目标检测 空洞多尺度卷积 空洞空间金字塔池化 空洞空间金字塔池化U-Net
在线阅读 下载PDF
基于声谱图时间分辨率优化与残差空间金字塔网络的车辆识别
3
作者 刘伟娜 赵红东 +2 位作者 史剑锋 张学志 赵一鸣 《计算机工程》 CAS CSCD 北大核心 2024年第12期376-385,共10页
车辆分类是智能交通系统的关键技术之一,是道路交通监控系统的一个重要研究领域。由于声学传感器具有效率高、成本低、可昼夜工作、隐蔽性强等优势,因此基于车辆声音特征的车辆分类引起了研究人员的广泛关注。然而,现有研究中的车辆声... 车辆分类是智能交通系统的关键技术之一,是道路交通监控系统的一个重要研究领域。由于声学传感器具有效率高、成本低、可昼夜工作、隐蔽性强等优势,因此基于车辆声音特征的车辆分类引起了研究人员的广泛关注。然而,现有研究中的车辆声音信号仅包含单一车辆,对于混合的双车辆声音信号的分类缺乏讨论。为此,设计一种网络模型对单车辆和双车辆共12种类别的噪声信号进行分类。针对声音频谱特征的固定分辨率并非最优的问题,基于网络训练得出的注意力得分和时间转换矩阵,控制噪声频谱时间大小,设计频谱时间分辨率优化模型。分类网络依据卷积递归神经网络(CRNN)架构,卷积网络部分(多尺度信号分析模块)参考高效空间金字塔模块对特征进行双分支融合处理,由于循环神经网络(RNN)等不利于并行化,运算速度慢,因此将因果时间卷积网络(TCN)转换为非因果循环TCN。在自制数据集中进行实验,结果表明,该模型的平均精度均值(mAP)达到0.98,远高于相当参数量下的CRNN网络,与MobileNetV3性能相当,但是相比MobileNetV3参数量减少了1.7×10^(6)。分析结果表明,所提模型适用于长时间声音信号处理任务,能提取深层次的特征。 展开更多
关键词 车辆识别 声音信号重建 卷积循环神经网络 高效空间金字塔模块 时间卷积神经网络 时间分辨率优化
在线阅读 下载PDF
结合空洞卷积和迁移学习改进YOLOv4的X光安检危险品检测 被引量:26
4
作者 吴海滨 魏喜盈 +3 位作者 刘美红 王爱丽 刘赫 岩堀祐之 《中国光学》 EI CAS CSCD 北大核心 2021年第6期1417-1425,共9页
由于X光安检图像存在背景复杂,重叠遮挡现象严重,危险品摆放方式、形状差异较大等问题,导致检测难度较高。针对上述问题,本文在YOLOv4的基础上,结合空洞卷积对其网络结构进行改进,加入空洞空间金字塔池化(Atrous Space Pyramid Pooling,... 由于X光安检图像存在背景复杂,重叠遮挡现象严重,危险品摆放方式、形状差异较大等问题,导致检测难度较高。针对上述问题,本文在YOLOv4的基础上,结合空洞卷积对其网络结构进行改进,加入空洞空间金字塔池化(Atrous Space Pyramid Pooling,ASPP)模型,以此增大感受野,聚合多尺度上下文信息。然后,通过K-means聚类方法生成更适合X光安检危险品检测的初始候选框。其中,模型训练时采用余弦退火优化学习率,进一步加速模型收敛,提高模型检测精度。实验结果表明,本文提出的ASPP-YOLOv4检测算法在SIXRay数据集上的mAP达到85.23%。该方法能有效减少X光安检图像中危险品的误检率,提高小目标危险品的检测能力。 展开更多
关键词 X光安检图像 YOLOv4 空洞卷积 空间金字塔池化 余弦退火
在线阅读 下载PDF
基于空洞卷积神经网络的毒株胚蛋裂纹分割
5
作者 耿磊 张静 +1 位作者 肖志涛 童军 《天津工业大学学报》 CAS 北大核心 2022年第3期69-75,共7页
针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解... 针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解码器网络结构与密集连接的空洞卷积结合,增强空间信息表示并重建不同尺度目标信息;同时,在网络浅层引入ASPP,获取多尺度特征,增强细节信息,提高网络分割性能。结果表明:在自制毒株胚蛋顶部裂纹与侧面裂纹数据集上,该方法的平均交并比(MIoU)分别达到了74.2%与81.3%,具有较强的鲁棒性。 展开更多
关键词 毒株胚蛋裂纹分割 卷积神经网络 编码器-解码器 空洞卷积 空洞空间金字塔池化
在线阅读 下载PDF
融合膨胀卷积与ECA的钢材缺陷检测算法 被引量:1
6
作者 曹义亲 曹鑫晨 《计算机工程与设计》 北大核心 2024年第11期3312-3319,共8页
针对带钢材料表面缺陷检测中感受野受限导致目标漏检率高的问题,基于YoloX-s模型提出一种膨胀卷积与注意力机制融合的目标检测算法。在Backbone部分采用SPPF结构替换SPP结构,在Neck部分引入混合膨胀卷积模块用以增大检测的感受野,嵌入... 针对带钢材料表面缺陷检测中感受野受限导致目标漏检率高的问题,基于YoloX-s模型提出一种膨胀卷积与注意力机制融合的目标检测算法。在Backbone部分采用SPPF结构替换SPP结构,在Neck部分引入混合膨胀卷积模块用以增大检测的感受野,嵌入注意力机制ECA-net模块,保留特征图更多的通道信息,减少漏检率。后处理阶段采用CIoU损失函数,提高模型召回率。实验结果表明,改进算法在NEU-DET数据集上的mAP达到80.8%,较原模型提高4.6%,检测速度达到160 f/s,在带钢材料表面缺陷检测中具有一定的使用价值。 展开更多
关键词 带钢材料 缺陷检测 空间金字塔池化改进 膨胀卷积 注意力机制模块 损失函数 东北大学热轧带钢表面缺陷数据集
在线阅读 下载PDF
融合深度神经网络和空洞卷积的语义图像分割研究 被引量:13
7
作者 陈洪云 孙作雷 孔薇 《小型微型计算机系统》 CSCD 北大核心 2020年第1期166-170,共5页
语义分割是计算机视觉中的基本任务,是对图像中的不同目标进行像素级的分割与分类.针对多尺度的目标分割难题,本文提出了一种基于Res Net网络的方法,通过定义并联支路,将浅层特征图像信息融合到深层特征图像中,提出新的空洞空间金字塔模... 语义分割是计算机视觉中的基本任务,是对图像中的不同目标进行像素级的分割与分类.针对多尺度的目标分割难题,本文提出了一种基于Res Net网络的方法,通过定义并联支路,将浅层特征图像信息融合到深层特征图像中,提出新的空洞空间金字塔模块,该模块采用并行的不同采样率的空洞卷积进行特征提取与融合,从而更有效的提取不同层的特征以及上下文信息,并且在新模块中加入批规范化计算,增强参数调优的稳定性.本文还采用了Adam自适应优化函数,在训练的过程中,使得每个参数的更新都具有独立性,提升了模型训练的稳定性.本文结果在PASCAL VOC 2012语义分割测试集中取得了77.31%mIOU的成果,优于Deeplab V3的效果. 展开更多
关键词 语义分割 神经网络 空洞卷积 空洞空间金字塔模块
在线阅读 下载PDF
基于动态金字塔和子空间注意力的图像超分辨率重建网络 被引量:6
8
作者 何鹏浩 余映 徐超越 《计算机科学》 CSCD 北大核心 2022年第S02期423-430,共8页
针对现有单图像超分辨率卷积神经网络存在模型参数过多以及重建失真过大的问题,提出了一种基于动态金字塔结构与子空间注意力模块的轻量级单图像超分辨率网络模型。首先,所采用的动态多尺度金字塔特征组合模块的网络主体由动态卷积和金... 针对现有单图像超分辨率卷积神经网络存在模型参数过多以及重建失真过大的问题,提出了一种基于动态金字塔结构与子空间注意力模块的轻量级单图像超分辨率网络模型。首先,所采用的动态多尺度金字塔特征组合模块的网络主体由动态卷积和金字塔分组卷积构成。其次,动态卷积可以根据不同的图像内容自适应地进行不同的卷积操作,从而对不同的图像提取出不同的特征;金字塔分组卷积不仅可以更好地提取多尺度图像特征信息,而且能够有效降低网络模型的参数量。最后,在网络模型末端采用子空间注意力模块,将图像的通道空间分为多个子空间,并为每个子空间学习不同的注意力图,这样不仅可以更好地捕获图像的跨通道相关信息,而且可以有效融合各子空间的图像特征信息。与现有主流算法相比,所提方法不仅具有更小的网络模型参数量,而且重建出的超分辨率图像在视觉效果和定量分析方面均能取得更好的表现。 展开更多
关键词 超分辨率 轻量级 动态卷积 金字塔分组卷积 空间注意力模块
在线阅读 下载PDF
CASPN:基于级联空间金字塔的人脸关键点定位网络 被引量:1
9
作者 谢金衡 张炎生 《计算机应用研究》 CSCD 北大核心 2020年第9期2856-2860,共5页
针对非限制环境下人脸关键点定位的诸多干扰因素,如遮挡、阴影,以及如何设计更加轻量、快速的神经网络的问题,尝试并联不同空洞率的空洞卷积应用于人脸关键点定位,在保持特征分辨率的同时,快速增大并且获取多重感受野信息来获得更全局... 针对非限制环境下人脸关键点定位的诸多干扰因素,如遮挡、阴影,以及如何设计更加轻量、快速的神经网络的问题,尝试并联不同空洞率的空洞卷积应用于人脸关键点定位,在保持特征分辨率的同时,快速增大并且获取多重感受野信息来获得更全局的语义信息,同时结合特征融合为精确定位关键点与关键点猜测提供丰富的上下文信息,以此提出一种实时、轻量级、高检测精度的人脸关键点定位网络。该网络的参数量约为2.7million,模型只有10.6 MB,在保持高检测精度的同时,在GTX1080设备上可达约150 fps的处理速度。目前在流行的数据集中也获得了优异的评估结果,其中在WFLW测试集中取得了5.40%的mean error与7.36%的failure rate。 展开更多
关键词 空洞卷积 空间金字塔 级联网络 人脸关键点定位
在线阅读 下载PDF
改进U-Net模型的隧道掌子面图像语义分割研究
10
作者 陈登峰 程静 +1 位作者 赵蕾 何拓航 《防灾减灾工程学报》 北大核心 2025年第4期776-783,共8页
隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征... 隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征传递到高层的跳跃连接导致特征映射过大。因此,提出加入空洞空间卷积池化金字塔模块ASPP和卷积注意力模块CBAM的改进U-Net模型。在U-Net模型的跳跃连接过程中加ASPP,利用不同膨胀率的空洞卷积捕获不同尺度的上下文信息,融合不同感受野的信息,从而更全面的理解图像内容;U-Net模型的下采样过程中加入CBAM,使网络模型更加关注有用的特征,从而增强特征的表达能力。实验结果表明,改进的网络模型相较于原始U-Net模型分割和识别性能有显著提升,在某隧道工程掌子面岩体图像数据集上Precision达到93.04%,mIoU达到74.98%,mPA达到78.89%。 展开更多
关键词 隧道掌子面 图像语义分割 卷积注意力模块 空洞空间卷积池化金字塔模块
在线阅读 下载PDF
时空网络特征融合的病理步态识别方法
11
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
基于MobileNet的轻量化云检测模型
12
作者 叶武剑 谢林峰 +2 位作者 刘怡俊 温晓卓 李扬 《自然资源遥感》 北大核心 2025年第3期95-103,共9页
针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制... 针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制和挤压激励(squeeze-and-excitation,SE)注意力模块来增强通道间的信息交流。通过这种方式,既减少了参数量和计算复杂度,又保持了对重要特征的提取能力。在上采样阶段,使用了RepConv模块和改进的空洞空间金字塔池化模块(atrous spatial pyramid pooling,ASPP),以提高网络的学习能力和捕捉图像细节与空间信息的能力。实验结果证明,该文模型在参数量和模型复杂度降低的情况下,能够实现较高精度的云检测,具备实用性和可行性。 展开更多
关键词 云检测 MobileNet网络 注意力机制 多尺度特征 空洞空间金字塔池化模块
在线阅读 下载PDF
基于分组卷积进行特征融合的全景分割算法 被引量:9
13
作者 冯兴杰 张天泽 《计算机应用》 CSCD 北大核心 2021年第7期2054-2061,共8页
针对图像全景分割任务对于实践应用中现有网络结构运算不够快速的问题,提出一种基于分组卷积进行特征融合的全景分割算法。首先,通过自底向上的方式选择经典残差网络结构(ResNet)进行特征提取,并采用不同扩张率的空洞卷积空间金字塔池... 针对图像全景分割任务对于实践应用中现有网络结构运算不够快速的问题,提出一种基于分组卷积进行特征融合的全景分割算法。首先,通过自底向上的方式选择经典残差网络结构(ResNet)进行特征提取,并采用不同扩张率的空洞卷积空间金字塔池化操作(ASPP)对提取到的特征进行语义分割与实例分割的多尺度特征融合;然后,通过提出一种单路分组卷积上采样方法,整合语义与实例特征进行上采样特征融合至指定大小;最后,通过对语义分支、实例分支以及实例中心点这三个分支进行损失函数运算以得到更加精细的全景分割输出结果。该模型在CityScapes数据集上与注意力引导的联合全景分割网络(AUNet)、全景特征金字塔网络(Panoptic FPN)、亲和金字塔单阶段实例分割算法(SSAP)、联合全景分割网络(UPSNet)、Panoptic-DeepLab等方法进行了实验对比。实验结果表明,与对比方法中表现最好的Panoptic-DeepLab模型相比,所提模型在极大减少了解码网络参数量的情况下,全景分割质量(PQ)值为0.565,仅下降了0.003,在建筑物、火车、自行车等物体的分割质量上有0.3~5.5的提升,平均精确率(AP)、目标IoU阈值超过50%的平均精确率(AP50)分别提升了0.002与0.014,平均交并比(mIoU)值提升了0.06。可见该方法能提升图像全景分割速度,在PG、AP、mIoU三个指标上均有较好的精度,可以有效地完成全景分割任务。 展开更多
关键词 图像全景分割 语义分割 实例分割 分组卷积 空洞卷积 空间金字塔池化
在线阅读 下载PDF
基于注意力机制和深度卷积神经网络的材质识别方法 被引量:2
14
作者 许华杰 杨洋 李桂兰 《计算机科学》 CSCD 北大核心 2021年第10期220-225,共6页
材质识别旨在识别自然材质图像中的主要对象及其所属材料类别。针对材质图像数据集通常数据量少、人工标注局部纹理区域困难所导致的材质识别准确率低的问题,提出了一种基于注意力机制和深度卷积神经网络的材质识别方法,该方法的核心是... 材质识别旨在识别自然材质图像中的主要对象及其所属材料类别。针对材质图像数据集通常数据量少、人工标注局部纹理区域困难所导致的材质识别准确率低的问题,提出了一种基于注意力机制和深度卷积神经网络的材质识别方法,该方法的核心是材质识别深度卷积神经网络(MaterialNet)。MaterialNet利用深度残差网络对图像进行特征提取,采用所提出的级联空洞空间金字塔池化的方式引入注意力机制,使网络可以通过端到端训练自适应地关注包含纹理特征的关键区域,从而有效识别材质的局部纹理特征。在FMD材质数据集上进行实验,结果表明,MaterialNet的总体识别准确率可达到82.3%,比当前主流的B-CNN和CNN+FV材质识别方法分别提高了7.2%和4.5%,对多种材质的识别准确率较高且具有参数量少、计算量小等优点。 展开更多
关键词 注意力机制 深度卷积神经网络 空洞卷积 空间金字塔池化
在线阅读 下载PDF
全卷积注意力机制神经网络的图像语义分割 被引量:16
15
作者 欧阳柳 贺禧 瞿绍军 《计算机科学与探索》 CSCD 北大核心 2022年第5期1136-1145,共10页
全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功。研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类。针对完全卷积... 全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功。研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类。针对完全卷积网络上下文信息丢失问题,提出基于像素的注意力方法。该方法利用计算高级特征图像素之间的联系来获取全局信息,增强像素之间的相关性,再结合空洞空间金字塔池化进一步提取图像的特征信息。针对图像的高层特征图像素丢失的问题,提出了基于图像不同层级的注意力方法。该方法将高层特征图中的信息作为指导对低层特征图中隐藏的信息进行挖掘,然后和高级特征图进行融合,充分利用高级特征图信息和低级特征图的信息。在实验方面,通过对比所提不同模块对全卷积神经网络分割性能的影响,验证了所提方法的有效性。同时在公认的图像语义分割数据集Cityscapes上与当前先进的网络进行实验对比,结果显示所提方法在客观评价指标和主观效果方面均存在优越性,并在Cityscapes官网测试集中达到了69.3%的准确率,性能比近期几个先进网络高出3~5个百分点。 展开更多
关键词 卷积神经网络 空洞空间金字塔池化 注意力模型 语义分割
在线阅读 下载PDF
YOLOv4-tiny算法的融合模块在卷烟小包外观缺失检测中的应用 被引量:10
16
作者 杨超 李佳田 +3 位作者 张泽龙 陆大进 张兴忆 杨树青 《中国烟草学报》 CAS CSCD 北大核心 2022年第2期59-64,共6页
卷烟烟包外包装图案缺失检测是卷烟生产中的重要环节,目前常用的图案缺失检测方法普遍存在漏检率高、识别精度不够和速度慢等问题。因此本文提出了一种基于YOLOv4-tiny的烟包缺陷快速检测方法。该方法主要包括:(1)使用CSPDarknet53-tin... 卷烟烟包外包装图案缺失检测是卷烟生产中的重要环节,目前常用的图案缺失检测方法普遍存在漏检率高、识别精度不够和速度慢等问题。因此本文提出了一种基于YOLOv4-tiny的烟包缺陷快速检测方法。该方法主要包括:(1)使用CSPDarknet53-tiny对图像特征进行提取。(2)通过添加多空间空洞卷积融合模块,获得丰富的上下文信息,增强感受野,从而提高模型的检测精度。(3)使用EIoU边框位置回归损失函数,提高烟盒图案识别预测框的精确率。本文方法与YOLOv4-tiny进行对比,实验结果表明,本文算法m AP值为97.35%,检测烟包外观的平均时间为17ms,能够满足卷烟小包外观检测对时间和精确率的要求。相较于YOLOv4-tiny在m AP上提升了1.34%,在AverageIoU上提升了3.68%,速度基本与YOLOv4-tiny持平,在保持快速检测的同时能够有效的提高精度。 展开更多
关键词 YOLOv4-tiny EIoU 图案检测 空间空洞卷积融合模块
在线阅读 下载PDF
基于改进卷积神经网络的多视角人脸表情识别 被引量:22
17
作者 钱勇生 邵洁 +3 位作者 季欣欣 李晓瑞 莫晨 程其玉 《计算机工程与应用》 CSCD 北大核心 2018年第24期12-19,共8页
人脸表情识别是计算机视觉领域的研究热点之一。针对自然状态下的人脸存在多视角变化、脸部信息缺失等问题,提出了一种基于MVFE-LightNet(Multi-View Facial Expression Lightweight Network)的多视角人脸表情识别方法。首先,在残差网... 人脸表情识别是计算机视觉领域的研究热点之一。针对自然状态下的人脸存在多视角变化、脸部信息缺失等问题,提出了一种基于MVFE-LightNet(Multi-View Facial Expression Lightweight Network)的多视角人脸表情识别方法。首先,在残差网络的基础上设计卷积网络提取不同视角下的表情特征,引入深度可分离卷积来减少网络参数。其次,嵌入压缩和奖惩网络模块学习特征权重,利用特征重新标定方式提高网络表示能力,并通过加入空间金字塔池化增强网络的鲁棒性。最后,为了进一步优化识别结果,采用AdamW(Adam with Weight decay)优化方法使网络模型加速收敛。在RaFD、BU-3DFE和Fer2013表情库上的实验表明,该方法具有较高的识别率,且减少网络计算时间。 展开更多
关键词 多视角人脸表情识别 MVFE—LightNet 残差网络 深度可分离卷积 压缩和奖惩网络模块 空间金字塔池化
在线阅读 下载PDF
改进全卷积神经网络的甲状腺结节分割方法
18
作者 张雅婷 帅仁俊 +2 位作者 黄道宏 赵宸 吴梦麟 《数据采集与处理》 CSCD 北大核心 2023年第4期873-885,共13页
为了更加精确地分割出甲状腺结节,本文提出了一种改进的全卷积神经网络(Fully convolutional network,FCN)分割模型。相较于FCN,本文方法加入了空洞空间卷积池化金字塔(Atrousspatialpyramidpooling,ASPP)模块与多层特征传递模块(Featur... 为了更加精确地分割出甲状腺结节,本文提出了一种改进的全卷积神经网络(Fully convolutional network,FCN)分割模型。相较于FCN,本文方法加入了空洞空间卷积池化金字塔(Atrousspatialpyramidpooling,ASPP)模块与多层特征传递模块(Featuretransfer,FT),并采用LinkNet模型中Decoder模块进行上采样,VGG16主干网络实现特征提取下采样。实验采用来自斯坦福AIMI(Artificial intelligence in medicine and imaging)共享数据集的17413张超声甲状腺结节图像分别用于训练、验证和测试。实验结果表明,相比于其他多种分割模型,本文模型在平均交并比(mean Intersection over union,mIoU),Dice相似系数,F1分数3个分割指标上分别达到了79.7%,87.6%和98.42%,实现了更好的分割效果,有效地提升了甲状腺结节的分割精确度。 展开更多
关键词 甲状腺结节 分割 特征提取 空洞空间卷积池化金字塔
在线阅读 下载PDF
基于DeeplabV3+网络的轻量化语义分割算法 被引量:3
19
作者 张秀再 张昊 杨昌军 《科学技术与工程》 北大核心 2024年第24期10382-10393,共12页
针对传统语义分割模型参数量大、计算速度慢且效率不高等问题,改进一种基于DeeplabV3+网络的轻量化语义分割模型Faster-DeeplabV3+。Faster-DeeplabV3+模型采用轻量级MobilenetV2代替Xception作为主干特征提取网络,大幅减少参数量,提高... 针对传统语义分割模型参数量大、计算速度慢且效率不高等问题,改进一种基于DeeplabV3+网络的轻量化语义分割模型Faster-DeeplabV3+。Faster-DeeplabV3+模型采用轻量级MobilenetV2代替Xception作为主干特征提取网络,大幅减少参数量,提高计算速度;引入深度可分离卷积(deep separable convolution, DSC)与空洞空间金字塔(atrous spatia pyramid pooling, ASPP)中的膨胀卷积设计成新的深度可分离膨胀卷积(depthwise separable dilated convolution, DSD-Conv),即组成深度可分离空洞空间金字塔模块(DP-ASPP),扩大感受野的同时减少原本卷积参数量,提高运算速度;加入改进的双注意力机制模块分别对编码区生成的低级特征图和高级特征图进行处理,增强网络对不同维度特征信息提取的敏感性和准确性;融合使用交叉熵和Dice Loss两种损失函数,为模型提供更全面、更多样的优化。改进模型在PASCAL VOC 2012数据集上进行测试。实验结果表明:平均交并比由76.57%提升至79.07%,分割准确度由91.2%提升至94.3%。改进模型的网络参数量(params)减少了3.86×10~6,浮点计算量(GFLOPs)减少了117.98 G。因此,Faster-DeeplabV3+算法在大幅降低参数量、提高运算速度的同时保持较高语义分割效果。 展开更多
关键词 语义分割 DeeplabV3+ 轻量化 深度可分离卷积(DSC) 空洞空间金字塔池化(ASPP)
在线阅读 下载PDF
基于改进DeepLabV3+的轻量化茶叶嫩芽采摘点识别模型 被引量:3
20
作者 胡程喜 谭立新 +1 位作者 王文胤 宋敏 《智慧农业(中英文)》 CSCD 2024年第5期119-127,共9页
[目的/意义]名优茶的采摘是茶产业中至关重要的环节,识别和定位名优茶嫩芽采摘点是现代化采茶过程中的重要组成部分。传统神经网络方法存在着模型体量大、训练时间长,以及应对场景复杂等问题。本研究以湖南省溪清茶园为实际场景,提出一... [目的/意义]名优茶的采摘是茶产业中至关重要的环节,识别和定位名优茶嫩芽采摘点是现代化采茶过程中的重要组成部分。传统神经网络方法存在着模型体量大、训练时间长,以及应对场景复杂等问题。本研究以湖南省溪清茶园为实际场景,提出一种新型深度学习算法解决名优茶采摘点的精确分割难题。[方法]对传统的DeepLabV3+算法进行轻量化改进。首先,针对其模型体量大、训练时间长的问题,使用MobilenetV2网络提取图像的初始特征,并按照网络结构划分深浅层特征;其次,将高效通道注意力网络(Efficient Channel Attention Network,ECANet)与空洞空间卷积池化金字塔(Atrous Spatial Pyramid Pooling,ASPP)模块结合,得到ECA_ASPP模块,并将深层特征输入到ECA_ASPP模块中进行多尺度特征融合以减少无效信息,将经过处理后的深浅层特征相加,随后通过卷积和上采样的方式对特征信息进行还原,得到分割结果;最后,通过对识别结果进行处理以获得茶叶嫩芽采摘点。[结果和讨论]改进后的DeepLabV3+在茶叶嫩芽数据集上的平均交并比达到93.71%,平均像素准确率达到97.25%,模型参数量由原来以Xception为底层网络的54.714 M下降至5.818 M。[结论]本研究在茶叶嫩芽结构分割上相对于原版DeepLabV3+的检测速度更快、参数量更小,同时保证了较高的准确率,为智能采茶机器人的采摘提供了新的定位方法。 展开更多
关键词 轻量化模型 DeepLabV3+ 注意力机制 茶叶嫩芽 ECANet 名优茶 空洞空间卷积池化金字塔
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部