期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
融合空洞空间金字塔池化和注意力的轻量化遥感影像道路提取 被引量:3
1
作者 刘志恒 岳子腾 +3 位作者 周绥平 江澄 节永师 陈雪梅 《航天返回与遥感》 CSCD 北大核心 2024年第1期111-122,共12页
针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块... 针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块,实现多尺度道路信息融合;再引入挤压激励通道注意力机制,增强网络特征表征质量;最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化,以降低模型计算复杂度。在公开数据集上进行了模型性能测试,实验结果表明,文章所提算法的准确率、精确率、召回率、F1分数和平均交并比,相比原始HRNet分别提升了5.35%、2.15%、4.1%、3.15%和14.34%,且减少了36.1%的参数数量;相比其他网络,该算法突出了细小道路的特征,道路预测结果连续性、完整性好,并且模型小易于部署在实时检测设备中,有效改善了道路提取任务中错分和缺失的情况,是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。 展开更多
关键词 道路提取 空间金字塔池化 通道注意力机制 可分离卷积 高分辨率网络 遥感影像
在线阅读 下载PDF
基于空洞空间池化金字塔的自动驾驶图像语义分割方法 被引量:5
2
作者 王大方 刘磊 +3 位作者 曹江 赵刚 赵文硕 唐伟 《汽车工程》 EI CSCD 北大核心 2022年第12期1818-1824,共7页
如果车辆在道路上能精确而快速地理解人和车的语义,就能在很大程度上对障碍躲避、路径规划等做出指导。现有的基于深度学习的语义分割方法存在分割速度和分割精度不能兼得等问题。本文在现有语义分割网络的基础上,通过在特征提取基准网... 如果车辆在道路上能精确而快速地理解人和车的语义,就能在很大程度上对障碍躲避、路径规划等做出指导。现有的基于深度学习的语义分割方法存在分割速度和分割精度不能兼得等问题。本文在现有语义分割网络的基础上,通过在特征提取基准网络后添加空洞空间池化金字塔结构,可以获取图像的多尺度语义信息。实验结果表明,文中提出的A_ASPP_1和A_ASPP_2两个模块能对自动驾驶场景中常见的人和各类车辆图像进行有效的分割。对应的两种改进的网络结构虽然分割速度稍有降低,但其训练结果的平均交并比相比现有双分支网络BiSeNet分别提升了2.1和1.2个百分点。 展开更多
关键词 语义分割 自动驾驶 空洞空间池化金字塔
在线阅读 下载PDF
基于空洞空间金字塔池化U-Net的遥感图像多目标检测方法 被引量:2
3
作者 张善文 许新华 齐国红 《弹箭与制导学报》 北大核心 2023年第5期1-8,共8页
针对遥感图像(RSI)中的目标相对较小、形变多样,且包含分布不均匀的非目标和背景等问题,提出一种基于空洞空间金字塔池化U-Net的遥感图像多目标检测方法。该方法利用空洞多尺度卷积提取多尺度目标的分类特征,运用空洞空间池化金字塔模... 针对遥感图像(RSI)中的目标相对较小、形变多样,且包含分布不均匀的非目标和背景等问题,提出一种基于空洞空间金字塔池化U-Net的遥感图像多目标检测方法。该方法利用空洞多尺度卷积提取多尺度目标的分类特征,运用空洞空间池化金字塔模块扩大卷积特征图的感受野,提取更充分的目标特征,并采用注意力机制、残差连接和长跳跃连接充分保留卷积层提取的RSI的敏感特征。在公开遥感图像数据库EORSSD上的实验结果表明,所提出的方法能够从复杂多样的RSI中检测多尺度目标,检测精度为96.56%。 展开更多
关键词 遥感图像多目标检测 空洞多尺度卷积 空洞空间金字塔池化 空洞空间金字塔池化U-Net
在线阅读 下载PDF
多尺度空洞卷积金字塔网络建筑物提取 被引量:5
4
作者 张春森 刘恒恒 +2 位作者 葛英伟 史书 张觅 《西安科技大学学报》 CAS 北大核心 2021年第3期490-497,574,共9页
为改善现有深度学习方法获取图像特征尺度单一、提取精度较低等问题,提出多尺度空洞卷积金字塔网络建筑物提取方法。多尺度空洞卷积金字塔网络以U-Net为基础模型,编码-解码阶段采用空洞卷积替换普通卷积扩大感受野,使得每个卷积层输出... 为改善现有深度学习方法获取图像特征尺度单一、提取精度较低等问题,提出多尺度空洞卷积金字塔网络建筑物提取方法。多尺度空洞卷积金字塔网络以U-Net为基础模型,编码-解码阶段采用空洞卷积替换普通卷积扩大感受野,使得每个卷积层输出包含比普通卷积更大范围的特征信息,以利于获取遥感影像中建筑物特征的全局信息,金字塔池化模块结合U-Net跳跃连接结构整合多尺度的特征,以获取高分辨率全局整体信息及低分辨率局部细节信息。在WHU数据集上进行提取实验,交并比达到了91.876%,相比其他语义分割网络交并比提升4.547%~10.826%,在Inria数据集上进行泛化实验,泛化精度高于其他网络。结果表明所提出的空洞卷积金字塔网络提取精度高,泛化能力强,且在不同尺度建筑物提取上具有良好的适应性。 展开更多
关键词 建筑物提取 多尺度 空洞卷积 金字塔池化
在线阅读 下载PDF
基于深度敏感空间金字塔池化的RGBD语义分割 被引量:4
5
作者 杨胜杰 仇振安 +1 位作者 高小宁 李建勋 《电光与控制》 CSCD 北大核心 2020年第12期84-89,共6页
基于标准的2D卷积核的RGBD语义分割模型多是将深度图作为一个单独的通道,由于其卷积核特性的限制,无法充分挖掘深度信息带来的几何结构信息。针对该缺陷,构建深度敏感卷积核和池化层实现对深度信息的丰富挖掘;并使用深度敏感空间金字塔... 基于标准的2D卷积核的RGBD语义分割模型多是将深度图作为一个单独的通道,由于其卷积核特性的限制,无法充分挖掘深度信息带来的几何结构信息。针对该缺陷,构建深度敏感卷积核和池化层实现对深度信息的丰富挖掘;并使用深度敏感空间金字塔池化对多尺度信息进行提取,实现对不同尺度物体分割的效果。NYU v2和SUN RGB-D数据集上的实验结果表明此方法有效提高了整体的语义分割精度。 展开更多
关键词 RGBD语义分割 深度敏感卷积 空间金字塔池化
在线阅读 下载PDF
基于空洞卷积神经网络的毒株胚蛋裂纹分割
6
作者 耿磊 张静 +1 位作者 肖志涛 童军 《天津工业大学学报》 CAS 北大核心 2022年第3期69-75,共7页
针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解... 针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解码器网络结构与密集连接的空洞卷积结合,增强空间信息表示并重建不同尺度目标信息;同时,在网络浅层引入ASPP,获取多尺度特征,增强细节信息,提高网络分割性能。结果表明:在自制毒株胚蛋顶部裂纹与侧面裂纹数据集上,该方法的平均交并比(MIoU)分别达到了74.2%与81.3%,具有较强的鲁棒性。 展开更多
关键词 毒株胚蛋裂纹分割 卷积神经网络 编码器-解码器 空洞卷积 空洞空间金字塔池化
在线阅读 下载PDF
基于空洞卷积的语义图像分割算法研究 被引量:4
7
作者 梁格颖 王文琪 +1 位作者 汪文 霍智勇 《信息通信》 2019年第6期33-36,共4页
图像语义分割是通过对图像中每个像素点分类别地进行标记,使机器能够自动识别并分割出图像中的不同内容。目前全卷积网络进行图像语义分割时,池化层使感受野增大,造成图像空间尺度信息丢失。使用空洞卷积神经网络对图像语义进行分割,能... 图像语义分割是通过对图像中每个像素点分类别地进行标记,使机器能够自动识别并分割出图像中的不同内容。目前全卷积网络进行图像语义分割时,池化层使感受野增大,造成图像空间尺度信息丢失。使用空洞卷积神经网络对图像语义进行分割,能够消除池化层带来的减小图像尺寸问题,保持图像空间维度信息。文章对密集特征提取以及空间金字塔池化模块进行了优化,提出了一种新的语义分割网络。文章基于PASCAL VOC 2012数据集进行算法有效性的验证,相比于之前的算法分割准确性高11.4%。 展开更多
关键词 空洞卷积 空间金字塔池化 语义分割 深度学习
在线阅读 下载PDF
编码-解码多尺度卷积神经网络人群计数方法 被引量:9
8
作者 孟月波 纪拓 +2 位作者 刘光辉 徐胜军 李彤月 《西安交通大学学报》 EI CAS CSCD 北大核心 2020年第5期149-157,共9页
针对基于多列卷积神经网络的人群计数方法存在的多尺度特征信息丢失、融合不佳以及密度图质量不高等问题,提出了一种编码-解码结构的多尺度卷积神经网络人群计数方法。编码器采用多列卷积捕获多尺度特征,通过空洞空间金字塔池化扩大感... 针对基于多列卷积神经网络的人群计数方法存在的多尺度特征信息丢失、融合不佳以及密度图质量不高等问题,提出了一种编码-解码结构的多尺度卷积神经网络人群计数方法。编码器采用多列卷积捕获多尺度特征,通过空洞空间金字塔池化扩大感受野并减少参数量,保留尺度特征和图像的上下文信息;解码器对编码器输出进行上采样,实现高层语义信息和编码器前端低层特征信息有效融合,从而提升了密度图的输出质量。为增强网络对计数的敏感性,在以往像素空间损失的基础上考虑了计数误差,提出了一种新型损失函数。采用Shanghai Tech、Mall以及自建数据集进行了对比实验,结果表明:与之前最优方法相比,所提方法在Shanghai Tech数据集Part_A部分的平均绝对误差和均方误差分别降低了8.3%和21.3%,Part_B部分分别降低了12.9%和12.0%,Mall数据集分别降低了15.1%和23.8%,自建数据集分别降低了13.5%和7.1%;在不同人群场景下,所提方法的人群计数准确性和鲁棒性均优于其他对比方法的。 展开更多
关键词 人群计数 编码-解码结构 多尺度 空洞空间金字塔池化 计数误差 损失函数
在线阅读 下载PDF
卷积神经网络混合模型的心律失常分类算法 被引量:2
9
作者 熊慧 梁美玲 刘近贞 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2021年第2期33-39,共7页
心律失常表现为不规则的心跳,心律失常类型的判断是心血管疾病早期预防和诊断的关键.为提高心律失常分类的准确率和速度,实现心律失常类型的自动识别,研究并提出了一种以卷积神经网络(convolutional neural network,CNN)为核心的7层混... 心律失常表现为不规则的心跳,心律失常类型的判断是心血管疾病早期预防和诊断的关键.为提高心律失常分类的准确率和速度,实现心律失常类型的自动识别,研究并提出了一种以卷积神经网络(convolutional neural network,CNN)为核心的7层混合模型结构.为保持心拍的完整性,根据R-R间期对心电信号进行动态分割得到不同长度的心拍.通过卷积层卷积核的滑动提取心拍的局部特征,平均池化层进行下采样,降低特征的维度.空间金字塔池化(spatial pyramid pooling,SPP)层以不同的池化步长二次提取心拍特征,不同长度的输入特征经过SPP层的特征融合后得到相同长度的输出特征.利用极限学习机(extreme learning machine,ELM)作为分类器可以提高分类的速度,缩短训练时间.使用MIT-BIH数据集和十折交叉验证方法验证心律失常4分类模型的有效性,最终得出在测试集上分类总体准确率为99.16%,灵敏度为99.85%,特异性为98.89%,精度为99.85%.在相同软件环境下验证混合模型与单个模型的准确率与训练时间,实验结果表明:混合模型能以更少的训练时间获得更高的准确率,为快速准确地识别心律失常类型提供了一种可行方案. 展开更多
关键词 心律失常分类 心电图 卷积神经网络 空间金字塔池化 极限学习机
在线阅读 下载PDF
基于卷积神经网络的乳腺疾病检测算法
10
作者 赵京霞 钱育蓉 +1 位作者 张猛 杜娇 《微电子学与计算机》 北大核心 2019年第7期48-53,共6页
为提高计算机辅助乳腺疾病检测的准确率,提出一种基于卷积神经网络的乳腺疾病检测算法.首先,分别从卷积神经网络中提取图像的浅层特征与深层特征并对其进行加权融合;其次,通过在卷积神经网络中构建空间金字塔池化层,实现了卷积神经网络... 为提高计算机辅助乳腺疾病检测的准确率,提出一种基于卷积神经网络的乳腺疾病检测算法.首先,分别从卷积神经网络中提取图像的浅层特征与深层特征并对其进行加权融合;其次,通过在卷积神经网络中构建空间金字塔池化层,实现了卷积神经网络的多尺度输入;最后,在Mammographic Image Analysis Society(MIAS)数据集上进行验证实验.实验结果表明,本文提出的乳腺疾病检测算法平均准确率高达94.93%,与其他乳腺疾病检测算法进行对比实验可知,本文提出的乳腺疾病检测算法具有更高的检测准确率. 展开更多
关键词 卷积神经网络 特征融合 空间金字塔池化 尺度无关 乳腺疾病检测
在线阅读 下载PDF
基于迭代压缩U型网络的煤颗粒分割与粒度分析方法
11
作者 程德强 张瑞 +4 位作者 谢同喜 刘敬敬 郑丽娟 寇旗旗 江鹤 《煤炭学报》 北大核心 2025年第2期1362-1375,共14页
煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘... 煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘细节起着关键作用,直接影响分割结果的准确性。基于卷积神经网络架构的U型网络过于注重局部信息,忽视了全局信息的重要性,容易导致过分割现象。而基于Transformer的网络利用多头自注意力机制有效地建模了全局信息,但却没有充分利用边缘细节特征,导致煤颗粒漏分割问题。为了解决上述问题,本研究提出了迭代压缩U型网络(Iterative Squeeze UNet,ISUNet)用于煤颗粒粒度分析。ISUNet模型引入了压缩激励空洞空间金字塔池化模块和基于Transformer的多路迭代编码器。压缩激励空洞空间金字塔池化模块通过增强不同尺度特征的通道信息和全局上下文信息,解决了煤粒过分割问题。编码器中的多头自注意力模块将ResNet50的卷积特征作为其中一个输入,通过点乘自注意力机制不断强化重要的边缘细节特征,解决了煤粒漏分割问题。与5种经典图像分割模型和4种目前主流的分割模型相比,ISUNet表现出色。相较于经典的分割模型TransUNet来说,平均交并比提高了6.6%,准确率提高了0.3%,召回率提高了7.0%,相较于目前主流的图像分割大模型Segment Anything来说,平均交并比提高了4.6%,准确率提高了0.2%,召回率提高了4.9%。在煤粒粒度测量方面,准确率达到了97.49%。这些试验结果充分证实了ISUNet在煤粒粒度分析中的有效性和优越性。 展开更多
关键词 煤粒粒度分析 图像分割 基于Transformer的多路迭代编码器 压缩激励空洞空间金字塔池化 U型网络
在线阅读 下载PDF
基于超像素级卷积神经网络的多聚焦图像融合算法 被引量:13
12
作者 聂茜茜 肖斌 +1 位作者 毕秀丽 李伟生 《电子与信息学报》 EI CSCD 北大核心 2021年第4期965-973,共9页
该文提出了基于超像素级卷积神经网络(sp-CNN)的多聚焦图像融合算法。该方法首先对源图像进行多尺度超像素分割,将获取的超像素输入sp-CNN,并对输出的初始分类映射图进行连通域操作得到初始决策图;然后根据多幅初始决策图的异同获得不... 该文提出了基于超像素级卷积神经网络(sp-CNN)的多聚焦图像融合算法。该方法首先对源图像进行多尺度超像素分割,将获取的超像素输入sp-CNN,并对输出的初始分类映射图进行连通域操作得到初始决策图;然后根据多幅初始决策图的异同获得不确定区域,并利用空间频率对其再分类,得到阶段决策图;最后利用形态学对阶段决策图进行后处理,并根据所得的最终决策图融合图像。该文算法直接利用超像素分割块进行图像融合,其相较以往利用重叠块的融合算法可达到降低时间复杂度的目的,同时可获得较好的融合效果。 展开更多
关键词 多聚焦图像融合 卷积神经网络 超像素分割 空间金字塔池化
在线阅读 下载PDF
A-LinkNet:注意力与空间信息融合的语义分割网络 被引量:3
13
作者 杜敏敏 司马海峰 《液晶与显示》 CAS CSCD 北大核心 2022年第9期1199-1208,共10页
针对道路图像语义分割中上下文信息不足以及空间细节信息易丢失等问题,本文提出一种基于LinkNet模型的实时分割方法。首先,在编码区域构建一种新的注意力机制,捕获道路图像的位置以及通道依赖,增加目标特征的提取能力。然后,在中心区域... 针对道路图像语义分割中上下文信息不足以及空间细节信息易丢失等问题,本文提出一种基于LinkNet模型的实时分割方法。首先,在编码区域构建一种新的注意力机制,捕获道路图像的位置以及通道依赖,增加目标特征的提取能力。然后,在中心区域引入空洞空间金字塔池化模型,在不影响图像分辨率的情况下捕获更加丰富的多尺度特征。在通用数据库上的实验结果表明,所提方法在Cityscapes数据集上MIoU达到了64.78%,与LinkNet相比较,提高了5.01%,同时对于细小目标物体以及边界分割视觉效果有明显的改善,分割准确率获得了较大提升。 展开更多
关键词 语义分割 注意力机制 空洞空间金字塔池化 LinkNet
在线阅读 下载PDF
基于全局卷积神经网络的复杂图像语义分割方法 被引量:3
14
作者 张丹 柳爽 +2 位作者 张晓娜 时光 刘京 《舰船电子工程》 2021年第1期82-88,共7页
语义分割的场景图像易受不同光照强度以及类别多样性的影响,尤其是在复杂的图像分割任务中,由于不同物体间的像素值差异过大或过小,造成分割图像的纹理和几何特征缺失,即产生欠分割、过分割现象。针对上述问题,利用深度卷积神经网络,研... 语义分割的场景图像易受不同光照强度以及类别多样性的影响,尤其是在复杂的图像分割任务中,由于不同物体间的像素值差异过大或过小,造成分割图像的纹理和几何特征缺失,即产生欠分割、过分割现象。针对上述问题,利用深度卷积神经网络,研究基于全局卷积神经网络的复杂图像语义分割方法。首先,提出多尺度残差空间金字塔池化模块,在网络中获取到更加稠密和完备的图像低层特征[1];其次,网络考虑全局信息,提出基于注意力机制的解码器模块,有效捕获图像像素的纹理特征、颜色特征和上下文信息,从而得到完整的分割结果。该方法在Camvid数据集上分割精确度达68.5%(MIoU)且在Cityscapes数据集上分割精度达78.3%。 展开更多
关键词 语义分割 欠分割 过分割 深度卷积神经网络 空间金字塔池化 注意力机制
在线阅读 下载PDF
基于改进深度卷积神经网络的纸币识别研究 被引量:8
15
作者 盖杉 鲍中运 《电子与信息学报》 EI CSCD 北大核心 2019年第8期1992-2000,共9页
针对如何提高纸币识别率的问题,该文提出一种改进深度卷积神经网络(DCNN)的纸币识别算法。该算法首先通过融合迁移学习、带泄露整流(Leaky ReLU)函数、批量归一化(BN)和多层次残差单元构造深度卷积层,对输入的不同尺寸纸币进行稳定而快... 针对如何提高纸币识别率的问题,该文提出一种改进深度卷积神经网络(DCNN)的纸币识别算法。该算法首先通过融合迁移学习、带泄露整流(Leaky ReLU)函数、批量归一化(BN)和多层次残差单元构造深度卷积层,对输入的不同尺寸纸币进行稳定而快速的特征提取与学习;然后采用改进的多层次空间金字塔池化算法对提取的纸币特征实现固定大小的输出表示;最后通过网络全连接层和softmax层实现纸币图像分类。实验结果表明,该算法在分类性能、泛化能力与稳定性上明显优于常用的纸币分类算法;同时该算法也能够满足纸币清分系统的实时性要求。 展开更多
关键词 纸币识别 深度卷积神经网络 残差学习 空间金字塔池化
在线阅读 下载PDF
多尺度特征融合注意力新冠肺炎病灶分割网络 被引量:1
16
作者 林洁沁 黄新 《激光杂志》 CAS 北大核心 2024年第3期168-174,共7页
新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Atte... 新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Attention Network),以图像分割效果较为出色的U-Net网络为基础,通过全局池化层和设置空洞卷积的采样率,增大网络感受野,捕获多尺度信息,实现对大目标的有效分割;使用通道注意力与空间注意力,在空间维度上建模,有效提取图像深层特征。测试结果表明,改进后的算法与U-Net网络相比,分割的平均交并比提升了1.46%,类别平均像素准确率提升了0.8%,准确率提升了1.17%。 展开更多
关键词 图像处理 特征提取 卷积块注意力模块 空洞空间卷积池化金字塔 U-Net结构 多尺度特征融合
在线阅读 下载PDF
基于改进的IIE-SegNet的快速图像语义分割方法 被引量:1
17
作者 李庆 王宏健 +2 位作者 李本银 肖瑶 迟志康 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第2期314-323,共10页
针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计... 针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计算量大的问题;研究Focal损失函数来解决正、负采样不平衡的问题。实验结果表明:与IIE-SegNet相比,本方法在PASCAL VOC 2012数据集上的语义分割速度更快,平均每次迭代快0.6 s左右,测试单张图像的时间平均减少了0.94 s;分割精度更高,MIoU提升了2.1%。在扩展的PASCAL VOC 2012(Exp-PASCAL VOC 2012)数据集上的语义分割速度更快,平均每次迭代快0.4 s左右,测试单张图像的时间平均减少了0.92 s;分割精度更高,MPA和MIoU分别提升了2.6%和2.8%,特别是对于小尺度目标分割边界更清晰,性能得到了很大的提升。 展开更多
关键词 语义分割 深度学习 多尺度空洞卷积空间金字塔池化 图像信息熵 全局加平均 VGG16 IIE-SegNet
在线阅读 下载PDF
健身行为的人体姿态估计及动作识别 被引量:4
18
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
在线阅读 下载PDF
基于稠密块改进LinkNet的高分遥感图像道路提取
19
作者 王增优 张鲜化 +2 位作者 刘荣 陈志高 朱旺煌 《航天返回与遥感》 CSCD 北大核心 2024年第3期107-117,共11页
针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Bloc... 针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Block),密集连接的方式减少特征信息在传递过程中的损失,并在每个稠密块之后构建卷积注意力单元来提高模型对目标特征的学习能力,最后用空洞空间金字塔池化模块将编码区与解码区进行连接,扩大感受野的同时还能接受多尺度目标特征信息。实验表明,该方法在DeepGlobe数据集上的准确率、平均交并比和F1-score分为82.16%、83.21%和81.65%,均优于同类网络,通过对提取的路网结果对比,该算法对于树木遮蔽处以及建筑物阴影下的路网提取在完整性和准确性上都具有明显提升。 展开更多
关键词 残差网络 道路提取 稠密块 卷积注意力 空洞空间金字塔池化
在线阅读 下载PDF
基于轻量级Transformer的隧道裂缝分割 被引量:2
20
作者 邝先验 徐姚明 +2 位作者 雷卉 程福军 桓湘澜 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第8期3421-3433,共13页
裂缝检测对保证隧道结构安全至关重要,及时发现隧道裂缝缺陷,有利于降低工程维修成本和保障行车安全。然而,传统卷积神经网络在隧道裂缝检测任务中主要侧重提高检测精度和算法复杂度,如何平衡裂缝检测的精度和实时性是当前研究的一个难... 裂缝检测对保证隧道结构安全至关重要,及时发现隧道裂缝缺陷,有利于降低工程维修成本和保障行车安全。然而,传统卷积神经网络在隧道裂缝检测任务中主要侧重提高检测精度和算法复杂度,如何平衡裂缝检测的精度和实时性是当前研究的一个难点。针对这一问题,本文提出一种基于轻量级Transformer的裂缝分割方法 CrackViT。首先,采用卷积神经网络与Transformer混合的MobileViT网络构建裂缝特征提取网络,减少网络模型参数和计算量,并且有效提取裂缝图像全局信息和局部特征信息。然后,提出改进空洞空间金字塔池化解码器实现不同尺度的特征提取和信息融合,实现像素级概率分布。同时,裂缝图像存在细节信息缺失问题,引入高效通道注意力模块,增强对裂缝特征信息的提取能力。此外,针对裂缝与背景类别不平衡问题,设计了在线困难样本挖掘损失函数进行缓解。实验结果表明:在单个3050Ti GPU上,CrackViT算法最终在裂缝数据集上以63 FPS的速度获得了75.62%的IoU,模型参数量仅为2.43 M。CrackViT-L模型精度IoU为76.83%,模型参数量为3.56 M,模型推理速度达到61FPS。算法测试精度优于大多数主流模型,并且需要更少的模型参数。研究结果表明,CrackViT所预测的隧道裂缝分割图像边缘更加清晰和完整,保持推理速度的同时,能够有效检测裂缝,该算法有助于隧道裂缝检测实际应用。 展开更多
关键词 裂缝分割 TRANSFORMER MobileViT 空洞空间金字塔池化 轻量级模型
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部