期刊文献+
共找到82篇文章
< 1 2 5 >
每页显示 20 50 100
基于多尺度特征融合与重构卷积的肝肿瘤图像分割方法
1
作者 马金林 酒志青 +4 位作者 马自萍 夏明格 张凯 程叶霞 马瑞士 《华南理工大学学报(自然科学版)》 北大核心 2025年第5期94-108,共15页
针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核... 针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核重构模块,使编码器保留更多的细节信息,并使解码器能更有效地恢复信息,以提升肝肿瘤图像特征的表达能力。然后,为丰富全局上下文信息的传递,设计了三分支空间金字塔池化模块来优化瓶颈结构的信息传递,打破单一路径的限制。接着,设计了多尺度特征融合模块来优化编码器信息的复用机制,增强模型对全局上下文信息的建模能力,并提升其在提取不同尺度肝肿瘤图像特征时的效能。最后,在LiTS2017和3DIRCADb数据集上对该文方法的性能进行了测试。实验结果表明:在LiTS2017数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.56%和95.25%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.71%和81.58%;在3DIRCADb数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.63%和95.39%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.62%和81.63%。 展开更多
关键词 肝肿瘤图像分割 卷积核重构 空间金字塔池化 多尺度特征融合
在线阅读 下载PDF
时空网络特征融合的病理步态识别方法
2
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
复杂场景下基于深度学习与多传感器融合的无人机配网巡检智能避障技术 被引量:4
3
作者 廖红兵 况松陵 +3 位作者 李扬帆 黄晓露 王刚 魏洪 《测绘通报》 北大核心 2025年第1期22-28,共7页
在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融... 在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融合激光雷达和机器视觉的环境感知系统,通过利用空洞空间金字塔池化结构增大卷积核的感受野,捕获多尺度信息对障碍物进行实时识别,并利用先进的路径规划算法动态调整无人机的飞行路径,以避开障碍物。仿真测试验证表明,该系统在复杂环境中的避障能力得到显著提高,巡检效率提升了20%以上,且有效降低了事故风险。本文所提出的智能避障技术为电力配网的无人机巡检提供了一种高效、安全的解决方案,具备广泛的应用价值和推广前景。 展开更多
关键词 无人机 空洞空间金字塔池化 避障能力 路径规划
在线阅读 下载PDF
基于MobileNet的轻量化云检测模型
4
作者 叶武剑 谢林峰 +2 位作者 刘怡俊 温晓卓 李扬 《自然资源遥感》 北大核心 2025年第3期95-103,共9页
针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制... 针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制和挤压激励(squeeze-and-excitation,SE)注意力模块来增强通道间的信息交流。通过这种方式,既减少了参数量和计算复杂度,又保持了对重要特征的提取能力。在上采样阶段,使用了RepConv模块和改进的空洞空间金字塔池化模块(atrous spatial pyramid pooling,ASPP),以提高网络的学习能力和捕捉图像细节与空间信息的能力。实验结果证明,该文模型在参数量和模型复杂度降低的情况下,能够实现较高精度的云检测,具备实用性和可行性。 展开更多
关键词 云检测 MobileNet网络 注意力机制 多尺度特征 空洞空间金字塔池化模块
在线阅读 下载PDF
基于大模型的钻井现场人体姿态估计方法研究
5
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
基于迭代压缩U型网络的煤颗粒分割与粒度分析方法
6
作者 程德强 张瑞 +4 位作者 谢同喜 刘敬敬 郑丽娟 寇旗旗 江鹤 《煤炭学报》 北大核心 2025年第2期1362-1375,共14页
煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘... 煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘细节起着关键作用,直接影响分割结果的准确性。基于卷积神经网络架构的U型网络过于注重局部信息,忽视了全局信息的重要性,容易导致过分割现象。而基于Transformer的网络利用多头自注意力机制有效地建模了全局信息,但却没有充分利用边缘细节特征,导致煤颗粒漏分割问题。为了解决上述问题,本研究提出了迭代压缩U型网络(Iterative Squeeze UNet,ISUNet)用于煤颗粒粒度分析。ISUNet模型引入了压缩激励空洞空间金字塔池化模块和基于Transformer的多路迭代编码器。压缩激励空洞空间金字塔池化模块通过增强不同尺度特征的通道信息和全局上下文信息,解决了煤粒过分割问题。编码器中的多头自注意力模块将ResNet50的卷积特征作为其中一个输入,通过点乘自注意力机制不断强化重要的边缘细节特征,解决了煤粒漏分割问题。与5种经典图像分割模型和4种目前主流的分割模型相比,ISUNet表现出色。相较于经典的分割模型TransUNet来说,平均交并比提高了6.6%,准确率提高了0.3%,召回率提高了7.0%,相较于目前主流的图像分割大模型Segment Anything来说,平均交并比提高了4.6%,准确率提高了0.2%,召回率提高了4.9%。在煤粒粒度测量方面,准确率达到了97.49%。这些试验结果充分证实了ISUNet在煤粒粒度分析中的有效性和优越性。 展开更多
关键词 煤粒粒度分析 图像分割 基于Transformer的多路迭代编码器 压缩激励空洞空间金字塔池化 U型网络
在线阅读 下载PDF
融合注意力和扩张卷积的遥感影像道路信息提取方法 被引量:2
7
作者 肖振久 郝明 +1 位作者 曲海成 侯佳兴 《遥感信息》 CSCD 北大核心 2024年第1期18-25,共8页
针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标... 针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标注意力(coordinate attention,CA)模块,捕捉道路位置、方向和跨通道信息,精确定位道路信息。其次,针对网络对细节特征丢失的敏感问题,在编码器的末端利用不同扩张率的空洞卷积构建多尺度特征融合的空洞空间金字塔池化模块(multi-scale Atrous spatial pyramid pooling module,MASPPM)来获得更大的感受野,提高网络性能。最后,为了避免U-Net中纯跳跃连接在语义上不相似特征的融合,在编码器和解码器的跳跃连接之间增加了双通道注意力机制来实现门控筛选,抑制非目标区域的特征,提高网络的分割精度。实验在公共道路数据集Massachusetts上对网络模型进行测试,OA(准确率)、交并比(IoU)、平均交并比(mIoU)和F1等评价指标分别达到98.07%、64.39%、81.20%和88.67%。与主流方法U-Net和DDUNet进行比较,mIoU分别提升了3.07%、0.22%,IoU分别提升了1.98%、0.52%。实验结果表明,所提出的方法优于所有的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 语义分割 道路提取 注意力机制 U-Net 空洞空间金字塔池化
在线阅读 下载PDF
结合残差与双注意力机制的U-Net语音增强方法 被引量:1
8
作者 许春冬 王磊 +2 位作者 胡菁兰 闵源 徐锦武 《计算机工程与设计》 北大核心 2024年第11期3383-3389,共7页
针对U-Net语音增强网络深层特征提取能力不足,以及编解码过程中特征信息丢失问题,提出一种结合残差与双注意力机制的DA-Res-Unet语音增强方法。将U-Net编解码部分设计为残差结构来深化网络,增强深层特征提取能力;在网络结构中构造双注... 针对U-Net语音增强网络深层特征提取能力不足,以及编解码过程中特征信息丢失问题,提出一种结合残差与双注意力机制的DA-Res-Unet语音增强方法。将U-Net编解码部分设计为残差结构来深化网络,增强深层特征提取能力;在网络结构中构造双注意力机制,减少时频特征提取中的细节信息丢失;在网络中融入空洞空间金字塔池化结构,在低参数量情况下融合不同尺度上下文背景信息,提高模型特征捕获能力。实验结果表明,DA-Res-Unet网络模型在可见噪声测试集上的PESQ、STOI和LSD这3种评测指标取得了不同程度的提升,在未知噪声测试集上具备一定优势。 展开更多
关键词 语音增强 深度学习 残差网络 特征提取 编解码结构 注意力机制 空洞空间池化金字塔
在线阅读 下载PDF
引入Transformer的道路小目标检测 被引量:1
9
作者 李丽芬 黄如 《计算机工程与设计》 北大核心 2024年第1期95-101,共7页
针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transform... 针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transformer)模块捕获特征内部的相关性,获得上下文信息,提取更加全面丰富的特征;在网络特征融合部分嵌入改进后的空间金字塔池化模块,在保持较小计算量的同时增加特征图的感受野。实验结果表明,在KITTI数据集上,算法检测精度达到91.97%,与YOLOv4算法相比,mAP提高了2.53%,降低了小目标的漏检率。 展开更多
关键词 小目标检测 深度学习 YOLOv4算法 多尺度检测 TRANSFORMER 空间金字塔池化 特征融合
在线阅读 下载PDF
基于改进DeepLabv3+的遥感影像道路提取算法 被引量:2
10
作者 王谦 何朗 +1 位作者 王展青 黄坤 《计算机科学》 CSCD 北大核心 2024年第8期168-175,共8页
道路提取可以帮助人们更好地理解城市环境,是城市交通和城市规划等方面的重要部分,随着深度学习与计算机视觉的发展,利用基于深度学习的语义分割算法从遥感影像中提取道路的技术趋于成熟。针对现有的深度学习道路提取算法存在的提取速... 道路提取可以帮助人们更好地理解城市环境,是城市交通和城市规划等方面的重要部分,随着深度学习与计算机视觉的发展,利用基于深度学习的语义分割算法从遥感影像中提取道路的技术趋于成熟。针对现有的深度学习道路提取算法存在的提取速度慢和容易受背景环境因素干扰而产生漏分割、不连续等问题,提出了一种基于ECANet注意力机制和级联空洞空间金字塔池化模块的轻量化算法CE-DeepLabv3+。首先,将主干特征提取网络更换为轻量级的MobileNetv2,减少参数量,提高模型的执行速度;其次,通过增加空洞空间金字塔池化模块的卷积层进一步扩大感受野,再级联不同特征层来增强语义信息的复用性,从而加强对细节特征的提取能力;再次,加入ECANet注意力机制,抑制背景环境中的干扰因素,聚焦道路信息;最后,采用改进的损失函数进行训练,消除了道路与背景样本不均衡对模型性能产生的影响。实验结果表明,改进算法的性能优良,与原始DeepLabv3+算法相比,在分割效率、分割精度上有较大的提升。 展开更多
关键词 语义分割 遥感影像 道路提取 注意力机制 DeepLabv3+ 级联空洞空间金字塔池化
在线阅读 下载PDF
基于稠密块改进LinkNet的高分遥感图像道路提取 被引量:1
11
作者 王增优 张鲜化 +2 位作者 刘荣 陈志高 朱旺煌 《航天返回与遥感》 CSCD 北大核心 2024年第3期107-117,共11页
针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Bloc... 针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Block),密集连接的方式减少特征信息在传递过程中的损失,并在每个稠密块之后构建卷积注意力单元来提高模型对目标特征的学习能力,最后用空洞空间金字塔池化模块将编码区与解码区进行连接,扩大感受野的同时还能接受多尺度目标特征信息。实验表明,该方法在DeepGlobe数据集上的准确率、平均交并比和F1-score分为82.16%、83.21%和81.65%,均优于同类网络,通过对提取的路网结果对比,该算法对于树木遮蔽处以及建筑物阴影下的路网提取在完整性和准确性上都具有明显提升。 展开更多
关键词 残差网络 道路提取 稠密块 卷积注意力 空洞空间金字塔池化
在线阅读 下载PDF
KU-Net:改进U-Net的高分辨率遥感影像建筑物提取方法 被引量:2
12
作者 刘卓涛 龚循强 +2 位作者 夏元平 陈晓勇 吴晋涛 《遥感信息》 CSCD 北大核心 2024年第5期121-131,共11页
针对遥感影像背景复杂导致的建筑物提取结果存在边界模糊、小目标漏检、地物误检等问题,提出一种基于改进U-Net的建筑物提取网络KU-Net(Keep border U-Net)。该网络在U-Net的基础上加入空洞空间金字塔池化和含注意力机制的横向连接模块... 针对遥感影像背景复杂导致的建筑物提取结果存在边界模糊、小目标漏检、地物误检等问题,提出一种基于改进U-Net的建筑物提取网络KU-Net(Keep border U-Net)。该网络在U-Net的基础上加入空洞空间金字塔池化和含注意力机制的横向连接模块,其中,空间空洞金字塔池化能够提升模型的感受野,横向连接模块对不同层级的跳跃连接特征进行融合,缓解特征丢失的情况,从而进一步提高精度。实验结果表明,该方法相比于其他对比方法,提取结果更为清晰准确,对边缘有较好的保持效果,定量结果更优。 展开更多
关键词 KU-Net 建筑物提取 空洞空间金字塔池化 WHU建筑物数据集 注意力机制
在线阅读 下载PDF
健身行为的人体姿态估计及动作识别 被引量:4
13
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
在线阅读 下载PDF
基于PCSA-YOLOv7 Former的输电线路连接金具及其锈蚀检测方法 被引量:1
14
作者 宋智伟 黄新波 +2 位作者 纪超 张凡 张烨 《中国电力》 CSCD 北大核心 2024年第6期141-152,共12页
输电线路分布情况复杂且故障难以有效检测,其中连接金具长期暴露于复杂环境下易受到恶劣环境的影响出现锈蚀等故障。针对输电线路连接金具部件具有尺度多样性和存在着锈蚀故障检测精度低的问题,提出了一种基于双重注意力嵌入重构和Swin ... 输电线路分布情况复杂且故障难以有效检测,其中连接金具长期暴露于复杂环境下易受到恶劣环境的影响出现锈蚀等故障。针对输电线路连接金具部件具有尺度多样性和存在着锈蚀故障检测精度低的问题,提出了一种基于双重注意力嵌入重构和Swin Transformer的输电线路连接金具组件及其锈蚀故障检测方法:PCSA-YOLOv7 Former。实验结果表明:该方法在构建的TLCF数据集上的综合检测性能领先于12类当前先进的目标检测算法,其中在测试集上的mAP_(0.5)达到94.9%,该方法相比于基线模型YOLOv7,其F1和mAP0.5指标分别提升了2.6个百分点和2.2个百分点,说明该方法能够更全面地理解输电线路连接金具图像中的多尺度语义信息并学习到不易区分的微小细节表征。 展开更多
关键词 输电线路连接金具 PCSA-YOLOv7 Former 双重注意力嵌入 Swin Transformer 空洞空间金字塔池化
在线阅读 下载PDF
基于改进的IIE-SegNet的快速图像语义分割方法 被引量:1
15
作者 李庆 王宏健 +2 位作者 李本银 肖瑶 迟志康 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第2期314-323,共10页
针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计... 针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计算量大的问题;研究Focal损失函数来解决正、负采样不平衡的问题。实验结果表明:与IIE-SegNet相比,本方法在PASCAL VOC 2012数据集上的语义分割速度更快,平均每次迭代快0.6 s左右,测试单张图像的时间平均减少了0.94 s;分割精度更高,MIoU提升了2.1%。在扩展的PASCAL VOC 2012(Exp-PASCAL VOC 2012)数据集上的语义分割速度更快,平均每次迭代快0.4 s左右,测试单张图像的时间平均减少了0.92 s;分割精度更高,MPA和MIoU分别提升了2.6%和2.8%,特别是对于小尺度目标分割边界更清晰,性能得到了很大的提升。 展开更多
关键词 语义分割 深度学习 多尺度空洞卷积空间金字塔池化 图像信息熵 全局加平均 VGG16 IIE-SegNet
在线阅读 下载PDF
基于YOLOX的金属表面缺陷检测 被引量:3
16
作者 吴祖旺 吴君钦 《计算机工程与设计》 北大核心 2024年第11期3492-3498,共7页
为提高金属产品在加工制造过程中的检测精度与速率,提出一种基于深度学习的检测方法,运用经改进的YOLOX网络模型检测金属表面缺陷。融合丰富上下文的骨干网络模块C2f_COT、优化的空间金字塔池化New_SPP、混合域注意力机制CBAM和自适应... 为提高金属产品在加工制造过程中的检测精度与速率,提出一种基于深度学习的检测方法,运用经改进的YOLOX网络模型检测金属表面缺陷。融合丰富上下文的骨干网络模块C2f_COT、优化的空间金字塔池化New_SPP、混合域注意力机制CBAM和自适应特征融合算法ASFF,选用高效的EIOU损失函数。改进之后,对金属缺陷特征信息的提取能力得到提升,特别是针对形状复杂且大小不一的缺陷。在NEU-DET数据集上,模型精度mAP值达77.16%,比原始模型提高3.05%,速率FPS达到每秒73帧。精度和速率均可满足实际工作中的金属表面缺陷检测需求,显著提升检测效率。 展开更多
关键词 金属 缺陷检测 深度学习 空间金字塔池化 注意力机制 损失函数 自适应特征融合
在线阅读 下载PDF
多尺度特征融合注意力新冠肺炎病灶分割网络 被引量:2
17
作者 林洁沁 黄新 《激光杂志》 CAS 北大核心 2024年第3期168-174,共7页
新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Atte... 新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Attention Network),以图像分割效果较为出色的U-Net网络为基础,通过全局池化层和设置空洞卷积的采样率,增大网络感受野,捕获多尺度信息,实现对大目标的有效分割;使用通道注意力与空间注意力,在空间维度上建模,有效提取图像深层特征。测试结果表明,改进后的算法与U-Net网络相比,分割的平均交并比提升了1.46%,类别平均像素准确率提升了0.8%,准确率提升了1.17%。 展开更多
关键词 图像处理 特征提取 卷积块注意力模块 空洞空间卷积池化金字塔 U-Net结构 多尺度特征融合
在线阅读 下载PDF
基于注意力机制的多尺度手部分割方法 被引量:1
18
作者 周雯晴 代素敏 +1 位作者 王阳萍 王文润 《液晶与显示》 CAS CSCD 北大核心 2024年第11期1506-1518,共13页
针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D... 针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D-FFN)机制,通过窗口自注意力机制整合全局和局部的依赖信息,D-FFN抑制背景信息的干扰;然后,提出一种结合条形池化和级联网络的多尺度特征提取模块增大感受野,提高手部分割模型的准确性和鲁棒性;最后,提出基于Triplet Attention机制的上采样解码器模块,通过调节通道维度与空间维度的注意力权重将目标特征和背景的冗余特征区分开。将所提算法在公开数据集GTEA(Georgia Tech Egocentric Activity)和EYTH(EgoYouTubeHands)上测试,实验结果表明,该算法在两个数据集上的平均交并比(MIoU)值分别达到了95.8%和90.2%,相较于TransUnet算法分别提升了2.5%和2.1%,满足手部图像分割的稳定可靠、精度高、抗干扰能力强等要求。 展开更多
关键词 手部分割 深度学习 TransUnet 前馈神经网络 空洞空间金字塔池化模块 Triplet Attention
在线阅读 下载PDF
基于CNN-Transformer结构的遥感影像变化检测 被引量:1
19
作者 潘梦洋 杨航 范祥晖 《液晶与显示》 CAS CSCD 北大核心 2024年第10期1361-1379,共19页
现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但... 现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但其对影像变化细节的处理不足,导致空间定位能力有限且计算效率低下。为解决上述问题,本文提出了一种基于空间空洞金字塔池化的跨层级联线性融合端到端编解码混合CNN-Transformer的变化检测模型,兼具视觉Transformer和CNN的优势。首先,利用孪生CNN网络提取图像特征,并借助空洞金字塔池化模块对特征进行精细处理,从而更精准地捕获图像的细节特征信息。其次,将提取的特征转化为视觉单词,并通过Transformer编码器进行建模,以获取丰富的上下文信息。这些信息随后被反馈至视觉空间,通过Transformer解码器对原始特征进行强化,提升特征的表达效果。接着,采用跨层级联的方式将CNN提取的特征与Transformer编解码的特征进行融合,利用上采样技术联系不同分辨率的特征图,实现位置信息与语义信息的融合。最后,通过差异增强模块生成包含丰富变化信息的差异特征图。在LEVIR、CDD、DSIFN和WHUCD 4个公开遥感数据集上的广泛实验验证了本文方法的有效性。与其他先进方法相比,本文模型的分类性能更出色,有效改善了变化检测中的欠分割、过分割及边缘粗糙等问题。 展开更多
关键词 遥感图像 变化检测 卷积神经网络 TRANSFORMER 空间空洞金字塔池化
在线阅读 下载PDF
改进YOLOv7的输电线路融冰刀闸状态识别方法 被引量:1
20
作者 高绪杰 李泽滔 +2 位作者 曾华荣 杨旗 张露松 《计算机工程与应用》 CSCD 北大核心 2024年第23期314-324,共11页
隔离刀闸状态的自动识别是冰期输电线路智能融冰倒闸操作中的关键环节。针对恶劣天气条件下,传统图像识别方法在识别融冰刀闸时精度较低的问题,提出了一种基于改进YOLOv7的融冰刀闸状态识别方法。在YOLOv7网络中引入自注意力机制(self-a... 隔离刀闸状态的自动识别是冰期输电线路智能融冰倒闸操作中的关键环节。针对恶劣天气条件下,传统图像识别方法在识别融冰刀闸时精度较低的问题,提出了一种基于改进YOLOv7的融冰刀闸状态识别方法。在YOLOv7网络中引入自注意力机制(self-attention,S-A)模块,以增强网络在低对比度图像中的全局特征提取能力。同时对网络中的SPPCSPC模块进行改进,引入空洞空间金字塔池化技术(atrous spatial pyramid pooling,ASPP),提高对搭接刀闸等此类大目标的识别能力。根据搭接刀闸的特殊结构、大小和位置,在损失函数中添加约束项,增强对刀闸识别的针对性。最后,设计了一个M-MBO加速网络,利用多分支架构在推理时简化模型,提高模型识别速度。实验结果表明,在保证识别速度的同时,改进的YOLOv7模型mAP值可达97.9%,相比改进前的方法平均精度均值提高了2.5个百分点,验证了该方法的有效性。 展开更多
关键词 YOLOv7 刀闸状态识别 自注意力机制 空洞空间金字塔池化(ASPP) 损失函数约束项 M-MBO
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部