期刊文献+
共找到82篇文章
< 1 2 5 >
每页显示 20 50 100
基于MobileViT-PC-ASPP和迁移学习的果树害虫识别方法
1
作者 张欢 周毅 +2 位作者 王克俭 王超 李会平 《农业机械学报》 EI CAS CSCD 北大核心 2024年第11期57-67,共11页
为提高果树害虫识别效果,及时做好防治措施,本研究以6种对果树危害程度较大的害虫为研究对象,针对自然环境下果树害虫识别背景复杂、害虫目标小检测难度大、与不同类别间特征相似度高等问题,提出一种改进的轻量化MobileViT-PC-ASPP识别... 为提高果树害虫识别效果,及时做好防治措施,本研究以6种对果树危害程度较大的害虫为研究对象,针对自然环境下果树害虫识别背景复杂、害虫目标小检测难度大、与不同类别间特征相似度高等问题,提出一种改进的轻量化MobileViT-PC-ASPP识别模型。该模型用PConv(Partial convolution)模块代替原模型MobileViT模块中部分标准卷积模块,其次修改MobileViT模块的特征融合策略,将输入特征、局部表达特征、全局表达特征进行拼接融合;删除网络第10层MV2模块和第11层MobileViT模块,使用改进空洞空间池化金字塔(Atrous spatial pyramid pooling,ASPP)模块进行代替,形成多尺度融合特征;此外,模型用SiLU激活函数代替ReLU6激活函数进行计算,最后基于ImageNet数据集进行迁移学习。实验结果表明,6类果树害虫图像识别准确率达93.77%,参数量为8.40×10^(5),与改进前相比,识别准确率提高7.5个百分点,参数量降低33.86%;与常用害虫CNN识别模型AlexNet、ResNet50、MobileNetV2、ShuffleNetV2相比识别准确率分别提高8.25、4.78、7.27、7.41个百分点,参数量分别减少6.03×10^(7)、2.48×10^(7)、2.66×10^(6)、5.30×10^(5);与Transformer识别模型ViT、Swin Transfomer相比识别准确率分别提高19.03、9.8个百分点,参数量分别减少8.56×10^(7)、2.75×10^(7)。本研究适合部署在移动终端等有限资源环境,并且有助于实现对复杂背景下小目标果树害虫进行识别检测。 展开更多
关键词 果树害虫 识别模型 PConv模块 融合策略 SiLU激活函数 空洞空间池化金字塔
在线阅读 下载PDF
改进U-Net模型的隧道掌子面图像语义分割研究
2
作者 陈登峰 程静 +1 位作者 赵蕾 何拓航 《防灾减灾工程学报》 北大核心 2025年第4期776-783,共8页
隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征... 隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征传递到高层的跳跃连接导致特征映射过大。因此,提出加入空洞空间卷积池化金字塔模块ASPP和卷积注意力模块CBAM的改进U-Net模型。在U-Net模型的跳跃连接过程中加ASPP,利用不同膨胀率的空洞卷积捕获不同尺度的上下文信息,融合不同感受野的信息,从而更全面的理解图像内容;U-Net模型的下采样过程中加入CBAM,使网络模型更加关注有用的特征,从而增强特征的表达能力。实验结果表明,改进的网络模型相较于原始U-Net模型分割和识别性能有显著提升,在某隧道工程掌子面岩体图像数据集上Precision达到93.04%,mIoU达到74.98%,mPA达到78.89%。 展开更多
关键词 隧道掌子面 图像语义分割 卷积注意力模块 空洞空间卷积池化金字塔模块
在线阅读 下载PDF
基于MobileNet的轻量化云检测模型
3
作者 叶武剑 谢林峰 +2 位作者 刘怡俊 温晓卓 李扬 《自然资源遥感》 北大核心 2025年第3期95-103,共9页
针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制... 针对现有云检测算法计算量和模型规模庞大、在边缘设备上的部署几乎不可行的问题,提出了一种基于MobileNet网络的轻量化云检测模型。该方法在下采样阶段,使用基于注意力机制的残差模块,通过分组卷积降低模型参数量,并结合通道重排机制和挤压激励(squeeze-and-excitation,SE)注意力模块来增强通道间的信息交流。通过这种方式,既减少了参数量和计算复杂度,又保持了对重要特征的提取能力。在上采样阶段,使用了RepConv模块和改进的空洞空间金字塔池化模块(atrous spatial pyramid pooling,ASPP),以提高网络的学习能力和捕捉图像细节与空间信息的能力。实验结果证明,该文模型在参数量和模型复杂度降低的情况下,能够实现较高精度的云检测,具备实用性和可行性。 展开更多
关键词 云检测 MobileNet网络 注意力机制 多尺度特征 空洞空间金字塔池化模块
在线阅读 下载PDF
时空网络特征融合的病理步态识别方法
4
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
复杂场景下基于深度学习与多传感器融合的无人机配网巡检智能避障技术 被引量:4
5
作者 廖红兵 况松陵 +3 位作者 李扬帆 黄晓露 王刚 魏洪 《测绘通报》 北大核心 2025年第1期22-28,共7页
在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融... 在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融合激光雷达和机器视觉的环境感知系统,通过利用空洞空间金字塔池化结构增大卷积核的感受野,捕获多尺度信息对障碍物进行实时识别,并利用先进的路径规划算法动态调整无人机的飞行路径,以避开障碍物。仿真测试验证表明,该系统在复杂环境中的避障能力得到显著提高,巡检效率提升了20%以上,且有效降低了事故风险。本文所提出的智能避障技术为电力配网的无人机巡检提供了一种高效、安全的解决方案,具备广泛的应用价值和推广前景。 展开更多
关键词 无人机 空洞空间金字塔池化 避障能力 路径规划
在线阅读 下载PDF
基于大模型的钻井现场人体姿态估计方法研究
6
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
基于迭代压缩U型网络的煤颗粒分割与粒度分析方法
7
作者 程德强 张瑞 +4 位作者 谢同喜 刘敬敬 郑丽娟 寇旗旗 江鹤 《煤炭学报》 北大核心 2025年第2期1362-1375,共14页
煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘... 煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘细节起着关键作用,直接影响分割结果的准确性。基于卷积神经网络架构的U型网络过于注重局部信息,忽视了全局信息的重要性,容易导致过分割现象。而基于Transformer的网络利用多头自注意力机制有效地建模了全局信息,但却没有充分利用边缘细节特征,导致煤颗粒漏分割问题。为了解决上述问题,本研究提出了迭代压缩U型网络(Iterative Squeeze UNet,ISUNet)用于煤颗粒粒度分析。ISUNet模型引入了压缩激励空洞空间金字塔池化模块和基于Transformer的多路迭代编码器。压缩激励空洞空间金字塔池化模块通过增强不同尺度特征的通道信息和全局上下文信息,解决了煤粒过分割问题。编码器中的多头自注意力模块将ResNet50的卷积特征作为其中一个输入,通过点乘自注意力机制不断强化重要的边缘细节特征,解决了煤粒漏分割问题。与5种经典图像分割模型和4种目前主流的分割模型相比,ISUNet表现出色。相较于经典的分割模型TransUNet来说,平均交并比提高了6.6%,准确率提高了0.3%,召回率提高了7.0%,相较于目前主流的图像分割大模型Segment Anything来说,平均交并比提高了4.6%,准确率提高了0.2%,召回率提高了4.9%。在煤粒粒度测量方面,准确率达到了97.49%。这些试验结果充分证实了ISUNet在煤粒粒度分析中的有效性和优越性。 展开更多
关键词 煤粒粒度分析 图像分割 基于Transformer的多路迭代编码器 压缩激励空洞空间金字塔池化 U型网络
在线阅读 下载PDF
衔接注意力机制与残差ASPP的W-Net工业烟尘图像分割 被引量:1
8
作者 詹光莉 刘辉 +1 位作者 陈甫刚 杨路 《控制理论与应用》 EI CAS CSCD 北大核心 2023年第1期160-171,共12页
工业烟尘图像分割是基于烟尘图像监测污染等级判定的重要环节.针对工业烟尘分割时存在的小目标烟尘漏检、大目标烟尘误检以及分割结果精度低等问题,提出了一种结合衔接注意力机制和残差空洞空间金字塔池化(ASPP)的W-Net网络.使用衔接注... 工业烟尘图像分割是基于烟尘图像监测污染等级判定的重要环节.针对工业烟尘分割时存在的小目标烟尘漏检、大目标烟尘误检以及分割结果精度低等问题,提出了一种结合衔接注意力机制和残差空洞空间金字塔池化(ASPP)的W-Net网络.使用衔接注意力机制将两个U-Net网络组合成W-Net,W-Net能充分利用烟尘的轮廓、位置信息进行烟尘粗分割和细分割操作,两次分割能达到更精细的分割效果;此外,针对W-Net中的普通卷积功能过于简单而不能更好地提取烟尘特征的问题,提出一种兼具残差块和ASPP功能的残差ASPP结构,同时还能根据大小目标烟尘的特点进行针对性分割,分割结果更全面完整.实验结果表明,结合衔接注意力机制与残差ASPP的W-Net以较小的分割效率损失为代价获得了较高的分割精度,Recall,IoU与F-score指标提高了4%~5%,解决了大小目标烟尘存在的分割问题,烟尘的分割效果也优于其他语义分割网络. 展开更多
关键词 工业烟尘 图像分割 注意力机制 空洞空间金字塔池化 W-Net
在线阅读 下载PDF
基于分层压缩激励的ASPP网络单目深度估计 被引量:5
9
作者 廖志伟 金兢 +1 位作者 张超凡 杨学志 《图学学报》 CSCD 北大核心 2022年第2期214-222,共9页
场景深度估计是场景理解的一项基本任务,其准确率反映了计算机对场景的理解程度。传统的深度估计利用金字塔池化(ASPP)模块可以在不改变图像分辨率的情况下处理不同像素特征,但该模块未考虑不同像素特征之间的关系,导致场景特征提取不... 场景深度估计是场景理解的一项基本任务,其准确率反映了计算机对场景的理解程度。传统的深度估计利用金字塔池化(ASPP)模块可以在不改变图像分辨率的情况下处理不同像素特征,但该模块未考虑不同像素特征之间的关系,导致场景特征提取不准确。针对 ASPP 模块在深度估计中出现的弊端,提出了一种改进型的 ASPP 模块,解决了该模块在图像处理中存在的失真问题。首先在卷积核后添加基于分层压缩激励的ASPP 结构块,结合各像素特征之间的关系,让网络自适应学习感兴趣部分;再通过构造差值矩阵解决网络层次优化问题;最后在室内公共数据集 NYU-Depthv2 上进行深度估计网络模型的搭建。与当前主流算法相比,文中算法在定性、定量指标上均有良好表现。在相同的评估指标下,δ;阈值精度提升近 3%,均方误差(RMSE)、绝对误差(Abs Rel)下降 1.7%,对数域误差(lg)下降约 0.3%。该方法所训练的网络模型,解决了传统 ASPP 模块未考虑不同像素特征之间关系的问题,特征提取能力增强,场景深度估计的结果更加准确。 展开更多
关键词 深度学习 卷积神经网络 深度估计 空洞空间金字塔池化 分层设计
在线阅读 下载PDF
基于ASPP-SOLOv2的复杂场景下透明玻璃仪器实例分割
10
作者 葛建统 杨鑫 +3 位作者 祝模芮 冉进业 翟持 张浩 《高校化学工程学报》 EI CAS CSCD 北大核心 2023年第6期962-970,共9页
针对深度学习方法对复杂背景下实验室透明玻璃仪器识别效果不佳的问题,建立包含1548张含常用玻璃化学仪器图像的实验室复杂场景实例分割数据集,提出基于动态快速实例分割算法2.0版(SOLOv2)的透明仪器实例分割算法,利用空洞空间金字塔池... 针对深度学习方法对复杂背景下实验室透明玻璃仪器识别效果不佳的问题,建立包含1548张含常用玻璃化学仪器图像的实验室复杂场景实例分割数据集,提出基于动态快速实例分割算法2.0版(SOLOv2)的透明仪器实例分割算法,利用空洞空间金字塔池化(ASPP)融合多尺度信息,通过自下而上增强方式提高底层信息利用率,交并比阈值大于50%的精确率最终达到90.50%,类平均精度(APav)达到76.00%,比原始方法平均精度提高8.7%。消融实验表明ASPP的引入增强透明仪器的几何、边缘等特征的表示能力,提高对密集重叠目标的分割精度。该方法使APav提高22.58%,在骨干网络特征分辨率为原图1/16的阶段,加入该模块可实现浅层信息和高阶语义信息的最佳平衡。 展开更多
关键词 实例分割 透明玻璃仪器数据集 动态快速实例分割 空洞空间金字塔池化
在线阅读 下载PDF
改进ASPP及多层次特征语义融合分割方法 被引量:3
11
作者 王银宇 孟凡云 +1 位作者 王金鹤 刘志浩 《计算机工程与应用》 CSCD 北大核心 2023年第13期220-228,共9页
为解决图像语义分割中多尺度目标分割困难、类别边界预测不准确等问题,提出一种基于改进空洞空间金字塔池化的多层次特征语义融合分割方法。将深层次网络特征按通道分组,利用分组空洞空间金字塔池化模块捕获每个分组多尺度特征上下文信... 为解决图像语义分割中多尺度目标分割困难、类别边界预测不准确等问题,提出一种基于改进空洞空间金字塔池化的多层次特征语义融合分割方法。将深层次网络特征按通道分组,利用分组空洞空间金字塔池化模块捕获每个分组多尺度特征上下文信息;引入条状池化模块对上下文信息补充和完善,增强全局语义信息表达;根据语义引导融合模块建立不同层次特征像素间对应关系,将深层次语义信息以自底向上方式逐步融入到低层次高分辨率图像中。实验结果表明,该方法在PASCAL VOC 2012和Cityscapes公开数据集上分别获得73.1%、71.8%的平均交并比,且在相同精度下,该方法减少了39%的参数量。 展开更多
关键词 语义分割 空洞空间金字塔池化 特征融合 上下文信息
在线阅读 下载PDF
基于FCN-AC-ASPP的手写体去除方法
12
作者 方海泉 邓明明 冶运涛 《高技术通讯》 CAS 2022年第9期972-979,共8页
针对印刷体和手写体分类准确率不够高的问题,本文首先提出了一种印刷体与手写体像素级样本制作方法,并制作了印刷体和手写体数据集。其次提出了一种基于带空洞卷积和空洞空间金字塔池化的全卷积神经网络(FCN-AC-ASPP)模型。经过对FCNAC-... 针对印刷体和手写体分类准确率不够高的问题,本文首先提出了一种印刷体与手写体像素级样本制作方法,并制作了印刷体和手写体数据集。其次提出了一种基于带空洞卷积和空洞空间金字塔池化的全卷积神经网络(FCN-AC-ASPP)模型。经过对FCNAC-ASPP模型的训练和检测,该模型的分类准确率平均交并比(IoU)达到96.10%,优于全卷积神经网络(FCN)、DeeplabV3+、带空洞卷积的全卷积神经网络(FCN-AC)模型。最后对于同时含有印刷体和手写体的新图片,用训练好的FCN-AC-ASPP模型对印刷体和手写体分类,从而把手写体去除。 展开更多
关键词 手写体 印刷体 分类 全卷积神经网络(FCN) 空洞卷积(AC) 空洞空间金字塔池化(aspp)
在线阅读 下载PDF
融合注意力和扩张卷积的遥感影像道路信息提取方法 被引量:2
13
作者 肖振久 郝明 +1 位作者 曲海成 侯佳兴 《遥感信息》 CSCD 北大核心 2024年第1期18-25,共8页
针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标... 针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标注意力(coordinate attention,CA)模块,捕捉道路位置、方向和跨通道信息,精确定位道路信息。其次,针对网络对细节特征丢失的敏感问题,在编码器的末端利用不同扩张率的空洞卷积构建多尺度特征融合的空洞空间金字塔池化模块(multi-scale Atrous spatial pyramid pooling module,MASPPM)来获得更大的感受野,提高网络性能。最后,为了避免U-Net中纯跳跃连接在语义上不相似特征的融合,在编码器和解码器的跳跃连接之间增加了双通道注意力机制来实现门控筛选,抑制非目标区域的特征,提高网络的分割精度。实验在公共道路数据集Massachusetts上对网络模型进行测试,OA(准确率)、交并比(IoU)、平均交并比(mIoU)和F1等评价指标分别达到98.07%、64.39%、81.20%和88.67%。与主流方法U-Net和DDUNet进行比较,mIoU分别提升了3.07%、0.22%,IoU分别提升了1.98%、0.52%。实验结果表明,所提出的方法优于所有的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 语义分割 道路提取 注意力机制 U-Net 空洞空间金字塔池化
在线阅读 下载PDF
结合残差与双注意力机制的U-Net语音增强方法 被引量:1
14
作者 许春冬 王磊 +2 位作者 胡菁兰 闵源 徐锦武 《计算机工程与设计》 北大核心 2024年第11期3383-3389,共7页
针对U-Net语音增强网络深层特征提取能力不足,以及编解码过程中特征信息丢失问题,提出一种结合残差与双注意力机制的DA-Res-Unet语音增强方法。将U-Net编解码部分设计为残差结构来深化网络,增强深层特征提取能力;在网络结构中构造双注... 针对U-Net语音增强网络深层特征提取能力不足,以及编解码过程中特征信息丢失问题,提出一种结合残差与双注意力机制的DA-Res-Unet语音增强方法。将U-Net编解码部分设计为残差结构来深化网络,增强深层特征提取能力;在网络结构中构造双注意力机制,减少时频特征提取中的细节信息丢失;在网络中融入空洞空间金字塔池化结构,在低参数量情况下融合不同尺度上下文背景信息,提高模型特征捕获能力。实验结果表明,DA-Res-Unet网络模型在可见噪声测试集上的PESQ、STOI和LSD这3种评测指标取得了不同程度的提升,在未知噪声测试集上具备一定优势。 展开更多
关键词 语音增强 深度学习 残差网络 特征提取 编解码结构 注意力机制 空洞空间池化金字塔
在线阅读 下载PDF
基于改进DeepLabv3+的遥感影像道路提取算法 被引量:2
15
作者 王谦 何朗 +1 位作者 王展青 黄坤 《计算机科学》 CSCD 北大核心 2024年第8期168-175,共8页
道路提取可以帮助人们更好地理解城市环境,是城市交通和城市规划等方面的重要部分,随着深度学习与计算机视觉的发展,利用基于深度学习的语义分割算法从遥感影像中提取道路的技术趋于成熟。针对现有的深度学习道路提取算法存在的提取速... 道路提取可以帮助人们更好地理解城市环境,是城市交通和城市规划等方面的重要部分,随着深度学习与计算机视觉的发展,利用基于深度学习的语义分割算法从遥感影像中提取道路的技术趋于成熟。针对现有的深度学习道路提取算法存在的提取速度慢和容易受背景环境因素干扰而产生漏分割、不连续等问题,提出了一种基于ECANet注意力机制和级联空洞空间金字塔池化模块的轻量化算法CE-DeepLabv3+。首先,将主干特征提取网络更换为轻量级的MobileNetv2,减少参数量,提高模型的执行速度;其次,通过增加空洞空间金字塔池化模块的卷积层进一步扩大感受野,再级联不同特征层来增强语义信息的复用性,从而加强对细节特征的提取能力;再次,加入ECANet注意力机制,抑制背景环境中的干扰因素,聚焦道路信息;最后,采用改进的损失函数进行训练,消除了道路与背景样本不均衡对模型性能产生的影响。实验结果表明,改进算法的性能优良,与原始DeepLabv3+算法相比,在分割效率、分割精度上有较大的提升。 展开更多
关键词 语义分割 遥感影像 道路提取 注意力机制 DeepLabv3+ 级联空洞空间金字塔池化
在线阅读 下载PDF
基于稠密块改进LinkNet的高分遥感图像道路提取 被引量:1
16
作者 王增优 张鲜化 +2 位作者 刘荣 陈志高 朱旺煌 《航天返回与遥感》 CSCD 北大核心 2024年第3期107-117,共11页
针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Bloc... 针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Block),密集连接的方式减少特征信息在传递过程中的损失,并在每个稠密块之后构建卷积注意力单元来提高模型对目标特征的学习能力,最后用空洞空间金字塔池化模块将编码区与解码区进行连接,扩大感受野的同时还能接受多尺度目标特征信息。实验表明,该方法在DeepGlobe数据集上的准确率、平均交并比和F1-score分为82.16%、83.21%和81.65%,均优于同类网络,通过对提取的路网结果对比,该算法对于树木遮蔽处以及建筑物阴影下的路网提取在完整性和准确性上都具有明显提升。 展开更多
关键词 残差网络 道路提取 稠密块 卷积注意力 空洞空间金字塔池化
在线阅读 下载PDF
KU-Net:改进U-Net的高分辨率遥感影像建筑物提取方法 被引量:2
17
作者 刘卓涛 龚循强 +2 位作者 夏元平 陈晓勇 吴晋涛 《遥感信息》 CSCD 北大核心 2024年第5期121-131,共11页
针对遥感影像背景复杂导致的建筑物提取结果存在边界模糊、小目标漏检、地物误检等问题,提出一种基于改进U-Net的建筑物提取网络KU-Net(Keep border U-Net)。该网络在U-Net的基础上加入空洞空间金字塔池化和含注意力机制的横向连接模块... 针对遥感影像背景复杂导致的建筑物提取结果存在边界模糊、小目标漏检、地物误检等问题,提出一种基于改进U-Net的建筑物提取网络KU-Net(Keep border U-Net)。该网络在U-Net的基础上加入空洞空间金字塔池化和含注意力机制的横向连接模块,其中,空间空洞金字塔池化能够提升模型的感受野,横向连接模块对不同层级的跳跃连接特征进行融合,缓解特征丢失的情况,从而进一步提高精度。实验结果表明,该方法相比于其他对比方法,提取结果更为清晰准确,对边缘有较好的保持效果,定量结果更优。 展开更多
关键词 KU-Net 建筑物提取 空洞空间金字塔池化 WHU建筑物数据集 注意力机制
在线阅读 下载PDF
健身行为的人体姿态估计及动作识别 被引量:4
18
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
在线阅读 下载PDF
基于PCSA-YOLOv7 Former的输电线路连接金具及其锈蚀检测方法 被引量:1
19
作者 宋智伟 黄新波 +2 位作者 纪超 张凡 张烨 《中国电力》 CSCD 北大核心 2024年第6期141-152,共12页
输电线路分布情况复杂且故障难以有效检测,其中连接金具长期暴露于复杂环境下易受到恶劣环境的影响出现锈蚀等故障。针对输电线路连接金具部件具有尺度多样性和存在着锈蚀故障检测精度低的问题,提出了一种基于双重注意力嵌入重构和Swin ... 输电线路分布情况复杂且故障难以有效检测,其中连接金具长期暴露于复杂环境下易受到恶劣环境的影响出现锈蚀等故障。针对输电线路连接金具部件具有尺度多样性和存在着锈蚀故障检测精度低的问题,提出了一种基于双重注意力嵌入重构和Swin Transformer的输电线路连接金具组件及其锈蚀故障检测方法:PCSA-YOLOv7 Former。实验结果表明:该方法在构建的TLCF数据集上的综合检测性能领先于12类当前先进的目标检测算法,其中在测试集上的mAP_(0.5)达到94.9%,该方法相比于基线模型YOLOv7,其F1和mAP0.5指标分别提升了2.6个百分点和2.2个百分点,说明该方法能够更全面地理解输电线路连接金具图像中的多尺度语义信息并学习到不易区分的微小细节表征。 展开更多
关键词 输电线路连接金具 PCSA-YOLOv7 Former 双重注意力嵌入 Swin Transformer 空洞空间金字塔池化
在线阅读 下载PDF
基于改进的IIE-SegNet的快速图像语义分割方法 被引量:1
20
作者 李庆 王宏健 +2 位作者 李本银 肖瑶 迟志康 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第2期314-323,共10页
针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计... 针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计算量大的问题;研究Focal损失函数来解决正、负采样不平衡的问题。实验结果表明:与IIE-SegNet相比,本方法在PASCAL VOC 2012数据集上的语义分割速度更快,平均每次迭代快0.6 s左右,测试单张图像的时间平均减少了0.94 s;分割精度更高,MIoU提升了2.1%。在扩展的PASCAL VOC 2012(Exp-PASCAL VOC 2012)数据集上的语义分割速度更快,平均每次迭代快0.4 s左右,测试单张图像的时间平均减少了0.92 s;分割精度更高,MPA和MIoU分别提升了2.6%和2.8%,特别是对于小尺度目标分割边界更清晰,性能得到了很大的提升。 展开更多
关键词 语义分割 深度学习 多尺度空洞卷积空间金字塔池化 图像信息熵 全局加平均 VGG16 IIE-SegNet
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部