期刊文献+
共找到70篇文章
< 1 2 4 >
每页显示 20 50 100
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
1
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
基于动态自适应通道注意力特征融合的小目标检测 被引量:2
2
作者 吴迪 赵品懿 +2 位作者 甘升隆 沈学军 万琴 《电子科技大学学报》 北大核心 2025年第2期221-232,共12页
针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的... 针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的问题。2)提出一种分组批量动态自适应通道注意力模块,增强弱语义小目标特征同时抑制无用信息,且在动态自适应通道注意力模块中设计新的激活函数和交并比损失函数,提升通道注意力表征能力。3)采用ResNet50作为骨干网络依次连接特征金字塔网络和Tri-Neck网络。实验结果表明,该方法在Pascal Voc 2007、Pascal Voc 2012上比YOLOv8算法mAP分别提升5.3%和6.2%,在MS COCO 2017数据集上AP和AP_S分别提升1.6%和2%,在SODA-D数据集上比YOLOv8算法AP提升0.9%。 展开更多
关键词 小目标检测 多尺度融合特征 特征金字塔 动态通道注意力 交并比损失函数
在线阅读 下载PDF
基于GAN和多尺度空间注意力的多模态医学图像融合 被引量:3
3
作者 林予松 李孟娅 +1 位作者 李英豪 赵哲 《郑州大学学报(工学版)》 CAS 北大核心 2025年第1期1-8,共8页
针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图... 针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图像;其次,整个对抗网络框架采用双鉴别器结构,使得生成器生成的融合图像同时保留多个模态图像的显著特征;最后,构建一种多尺度空间注意力作为编码器进行特征提取的基本模块,利用多尺度结构充分捕获并保留源图像的多尺度特征,并且引入空间注意力更好地保留源图像的结构和细节信息。全脑图谱数据库上的实验结果表明:所提算法生成的融合图像不仅纹理细节更为丰富,有助于人类视觉观察,而且在3种不同类型的医学图像融合任务上平均梯度、峰值信噪比、互信息、视觉信息保真度等客观评价指标的平均值分别达到0.3023、20.7207、1.4414、0.6498,与其他先进的算法相比具有一定的优势。 展开更多
关键词 图像融合 多模态医学图像 生成对抗网络 特征金字塔 注意力机制
在线阅读 下载PDF
多尺度和多层级特征融合的人体姿态估计 被引量:2
4
作者 王燕妮 胡敏 +2 位作者 韩世鹏 陈艺瑄 吕昊 《计算机工程与应用》 北大核心 2025年第6期199-209,共11页
人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(m... 人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(multi-scale and multi-level network,MSLNet)。采用高分辨率网络(high-resolution network,HRNet)作为主干,通过跨尺度信息交互,实现不同分辨率特征图之间的信息交换,获取同时包含细粒度和粗粒度的姿态特征;引入期望最大化注意力-加权双向特征金字塔网络(expectation maximization attention-bidirectional feature pyramid network,EMA-BiFPN),实现多尺度特征融合后的多层级特征聚合,从局部到全局捕捉人体姿态的细节和关联信息;设计由残差结构组成的关键点检测头,完成输出特征的最终融合并提升人体关键点检测准确率。实验结果表明,MSLNet在COCO和MPII数据集上分别取得了75.8%和91.1%的准确率,实现了最优精度,充分验证了MSLNet能够融合尺度和层级之间的互补特征,进而提升人体姿态估计精度。 展开更多
关键词 高分辨率网络(HRNet) 人体姿态估计 期望最大化注意力 双向特征金字塔网络 特征融合
在线阅读 下载PDF
基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别 被引量:1
5
作者 毛清华 苏毅楠 +3 位作者 贺高峰 翟姣 王荣泉 尚新芒 《工矿自动化》 北大核心 2025年第1期11-20,103,共11页
针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换... 针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换主干网络C2f模块为C2fER模块,加强模型的细节特征提取能力,提升模型对小目标人员的识别性能;通过在颈部网络引入特征强化加权双向特征金字塔网络(FE-BiFPN)结构,提高模型的特征融合能力,从而提升模型对多尺度人员目标的识别效果;通过引入分离增强注意力模块(SEAM)增强模型在复杂背景下对局部特征的关注度,提升模型对遮挡目标人员的识别能力;通过引入WIoU损失函数增强训练效果,提升模型识别准确率。消融实验结果表明:改进YOLOv8模型的准确率较基线模型YOLOv8s提升2.3%,mAP@0.5提升3.4%,识别速度为104帧/s。人员识别实验结果表明:与YOLOv10m,YOLOv8s-CA、YOLOv8s-SPDConv和YOLO8n模型相比,改进YOLOv8模型对小目标、多尺度目标、遮挡目标的识别效果均更佳,识别准确率为90.2%,mAP@0.5为87.2%。人员入侵危险区域实验结果表明:井下人员入侵带式输送机危险区域智能识别系统判别人员入侵危险区域的平均准确率为93.25%,满足识别需求。 展开更多
关键词 煤矿带式输送机 人员入侵危险区域 YOLOv8模型 遮挡目标检测 小目标检测 多尺度融合 C2fER模块 特征强化加权双向特征金字塔网络结构
在线阅读 下载PDF
基于DSG-ResNet34的聚乙烯燃气管道电熔焊接缺陷检测
6
作者 凌晓 刘露 +2 位作者 孙宝财 张正棠 徐晓刚 《仪器仪表学报》 北大核心 2025年第6期228-240,共13页
PE燃气管道的连接质量能直接影响中低压燃气的正常输送,在电熔焊接时产生的结构畸变、冷焊等缺陷会显著削弱管道的力学性能,威胁燃气管网的稳定运行。因此,基于实地采集的PE燃气管道电熔焊接缺陷DR图像数据集,提出了基于DSG-ResNet34模... PE燃气管道的连接质量能直接影响中低压燃气的正常输送,在电熔焊接时产生的结构畸变、冷焊等缺陷会显著削弱管道的力学性能,威胁燃气管网的稳定运行。因此,基于实地采集的PE燃气管道电熔焊接缺陷DR图像数据集,提出了基于DSG-ResNet34模型的缺陷检测方法,以实现对电熔焊接缺陷进行快速精准地检测。该网络模型由主干网络CBAM-ResNet34模块、动态稀疏门控金字塔DSG-FPN、多尺度检测头3个部分组成,首先通过主干网络CBAM-ResNet34结构从通道和空间两个维度提升网络模型对缺陷特征的关注度,然后通过动态稀疏门控金字塔DSG-FPN结构的动态稀疏门控模块、Inception模块、稀疏连接动态融合多尺度缺陷特征,有效保留小目标特征、抑制背景噪声,最后通过多尺度检测头结构将提取到的丰富特征转化为具体的检测结果。DSG-ResNet34模型的缺陷检测准确率最高可达95.5%、P2层精确率最高可达82.7%、小目标召回率最低为85.6%、检测速度可达68 fps、参数量为22.3×10^(6),该模型能快速定位识别孔洞、熔融面夹杂、结构畸变、冷焊这4类典型电熔焊接缺陷,检测性能与速度优于其他网络模型。为PE管道焊接质量智能化检测提供了高精度解决方案,对保障燃气管网安全运行具有重要意义。 展开更多
关键词 聚乙烯燃气管道 缺陷检测 电熔焊接 ResNet34模型 特征金字塔
在线阅读 下载PDF
RO-YOLOv9车辆行人检测算法 被引量:2
7
作者 廖炎华 万学俊 +1 位作者 赵周洲 潘文林 《计算机工程与应用》 北大核心 2025年第11期144-155,共12页
针对道路交通环境中车辆和行人目标较小或被遮挡导致的检测精度低以及误检、漏检问题,提出道路目标检测算法RO-YOLOv9。增加小目标检测层,增强算法对小目标的特征学习能力。设计双向与自适应尺度融合特征金字塔网络(bidirectional and a... 针对道路交通环境中车辆和行人目标较小或被遮挡导致的检测精度低以及误检、漏检问题,提出道路目标检测算法RO-YOLOv9。增加小目标检测层,增强算法对小目标的特征学习能力。设计双向与自适应尺度融合特征金字塔网络(bidirectional and adaptive scale fusion feature pyramid network,BiASF-FPN)结构,优化多尺度特征融合,保证算法有效捕捉从小尺度到大尺度目标的详细信息。提出OR-RepN4模块,通过重参数化策略,复杂算法结构简单化,提高推理速度。引用Shape-NWD(shape neighborhood weighted decomposition)损失函数,专注边界框形状与尺寸,采用归一化高斯Wasserstein距离平滑回归,实现跨尺度不变性,降低小尺度与遮挡目标的检测误差。实验结果表明,在优化后的SODA10M和BDD100K数据集下,RO-YOLOv9算法的mAP@0.5(mean average precision)分别达到68.1%和56.8%,比YLOLOv9算法提高5.6个百分点和4.4个百分点,并且检测帧率分别达到了55.3帧/s和54.2帧/s,达到检测精度和检测速度的平衡。 展开更多
关键词 YOLOv9 小目标检测 双向与自适应尺度融合特征金字塔网络(BiASF-FPN) OR-RepN4 Shape-NWD
在线阅读 下载PDF
基于YOLOv5n模型改进的口罩检测算法:Mask-YOLO
8
作者 李毅 徐慧英 +3 位作者 朱信忠 黄晓 王舒梦 李悉钰 《计算机工程》 北大核心 2025年第6期297-310,共14页
口罩作为基础的个人防护物品,在公共卫生领域发挥着重要作用。针对复杂场景下口罩检测精确度低的问题,提出一种基于YOLOv5n改进的轻量级口罩检测算法Mask-YOLO,以提高口罩检测精确度和模型训练的稳定性。在特征提取阶段的卷积模块组中采... 口罩作为基础的个人防护物品,在公共卫生领域发挥着重要作用。针对复杂场景下口罩检测精确度低的问题,提出一种基于YOLOv5n改进的轻量级口罩检测算法Mask-YOLO,以提高口罩检测精确度和模型训练的稳定性。在特征提取阶段的卷积模块组中采用Softplus激活函数,提升模型非线性映射效率,加快模型的收敛速度;在主干特征提取深层网络中添加Coordinate Attention,通过嵌入位置信息得到通道注意力,使网络获取更大的物体区域信息和通道目标特征,同时避免较大的内存开销;在深层网络将快速空间金字塔池化(SPPF)模块替换为接受域模块(RFB),借助不同的膨胀率来扩大卷积特征采样的感受野,以获取高层网络中丰富的物体语义信息;在多尺度特征融合网络PANet结构的基础上,添加BiFPN跨阶段多尺度特征融合设计,使得具有不同尺度空间信息和语义信息的目标特征充分融合交互,进一步提升小目标检测精度;采用DIoU作为边界框损失函数,用以解决边界框回归不稳定和目标漏检的问题;采用Soft-NMS的方法,通过降低重叠检测框置信度得分的方式,进一步提升检测效率。实验结果表明,Mask-YOLO与基准模型YOLOv5n相比,在mAP@0.95综合评价指标上性能提升8.58%,解决了原始YOLOv5n算法在口罩检测中小目标检测精度低、边界框回归不稳定、模型训练收敛慢等问题,实现了高效的口罩检测。 展开更多
关键词 目标检测 口罩检测 特征融合 YOLOv5n 特征金字塔网络
在线阅读 下载PDF
时空网络特征融合的病理步态识别方法
9
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
基于改进DBNet和SVTR算法的连铸板坯号检测与识别 被引量:2
10
作者 刘乐 张晓松 +1 位作者 黄锋 方一鸣 《电子测量与仪器学报》 CSCD 北大核心 2024年第2期67-75,共9页
针对钢铁连铸产线板坯号识别字符区域小、光照变化复杂、板坯号图像质量差等问题,提出了一种基于深度学习的连铸板坯号检测与识别两阶段算法。首先,基于采集的连铸产线板坯图像,制备用于板坯号检测与识别的数据集;其次,在板坯号检测阶段... 针对钢铁连铸产线板坯号识别字符区域小、光照变化复杂、板坯号图像质量差等问题,提出了一种基于深度学习的连铸板坯号检测与识别两阶段算法。首先,基于采集的连铸产线板坯图像,制备用于板坯号检测与识别的数据集;其次,在板坯号检测阶段,基于DBNet算法设计一种AD-PAN特征融合结构,以增强检测算法的多尺度特征融合能力和扩大感受野,提高板坯号定位精度;再次,在板坯号识别阶段,引入SPIN矫正网络和SVTR板坯号识别网络进行端到端训练,使其能够主动转换输入亮度,并改善字符间以及字符与背景间色彩失真的问题。最后,在自制的板坯号检测与识别数据集上进行了对比实验。实验结果表明,本研究提出的算法能够有效定位辊道上不同位置的板坯,并且在复杂背景下对板坯号进行鲁棒识别。其中,板坯号检测Hmean数值为97.92%,板坯号识别的准确率为97.33%,验证了本文所提算法具有较高的板坯号检测与识别精度。 展开更多
关键词 板坯号识别 DBNet 特征金字塔融合 端到端网络 SPIN矫正 SVTR
在线阅读 下载PDF
基于跨模态注意力融合的煤炭异物检测方法 被引量:5
11
作者 曹现刚 李虎 +3 位作者 王鹏 吴旭东 向敬芳 丁文韬 《工矿自动化》 CSCD 北大核心 2024年第1期57-65,共9页
为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采... 为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采用浅层的特征提取策略提取Depth图像的低级特征,用深度边缘与深度纹理等基础特征辅助RGB图像深层特征,以有效获得2种特征的互补信息,从而丰富异物特征的空间与边缘信息,提高检测精度;构建了基于坐标注意力与改进空间注意力的跨模态注意力融合模块(CAFM),以协同优化并融合RGB特征与Depth特征,增强网络对特征图中被遮挡异物可见部分的关注度,提高被遮挡异物检测精度;使用区域卷积神经网络(R-CNN)输出煤炭异物的分类、回归与分割结果。实验结果表明:在检测精度方面,该方法的AP相较两阶段模型中较优的Mask transfiner高3.9%;在检测效率方面,该方法的单帧检测时间为110.5 ms,能够满足异物检测实时性需求。基于跨模态注意力融合的煤炭异物检测方法能够以空间特征辅助色彩、形状与纹理等特征,准确识别煤炭异物之间及煤炭异物与输送带之间的差异,从而有效提高对复杂特征异物的检测精度,减少误检、漏检现象,实现复杂特征下煤炭异物的精确检测与像素级分割。 展开更多
关键词 煤炭异物检测 实例分割 双特征金字塔网络 跨模态注意力融合 Depth图像 坐标注意力 改进空间注意力
在线阅读 下载PDF
基于改进YOLOv5算法的绝缘子多缺陷检测 被引量:7
12
作者 伍箴燎 吴正平 孙水发 《高压电器》 CAS CSCD 北大核心 2024年第12期95-102,112,共9页
针对绝缘子多缺陷检测精度低、检测速度慢的问题,提出一种改进YOLOv5准确判别绝缘子多缺陷检测算法(YOLOv5⁃GSEM)。首先通过引入GhostNet结构替换原始网络YOLOv5主干网络C3模块,提升网络运算速度;并在SPPF后引入无参注意力模块SimAM,增... 针对绝缘子多缺陷检测精度低、检测速度慢的问题,提出一种改进YOLOv5准确判别绝缘子多缺陷检测算法(YOLOv5⁃GSEM)。首先通过引入GhostNet结构替换原始网络YOLOv5主干网络C3模块,提升网络运算速度;并在SPPF后引入无参注意力模块SimAM,增强有效特征,抑制干扰特征;其次引入增强特征金字塔网络(EFPN)和多尺度特征融合网络(multiscale feature fusion network,MFFN),充分融合多尺度特征,提升网络对绝缘子多缺陷的检测精度。实验结果表明,文中提出的模型平均精度均值(mAP0.5)达到87.8%,较YOLOv5算法提升了2.7%,检测速度提升了4.6%,该网络的提出为绝缘子多种缺陷检测问题提供一种更有效的方法。 展开更多
关键词 绝缘子多缺陷检测 注意力机制 增强特征金字塔网络 多尺度特征融合 轻量化
在线阅读 下载PDF
基于多尺度风格自适应的手写维文识别模型 被引量:1
13
作者 闫林 王磊 +2 位作者 艾孜麦提·艾尼瓦尔 杨雅婷 李晓 《计算机工程与设计》 北大核心 2024年第9期2749-2756,共8页
基于字符形态与书写风格的强关联性,提出一种多尺度风格自适应的手写维文识别模型,模型从浅层笔划到深层序列建模多尺度风格特征,提高对手写风格的自适应能力。针对手写维文特点改进Transformer提取多尺度笔划特征;构建多尺度风格自适... 基于字符形态与书写风格的强关联性,提出一种多尺度风格自适应的手写维文识别模型,模型从浅层笔划到深层序列建模多尺度风格特征,提高对手写风格的自适应能力。针对手写维文特点改进Transformer提取多尺度笔划特征;构建多尺度风格自适应模块提取序列特征;构建特征泛化融合模块对笔划特征和序列特征进行深度融合,提升识别效果。实验结果表明,该模型在真实手写维文测试集WER、CER分别下降3.75%、0.19%,在IAM数据集中验证了模型迁移性。 展开更多
关键词 手写维文识别 手写风格 多尺度 特征金字塔网络 视觉自注意力模型 长短期记忆网络 特征融合
在线阅读 下载PDF
基于RSSD的遥感图像目标检测算法 被引量:3
14
作者 吕向东 彭超亮 +3 位作者 陈治国 孙鹏飞 赵晓楠 徐旸 《现代电子技术》 北大核心 2024年第7期49-53,共5页
针对SSD算法检测遥感图像目标时存在容易漏检且检测精度低的问题,提出基于残差SSD网络的遥感图像目标检测算法。该算法在SSD网络结构的基础上,将基准网络模型VGG替换为残差网络模型ResNet-50,通过增加网络深度,充分提取遥感图像小目标... 针对SSD算法检测遥感图像目标时存在容易漏检且检测精度低的问题,提出基于残差SSD网络的遥感图像目标检测算法。该算法在SSD网络结构的基础上,将基准网络模型VGG替换为残差网络模型ResNet-50,通过增加网络深度,充分提取遥感图像小目标数据集的底层特征,引入注意力模块,使感受野更关注目标特征,增强低层网络的信息表征能力,采用特征金字塔融合方法融合网络结构的高层语义特征和低层视觉特征,增强检测目标的定位能力。实验结果表明,该算法增强了复杂背景的干扰抑制性,提高了小目标的检测精度,比传统的SSD算法具有更强的检测性能。 展开更多
关键词 SSD 残差网络 注意力模块 金字塔融合 遥感图像 小目标 高层语义特征 低层视觉特征
在线阅读 下载PDF
基于点云的自动驾驶下三维目标检测 被引量:2
15
作者 杨咏嘉 钟良琪 闫胜业 《计算机工程与设计》 北大核心 2024年第4期1093-1099,共7页
针对当前三维目标检测算法对行人、骑行人等小目标检测效果不佳的缺点,提出一种改进PV-RCNN的三维目标检测算法。改进关键点下采样方式,通过滤除背景及离群点提高关键点在目标上的命中率;设计多尺度区域建议网络,尺度匹配的特征图提高... 针对当前三维目标检测算法对行人、骑行人等小目标检测效果不佳的缺点,提出一种改进PV-RCNN的三维目标检测算法。改进关键点下采样方式,通过滤除背景及离群点提高关键点在目标上的命中率;设计多尺度区域建议网络,尺度匹配的特征图提高边界框的生成质量;使用加入方向感知的DIoU损失函数优化边界框的回归。实验结果表明,与基准网络相比,算法在KITTI测试集的车辆、行人和骑行人的mAP分别提高了0.77%、6.33%和2.05%,有效提高了网络性能。 展开更多
关键词 深度学习 三维目标检测 特征金字塔 原始点云 交并比损失函数 特征融合 点云下采样
在线阅读 下载PDF
基于层间引导的低光照图像渐进增强算法
16
作者 黄梦源 常侃 +2 位作者 凌铭阳 韦新杰 覃团发 《计算机应用》 CSCD 北大核心 2024年第6期1911-1919,共9页
低光照图像的图像质量通常较低,低光照图像增强(LLIE)旨在提高这类图像的视觉质量。针对现有的LLIE算法大多专注增强亮度和对比度、忽略细节增强的问题,提出一个基于层间引导的低光照图像渐进增强算法(PELG),兼顾图像亮度和细节增强。首... 低光照图像的图像质量通常较低,低光照图像增强(LLIE)旨在提高这类图像的视觉质量。针对现有的LLIE算法大多专注增强亮度和对比度、忽略细节增强的问题,提出一个基于层间引导的低光照图像渐进增强算法(PELG),兼顾图像亮度和细节增强。首先,使用拉普拉斯金字塔(LP)降低任务复杂度,提高算法效率;其次,利用各频率分量间的相关性,在低频和高频分量之间构建基于Transformer的层间引导融合模块,在各高频分量之间构建轻量级的层间引导融合模块,有效精炼金字塔较低层增强信息指导较高层处理图像,实现基于层间引导的渐进增强;最后,通过LP重建亮度均匀、细节清晰的增强图像。实验结果表明,所提算法的峰值信噪比(PSNR)在LOL(LOw-Light dataset)-v1上比DSLR(Deep Stacked Laplacian Restorer)高2.3 dB,在LOL-v2上比UNIE(Unsupervised Night Image Enhancement)高0.55 dB;与其他基于深度学习的LLIE算法相比,所提算法运行速度快,增强结果在客观和主观质量上均获得明显提升,更适用于实际场景。 展开更多
关键词 低光照图像增强 拉普拉斯金字塔 特征融合 卷积神经网络 TRANSFORMER
在线阅读 下载PDF
基于YOLOv8改进的脑癌检测算法
17
作者 王喆 赵慧俊 +2 位作者 谭超 李骏 申冲 《计算机科学》 CSCD 北大核心 2024年第S02期444-450,共7页
自动检测脑部肿瘤在磁共振成像中的位置是一个复杂、繁重的任务,需要耗费大量时间和资源。传统识别方案经常出现误解、遗漏和误导的情况,从而影响患者的治疗进度,对患者的生命安全产生影响。为了进一步提高鉴定的效果,引入了4项关键改... 自动检测脑部肿瘤在磁共振成像中的位置是一个复杂、繁重的任务,需要耗费大量时间和资源。传统识别方案经常出现误解、遗漏和误导的情况,从而影响患者的治疗进度,对患者的生命安全产生影响。为了进一步提高鉴定的效果,引入了4项关键改进措施。首先,采用了高效的多尺度注意力EMA(Efficient Multi-scale Attention),这种方法既可以对全局信息进行编码,也可以对信息进行重新校准,同时通过并行的分支输出特征进行跨维度的交互,使信息进一步聚合。其次,引入了BiFPN(Bidirectional Feature Pyramid Network)模块,并对其结构进行改进,以便缩短每一次检测所需要的时间,同时提升图像识别效果。然后采用MDPIoU损失函数和Mish激活函数进行改进,进一步提高检测的准确度。最后进行仿真实验,实验结果表明,改进的YOLOv8算法在脑癌检测中的精确率、召回率、平均精度均值均有提升,其中Precision提高了4.48%,Recall提高了2.64%,mAP@0.5提高了2.6%,mAP@0.5:0.9提高了7.0%。 展开更多
关键词 YOLOv8 脑癌 Efficient multi-scale Attention模块 Bidirectional feature pyramid network结构 Missed Softplus with Identity Shortcut激活函数 Minimum Point Distance Intersection over Union损失函数
在线阅读 下载PDF
SwinEA:融合边缘感知的医学图像分割网络 被引量:3
18
作者 叶晋豫 李娇 +2 位作者 邓红霞 张瑞欣 李海芳 《计算机工程与设计》 北大核心 2024年第4期1149-1156,共8页
基于卷积神经网络的方法在医学图像分割任务中取得了显著成果,但该方法固有的归纳偏置使其不能很好地学习全局和长距离的语义信息交互,而Transformer的优势是关注全局信息,两者可以优势互补。因此提出一种针对分割边缘利用Swin Transfor... 基于卷积神经网络的方法在医学图像分割任务中取得了显著成果,但该方法固有的归纳偏置使其不能很好地学习全局和长距离的语义信息交互,而Transformer的优势是关注全局信息,两者可以优势互补。因此提出一种针对分割边缘利用Swin Transformer融合边缘感知的医学图像分割网络。设计基于上下文金字塔的边缘感知模块,用于融合全局的多尺度的上下文信息,针对边缘和角落等局部特征,利用浅层深度主干的特征产生丰富的边缘特征,因此提出的边缘感知模块可以尽可能多地产生边缘特征。在腹部多器官分割任务和心脏分割数据集的实验结果表明,该方法在各项指标中都有所提高。 展开更多
关键词 医学图像分割 移动窗口变形器 多头自注意力 边缘感知模块 上下文金字塔 多尺度特征 深度学习网络
在线阅读 下载PDF
基于YOLOv8s的轻量级绝缘子多缺陷检测模型 被引量:2
19
作者 蓝贵文 任新月 +2 位作者 徐梓睿 郭瑞东 钟展 《现代电子技术》 北大核心 2024年第20期72-80,共9页
YOLO系列算法已广泛用于识别电力线路中的各类缺陷目标。由于巡检图像背景复杂、缺陷目标的尺度不一等,直接利用YOLO算法难以有效避免绝缘子闪络、破损等小目标的错检漏检问题。为解决这一问题,在YOLOv8s模型的基础上提出一种轻量化绝... YOLO系列算法已广泛用于识别电力线路中的各类缺陷目标。由于巡检图像背景复杂、缺陷目标的尺度不一等,直接利用YOLO算法难以有效避免绝缘子闪络、破损等小目标的错检漏检问题。为解决这一问题,在YOLOv8s模型的基础上提出一种轻量化绝缘子缺陷检测算法。在骨干网络中引入双层路由注意力机制(BRA),以提升对全局特征的关注度,抑制背景噪声,降低小目标缺陷的错检漏检率。通过加权双向特征金字塔网络(BiFPN)实现跨尺度特征之间的加权融合,获取各类缺陷更全面的特征信息。重构Neck网络来消除低贡献度的网络节点,在增强检测性能的同时减少了模型的参数量,实现了性能提升和参数效率之间的平衡。实验结果显示,改进后的网络模型平均检测精度达到84.9%,而参数量仅为8.4×10^(6),可实现对绝缘子缺陷的快速准确检测。 展开更多
关键词 轻量化网络 YOLOv8s 绝缘子缺陷 小目标缺陷检测 双层路由注意力机制 加权双向特征金字塔网络 特征融合
在线阅读 下载PDF
基于双重时空特征金字塔的人体行为识别 被引量:1
20
作者 李贵 袁家政 +1 位作者 刘宏哲 徐成 《传感器与微系统》 CSCD 北大核心 2024年第4期132-135,共4页
针对目前人体动作存在着行为识别准确率低的问题,提出一种基于双重时空特征金字塔网络结构的人体行为识别方法—DSTFP。该方法使用SlowFast网络作为骨干网络提取不同尺度的特征,并将多个尺度的特征输入双重时空特征金字塔进行处理以增... 针对目前人体动作存在着行为识别准确率低的问题,提出一种基于双重时空特征金字塔网络结构的人体行为识别方法—DSTFP。该方法使用SlowFast网络作为骨干网络提取不同尺度的特征,并将多个尺度的特征输入双重时空特征金字塔进行处理以增加网络对多个尺度的敏感度。第一重为语义增强金字塔(SEEP),自顶向下融合多个尺度的特征,在不同尺度的特征中传递高层语义信息;第二重为空间增强金字塔(SPEP),采用自底向上的融合方式,在不同尺度的特征中传递空间定位信息。在公共数据集AVA上的实验结果表明:该方法能获得24.97 mAP,相较于原网络提升了0.77 mAP,并有效地提升了人体行为识别的准确度,相比于同类算法更符合实际应用需求。 展开更多
关键词 神经网络 特征金字塔 多尺度融合 人体行为识别 视频理解
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部