期刊文献+
共找到830篇文章
< 1 2 42 >
每页显示 20 50 100
BDMFuse:Multi-scale network fusion for infrared and visible images based on base and detail features
1
作者 SI Hai-Ping ZHAO Wen-Rui +4 位作者 LI Ting-Ting LI Fei-Tao Fernando Bacao SUN Chang-Xia LI Yan-Ling 《红外与毫米波学报》 北大核心 2025年第2期289-298,共10页
The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method f... The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method for infrared and visible image fusion is proposed.The encoder designed according to the optimization objective consists of a base encoder and a detail encoder,which is used to extract low-frequency and high-frequency information from the image.This extraction may lead to some information not being captured,so a compensation encoder is proposed to supplement the missing information.Multi-scale decomposition is also employed to extract image features more comprehensively.The decoder combines low-frequency,high-frequency and supplementary information to obtain multi-scale features.Subsequently,the attention strategy and fusion module are introduced to perform multi-scale fusion for image reconstruction.Experimental results on three datasets show that the fused images generated by this network effectively retain salient targets while being more consistent with human visual perception. 展开更多
关键词 infrared image visible image image fusion encoder-decoder multi-scale features
在线阅读 下载PDF
Multi-scale object detection by top-down and bottom-up feature pyramid network 被引量:14
2
作者 ZHAO Baojun ZHAO Boya +2 位作者 TANG Linbo WANG Wenzheng WU Chen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第1期1-12,共12页
While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection ... While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection of objects with multiple aspect ratios and scales is still a key problem. This paper proposes a top-down and bottom-up feature pyramid network(TDBU-FPN),which combines multi-scale feature representation and anchor generation at multiple aspect ratios. First, in order to build the multi-scale feature map, this paper puts a number of fully convolutional layers after the backbone. Second, to link neighboring feature maps, top-down and bottom-up flows are adopted to introduce context information via top-down flow and supplement suboriginal information via bottom-up flow. The top-down flow refers to the deconvolution procedure, and the bottom-up flow refers to the pooling procedure. Third, the problem of adapting different object aspect ratios is tackled via many anchor shapes with different aspect ratios on each multi-scale feature map. The proposed method is evaluated on the pattern analysis, statistical modeling and computational learning visual object classes(PASCAL VOC)dataset and reaches an accuracy of 79%, which exhibits a 1.8% improvement with a detection speed of 23 fps. 展开更多
关键词 convolutional neural NETWORK (CNN) feature pyramid NETWORK (FPN) object detection deconvolution.
在线阅读 下载PDF
Radar emitter signal recognition based on multi-scale wavelet entropy and feature weighting 被引量:16
3
作者 李一兵 葛娟 +1 位作者 林云 叶方 《Journal of Central South University》 SCIE EI CAS 2014年第11期4254-4260,共7页
In modern electromagnetic environment, radar emitter signal recognition is an important research topic. On the basis of multi-resolution wavelet analysis, an adaptive radar emitter signal recognition method based on m... In modern electromagnetic environment, radar emitter signal recognition is an important research topic. On the basis of multi-resolution wavelet analysis, an adaptive radar emitter signal recognition method based on multi-scale wavelet entropy feature extraction and feature weighting was proposed. With the only priori knowledge of signal to noise ratio(SNR), the method of extracting multi-scale wavelet entropy features of wavelet coefficients from different received signals were combined with calculating uneven weight factor and stability weight factor of the extracted multi-dimensional characteristics. Radar emitter signals of different modulation types and different parameters modulated were recognized through feature weighting and feature fusion. Theoretical analysis and simulation results show that the presented algorithm has a high recognition rate. Additionally, when the SNR is greater than-4 d B, the correct recognition rate is higher than 93%. Hence, the proposed algorithm has great application value. 展开更多
关键词 emitter recognition multi-scale wavelet entropy feature weighting uneven weight factor stability weight factor
在线阅读 下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
4
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
Underwater Image Enhancement Based on Multi-scale Adversarial Network
5
作者 ZENG Jun-yang SI Zhan-jun 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第5期70-77,共8页
In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of ea... In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of each layer were enhanced into the global features by the proposed residual dense block,which ensured that the generated images retain more details.Secondly,a multi-scale structure was adopted to extract multi-scale semantic features of the original images.Finally,the features obtained from the dual channels were fused by an adaptive fusion module to further optimize the features.The discriminant network adopted the structure of the Markov discriminator.In addition,by constructing mean square error,structural similarity,and perceived color loss function,the generated image is consistent with the reference image in structure,color,and content.The experimental results showed that the enhanced underwater image deblurring effect of the proposed algorithm was good and the problem of underwater image color bias was effectively improved.In both subjective and objective evaluation indexes,the experimental results of the proposed algorithm are better than those of the comparison algorithm. 展开更多
关键词 Underwater image enhancement Generative adversarial network multi-scale feature extraction Residual dense block
在线阅读 下载PDF
Ship recognition based on HRRP via multi-scale sparse preserving method
6
作者 YANG Xueling ZHANG Gong SONG Hu 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第3期599-608,共10页
In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) ba... In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) based on the maximum margin criterion(MMC) is proposed for recognizing the class of ship targets utilizing the high-resolution range profile(HRRP). Multi-scale fusion is introduced to capture the local and detailed information in small-scale features, and the global and contour information in large-scale features, offering help to extract the edge information from sea clutter and further improving the target recognition accuracy. The proposed method can maximally preserve the multi-scale fusion sparse of data and maximize the class separability in the reduced dimensionality by reproducing kernel Hilbert space. Experimental results on the measured radar data show that the proposed method can effectively extract the features of ship target from sea clutter, further reduce the feature dimensionality, and improve target recognition performance. 展开更多
关键词 ship target recognition high-resolution range profile(HRRP) multi-scale fusion kernel sparse preserving projection(MSFKSPP) feature extraction dimensionality reduction
在线阅读 下载PDF
基于动态自适应通道注意力特征融合的小目标检测 被引量:3
7
作者 吴迪 赵品懿 +2 位作者 甘升隆 沈学军 万琴 《电子科技大学学报》 北大核心 2025年第2期221-232,共12页
针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的... 针对小目标检测中卷积操作导致检测特征缺失和不同尺度语义隔阂的问题,提出一种基于动态自适应通道注意力特征融合的小目标检测方法。1)提出一种多尺度三角动态颈(Tri-Neck)网络结构,用于融合多尺度特征语义隔阂及弥补小目标特征缺失的问题。2)提出一种分组批量动态自适应通道注意力模块,增强弱语义小目标特征同时抑制无用信息,且在动态自适应通道注意力模块中设计新的激活函数和交并比损失函数,提升通道注意力表征能力。3)采用ResNet50作为骨干网络依次连接特征金字塔网络和Tri-Neck网络。实验结果表明,该方法在Pascal Voc 2007、Pascal Voc 2012上比YOLOv8算法mAP分别提升5.3%和6.2%,在MS COCO 2017数据集上AP和AP_S分别提升1.6%和2%,在SODA-D数据集上比YOLOv8算法AP提升0.9%。 展开更多
关键词 小目标检测 多尺度融合特征 特征金字塔 动态通道注意力 交并比损失函数
在线阅读 下载PDF
一种基于元学习的改进YOLO钢管表面缺陷小样本检测模型 被引量:3
8
作者 李凌波 田彦 +1 位作者 江旭东 董宝力 《机电工程》 北大核心 2025年第5期985-993,共9页
针对产品表面缺陷样本数稀缺时的深度学习缺陷检测效果不佳问题,提出了一种基于元学习策略的改进YOLO-SBN模型,用于小样本缺陷检测。首先,为了提高提取全局特征信息的能力,采用了Swin Transformer作为骨干网络模型,引入注意力机制提取... 针对产品表面缺陷样本数稀缺时的深度学习缺陷检测效果不佳问题,提出了一种基于元学习策略的改进YOLO-SBN模型,用于小样本缺陷检测。首先,为了提高提取全局特征信息的能力,采用了Swin Transformer作为骨干网络模型,引入注意力机制提取了特征图的判别能力;然后,为了提高特征融合能力并降低计算复杂度,通过加权双向特征金字塔网络(BiFPN)结构优化了特征提取器的颈部网络,平衡了YOLO-SBN模型的有效性和效率;最后,采用归一化注意力模块(NAM)优化权重调整了模块,增强了浅层缺陷特征的模型表达,并基于这些增强的特征进行了检测;使用金属表面热轧缺陷公开数据集NEU-DET验证了YOLO-SBN模型的算法性能。研究结果表明:对于小样本缺陷检测,YOLO-SBN模型在平均准确率(mAP)方面提高了4.1%;在新类缺陷样本规模数量为50的小样本情况下,改进后的检测模型对新类数据适应性最强。由此可见,该YOLO-SBN模型在提高检测精度和提升模型泛化能力方面具有一定优势。 展开更多
关键词 小样本目标检测 表面缺陷 元学习 特征网络 归一化注意力模块 平均准确率 双向特征金字塔网络(BiFPN)
在线阅读 下载PDF
基于GAN和多尺度空间注意力的多模态医学图像融合 被引量:3
9
作者 林予松 李孟娅 +1 位作者 李英豪 赵哲 《郑州大学学报(工学版)》 CAS 北大核心 2025年第1期1-8,共8页
针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图... 针对多模态医学图像融合过程中多尺度特征和纹理细节信息丢失的问题,提出一种基于生成对抗网络和多尺度空间注意力的图像融合算法。首先,生成器采用自编码器结构,分别利用编码器和解码器对输入图像进行特征提取、融合和重建,生成融合图像;其次,整个对抗网络框架采用双鉴别器结构,使得生成器生成的融合图像同时保留多个模态图像的显著特征;最后,构建一种多尺度空间注意力作为编码器进行特征提取的基本模块,利用多尺度结构充分捕获并保留源图像的多尺度特征,并且引入空间注意力更好地保留源图像的结构和细节信息。全脑图谱数据库上的实验结果表明:所提算法生成的融合图像不仅纹理细节更为丰富,有助于人类视觉观察,而且在3种不同类型的医学图像融合任务上平均梯度、峰值信噪比、互信息、视觉信息保真度等客观评价指标的平均值分别达到0.3023、20.7207、1.4414、0.6498,与其他先进的算法相比具有一定的优势。 展开更多
关键词 图像融合 多模态医学图像 生成对抗网络 特征金字塔 注意力机制
在线阅读 下载PDF
基于改进YOLOv8的道路交通小目标车辆检测算法 被引量:5
10
作者 火久元 苏泓瑞 +1 位作者 武泽宇 王婷娟 《计算机工程》 北大核心 2025年第1期246-257,共12页
针对交通道路中小目标车辆存在的识别困难、检测精度低以及误检和漏检等问题,提出一种基于YOLOv8算法的大内核、多尺度梯度组合的道路交通小目标车辆检测模型RGGE-YOLOv8。首先,使用RepLayer模型替换YOLOv8网络的主干部分,引入大内核深... 针对交通道路中小目标车辆存在的识别困难、检测精度低以及误检和漏检等问题,提出一种基于YOLOv8算法的大内核、多尺度梯度组合的道路交通小目标车辆检测模型RGGE-YOLOv8。首先,使用RepLayer模型替换YOLOv8网络的主干部分,引入大内核深度可分离卷积结构,拓展上下文信息,以增强模型对小目标的信息捕获能力;其次,使用GIoU代替原损失函数,解决IoU在预测框与真实框没有重叠时存在的无法优化问题;然后,引入全局注意力机制(GAM),通过减少信息丢失并增强全局交互信息来提高网络的特征表达能力;最后,引入CSPNet并重参化梯度组合特征金字塔,使得模型具有较大感受野和高形状偏差。实验结果表明,RGGE-YOLOv8在Visdrone数据集和自有数据集上mAP@0.5指标分别达到34.8%和94.7%,相较于原始YOLOv8n算法精度分别提高了2.2和5.51百分点,证明了RGGE-YOLOv8模型对道路小目标车辆检测的有效性。 展开更多
关键词 YOLOv8 小目标检测 深度学习 多尺度特征金字塔 注意力机制
在线阅读 下载PDF
基于改进YOLOv5的密集行人检测算法 被引量:5
11
作者 胡倩 皮建勇 +2 位作者 胡伟超 黄昆 王娟敏 《计算机工程》 北大核心 2025年第3期216-228,共13页
针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题,提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先,针对小目标或密集行人的特征信息易丢失这一问题,在骨干网络中引入Conv-SPD网络模块替代原有的跨... 针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题,提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先,针对小目标或密集行人的特征信息易丢失这一问题,在骨干网络中引入Conv-SPD网络模块替代原有的跨步卷积,有效缓解特征信息丢失的问题;其次,针对非相邻特征图不直接融合从而引起特征融合率较低的问题,提出新的双层渐进金字塔网络(DAFPN),提高行人检测的准确性和精度;最后,基于EIoU_Loss和CIoU_Loss引入EfficiCIoU_Loss定位损失函数,以调整和提高帧回归率,促进网络模型更快收敛。模型在CrowdHuman和WiderPerson行人数据集上相比于原YOLOv5模型,mAP@0.5、mAP@0.5∶0.95分别提升了3.9、5.3百分点和2.1、2.1百分点;引入EfficiCIoU_Loss后,模型收敛速度分别提升了11%、33%。这些改进使得基于YOLOv5的密集行人检测在特征信息保留、多尺度融合和损失函数优化等方面都取得了显著进展,提高了其在实际应用中的性能和效率。 展开更多
关键词 密集行人检测 小目标行人检测 Conv-SPD网络 双层渐进特征金字塔网络 EfficiCIoU_Loss损失函数
在线阅读 下载PDF
融合多尺度交叉注意力和边缘感知的伪装目标检测 被引量:1
12
作者 郝子强 张庆宝 +2 位作者 赵世豪 王焯豪 詹伟达 《计算机工程与应用》 北大核心 2025年第10期228-237,共10页
针对当前伪装目标检测算法无法准确、完整地检测出目标对象和其边缘的问题,提出了一种融合多尺度交叉注意力和边缘感知的伪装目标检测网络(multi-scale cross attention and edge perception network,MAEP-Net)。利用Res2Net-50提取图... 针对当前伪装目标检测算法无法准确、完整地检测出目标对象和其边缘的问题,提出了一种融合多尺度交叉注意力和边缘感知的伪装目标检测网络(multi-scale cross attention and edge perception network,MAEP-Net)。利用Res2Net-50提取图像的原始特征,并采用融合了多尺度交叉注意力的特征金字塔结构从通道、空间两个维度挖掘目标位置信息和凸显伪装目标区域特征;使用定位模块对目标的大致位置进行准确定位;边缘感知模块抑制低级特征中背景的噪声,融合边缘特征以获取更多的边缘细节信息;细化模块通过注意力机制分别从前景和背景两个方向关注目标线索,利用边缘先验、语义先验、领域先验、区域先验知识进一步细化目标结构和边缘轮廓。在3个公开数据集上的实验表明,所提算法相较于12种主流算法在4个客观评价指标上均取得了最优表现,尤其是在COD10K数据集上所提算法的加权平均值F-measure和平均绝对误差(mean absolute error,MAE)分别达到0.797和0.031。由此可见,所提算法在COD任务上具有较好的检测效果。 展开更多
关键词 多尺度交叉注意力 边缘感知 伪装目标检测 特征金字塔结构
在线阅读 下载PDF
多尺度和多层级特征融合的人体姿态估计 被引量:2
13
作者 王燕妮 胡敏 +2 位作者 韩世鹏 陈艺瑄 吕昊 《计算机工程与应用》 北大核心 2025年第6期199-209,共11页
人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(m... 人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(multi-scale and multi-level network,MSLNet)。采用高分辨率网络(high-resolution network,HRNet)作为主干,通过跨尺度信息交互,实现不同分辨率特征图之间的信息交换,获取同时包含细粒度和粗粒度的姿态特征;引入期望最大化注意力-加权双向特征金字塔网络(expectation maximization attention-bidirectional feature pyramid network,EMA-BiFPN),实现多尺度特征融合后的多层级特征聚合,从局部到全局捕捉人体姿态的细节和关联信息;设计由残差结构组成的关键点检测头,完成输出特征的最终融合并提升人体关键点检测准确率。实验结果表明,MSLNet在COCO和MPII数据集上分别取得了75.8%和91.1%的准确率,实现了最优精度,充分验证了MSLNet能够融合尺度和层级之间的互补特征,进而提升人体姿态估计精度。 展开更多
关键词 高分辨率网络(HRNet) 人体姿态估计 期望最大化注意力 双向特征金字塔网络 特征融合
在线阅读 下载PDF
基于卷积神经网络的线结构光高精度三维测量方法 被引量:1
14
作者 叶涛 何威燃 +2 位作者 刘国鹏 欧阳煜 王斌 《仪器仪表学报》 北大核心 2025年第2期183-195,共13页
线结构光视觉三维测量技术因其高精度和非接触的三维重建优势而被广泛应用。然而,现有的线结构光三维测量方法在标定过程中往往面临较高的耦合性问题,且在复杂环境下,背景噪声和光照变化会严重干扰条纹的提取,导致结构光条纹中心定位精... 线结构光视觉三维测量技术因其高精度和非接触的三维重建优势而被广泛应用。然而,现有的线结构光三维测量方法在标定过程中往往面临较高的耦合性问题,且在复杂环境下,背景噪声和光照变化会严重干扰条纹的提取,导致结构光条纹中心定位精度下降,进而影响整体三维测量的精度和鲁棒性。针对上述问题,提出了一种基于卷积神经网络的鲁棒三维测量方法。首先,设计了一种创新性的残差U型块特征金字塔网络(RSU-FPN),旨在实现背景噪声的干扰抑制和结构光条纹区域中心的高精度鲁棒提取。其次,构建了一种新型的线结构光视觉传感器,并提出了一种分离式测量模型,成功将摄像机标定与光平面标定解耦,极大地提高了系统的灵活性与扩展性。通过这种解耦的标定方式,避免了传统标定方法中存在的耦合问题,使得整个测量系统更加高效且易于调整。实验结果表明,所提出的基于卷积神经网络的鲁棒三维测量方法,在复杂背景下能够实现结构光条纹中心的高精度提取,利用提取出的光条纹中心进行标定,其均方根误差分别为x方向0.005 mm、y方向0.009 mm以及z方向0.097 mm。并且,该方法在不同表面类型(如漫反射表面和光滑反射表面)上均能实现高精度的三维重建,验证了其在实际应用中的优越性和强大的鲁棒性。 展开更多
关键词 线结构光 三维测量 卷积神经网络 残差U型块特征金字塔网络 背景噪声抑制
在线阅读 下载PDF
基于迁移学习的遥感影像少样本目标检测模型 被引量:1
15
作者 杨军 张向宁 《哈尔滨工程大学学报》 北大核心 2025年第10期2125-2132,2162,共9页
针对遥感影像少样本目标检测模型易出现过拟合且检测精度低的问题,本文提出基于迁移学习的遥感影像少样本目标检测模型。在基训练和少样本微调阶段,主干网络中设计自适应特征金字塔模块,通过重新调整、整合、提炼3个步骤增强特征图的表... 针对遥感影像少样本目标检测模型易出现过拟合且检测精度低的问题,本文提出基于迁移学习的遥感影像少样本目标检测模型。在基训练和少样本微调阶段,主干网络中设计自适应特征金字塔模块,通过重新调整、整合、提炼3个步骤增强特征图的表达能力,使不同尺度的特征充分融合,为小目标提供更为准确的特征表示。通过在少样本微调阶段引入Dropblock正则化操作,有效抑制少样本目标检测模型在训练时易出现的过拟合现象,提高目标检测精度。在训练过程中结合均衡损失函数,增强模型对遥感影像数据集中尾部类别的关注,进而提升模型的分类准确率。在10-shot任务设定中,本文算法与对比建议小样本目标检测算法相比,在NWPU VHR-10.v2和DIOR数据集上检测新类的平均精度均值分别提升7.3%和3.2%。实验结果表明,本文算法对基类和新类的检测结果优于已有的同类算法。本文算法显著提升了遥感影像少样本目标检测的泛化能力与分类精度,为新类和基类的识别提供了有效解决方案。 展开更多
关键词 遥感影像 目标检测 少样本学习 迁移学习 特征金字塔 特征融合 正则化 均衡损失
在线阅读 下载PDF
基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别 被引量:3
16
作者 毛清华 苏毅楠 +3 位作者 贺高峰 翟姣 王荣泉 尚新芒 《工矿自动化》 北大核心 2025年第1期11-20,103,共11页
针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换... 针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换主干网络C2f模块为C2fER模块,加强模型的细节特征提取能力,提升模型对小目标人员的识别性能;通过在颈部网络引入特征强化加权双向特征金字塔网络(FE-BiFPN)结构,提高模型的特征融合能力,从而提升模型对多尺度人员目标的识别效果;通过引入分离增强注意力模块(SEAM)增强模型在复杂背景下对局部特征的关注度,提升模型对遮挡目标人员的识别能力;通过引入WIoU损失函数增强训练效果,提升模型识别准确率。消融实验结果表明:改进YOLOv8模型的准确率较基线模型YOLOv8s提升2.3%,mAP@0.5提升3.4%,识别速度为104帧/s。人员识别实验结果表明:与YOLOv10m,YOLOv8s-CA、YOLOv8s-SPDConv和YOLO8n模型相比,改进YOLOv8模型对小目标、多尺度目标、遮挡目标的识别效果均更佳,识别准确率为90.2%,mAP@0.5为87.2%。人员入侵危险区域实验结果表明:井下人员入侵带式输送机危险区域智能识别系统判别人员入侵危险区域的平均准确率为93.25%,满足识别需求。 展开更多
关键词 煤矿带式输送机 人员入侵危险区域 YOLOv8模型 遮挡目标检测 小目标检测 多尺度融合 C2fER模块 特征强化加权双向特征金字塔网络结构
在线阅读 下载PDF
基于改进YOLOv8的路面病害检测模型
17
作者 侯勇严 梁扩旺 +3 位作者 郭文强 郝磊 郭志高 董白杨 《陕西科技大学学报》 北大核心 2025年第3期166-173,共8页
针对现有路面病害检测模型存在特征提取能力弱、特征融合能力不足、未能有效平衡检测精度与轻量化等问题,提出了一种利用通道先验卷积注意力(CPCA)机制和双向特征金字塔网络(BiFPN)改进YOLOv8的路面病害检测模型--YOLOv8n-CB.在YOLOv8n... 针对现有路面病害检测模型存在特征提取能力弱、特征融合能力不足、未能有效平衡检测精度与轻量化等问题,提出了一种利用通道先验卷积注意力(CPCA)机制和双向特征金字塔网络(BiFPN)改进YOLOv8的路面病害检测模型--YOLOv8n-CB.在YOLOv8n的主干网络引入CPCA机制,动态调整通道和空间维度上的注意力权重,增强对小目标的特征提取能力,提高模型的检测精度;其次,将颈部网络替换为加权BiFPN,通过新增加权跳跃连接机制,在实现模型轻量化的同时,提高对小目标的特征融合能力.在China_Mix路面病害数据集上的实验结果表明,改进后的模型mAP@0.5、mAP@[0.5-0.9]与原始模型相比可分别提升1%与2.90%,F1-score提升2%,并且参数量降低29.33%,浮点数运算次数也降低了9.88%.通过与其他YOLO模型的实验对比,本模型的有效性和优越性得到了进一步的验证,为公路综合运输安全风险防控智能化提供了技术支持. 展开更多
关键词 路面病害 YOLO 注意力机制 双向特征金字塔
在线阅读 下载PDF
基于改进CenterNet算法的番茄叶片病害检测
18
作者 李亚 蒋晨 +2 位作者 王海瑞 朱贵富 胡灿 《浙江大学学报(工学版)》 北大核心 2025年第11期2370-2378,共9页
为了解决在传统番茄叶片病害检测中出现的误检和漏检现象,提出基于改进CenterNet算法的番茄叶片病害检测模型.构建融合注意力机制的特征融合模块,增强模型的跨尺度特征融合能力.在骨干网络中加入多分支卷积模块RFB,扩大感受野,加强对目... 为了解决在传统番茄叶片病害检测中出现的误检和漏检现象,提出基于改进CenterNet算法的番茄叶片病害检测模型.构建融合注意力机制的特征融合模块,增强模型的跨尺度特征融合能力.在骨干网络中加入多分支卷积模块RFB,扩大感受野,加强对目标特征的提取能力.在骨干网络中引入金字塔卷积PyConv,通过计算不同尺度的感受野来强化多尺度特征的提取,减少信息损失.设计剪枝优化策略,减少引入模块给模型参数量和计算量带来的影响.试验结果显示,改进后模型的准确率、召回率、mAP_(50)和mAP_(50:95)达到96.3%、80.2%、91.4%和78.7%.利用提出的模型,能够有效地提升番茄叶片病害检测的准确性,模型具有良好的泛化性. 展开更多
关键词 番茄叶片病害 CenterNet 特征融合 金字塔卷积 多分支卷积
在线阅读 下载PDF
具备红外感知的低光场景目标检测
19
作者 张志佳 那惺奇 +2 位作者 肖宇航 房建 赵怀慈 《沈阳工业大学学报》 北大核心 2025年第4期417-424,共8页
【目的】随着人工智能领域的快速发展,基于可见光图像的目标检测技术日益成熟,并在自动驾驶、安防监控、智能交通等领域得到了广泛应用。然而,在低光场景(如黑夜或昏暗灯光环境)下,基于可见光图像的目标检测算法性能显著下降。主要原因... 【目的】随着人工智能领域的快速发展,基于可见光图像的目标检测技术日益成熟,并在自动驾驶、安防监控、智能交通等领域得到了广泛应用。然而,在低光场景(如黑夜或昏暗灯光环境)下,基于可见光图像的目标检测算法性能显著下降。主要原因在于可见光图像在低光条件下信息丢失严重,导致目标特征难以提取。为解决这一问题,提出了基于可见光图像和红外图像的多模态目标检测技术,该技术能够有效改善低光场景下的目标检测性能。然而,多模态检测技术的成本较高,需要对不同模态的图像进行精确配准,计算量较大,从而增加了实现难度和处理负担。基于此,提出了一种具备红外感知的目标检测网络(InSCnet),旨在通过一个可见光相机来预测红外热辐射特征,在不增加模态的情况下提升网络在低光场景下的目标检测能力。【方法】InSCnet以可见光图像为输入,通过红外预测分支(IPB)生成红外图像来预测热辐射特征,从而增强网络对低光场景的感知能力。为了有效融合多尺度视觉和热辐射特征,设计了互补融合滤波(COFF)模块。COFF通过互补融合这两种特征,增强特征间的互补性,避免了网络对单一模态特征的过度依赖。此外,采用混合特征金字塔(HyFP)模块,通过特征金字塔和注意力机制,进一步提升多尺度全局与局部特征的融合与提取能力,确保网络在不同程度的低光条件下均能保持较高的检测准确率。【结果】实验结果表明,InSCnet在LLVIP行人检测数据集上表现优异。具体而言,S mAP50达到了0.830,S mAP50-95达到了0.426。同时在DroneVehicle数据集上进行了实验,S mAP50达到了0.702,证明了InSCnet具备多类别低光检测能力。【结论】InSCnet通过引入红外热辐射特征和特征融合机制,提升了低光场景下的目标检测性能;在低光场景下能够有效检测可见光图像中难以识别的目标,为低光场景下的目标检测提供了一种有效的解决方案。未来的研究可以进一步探索如何优化网络结构。 展开更多
关键词 目标检测 低光场景 红外预测 特征融合 特征金字塔 全局特征 局部特征 人工智能
在线阅读 下载PDF
基于坐标注意力和加权双向特征金字塔网络的舰载机阻拦着舰拉制状态精准识别
20
作者 李哲 杨杰 +4 位作者 张椅 王华 李亚飞 王可 徐明亮 《中国舰船研究》 北大核心 2025年第4期124-133,共10页
[目的]舰载机着舰安全的关键在于尾钩与阻拦索成功挂索,而现有研究中,借助智能化手段辅助着舰指挥官(LSO)识别阻拦着舰状态的工作较少。为此,提出一种融合坐标注意力和加权双向特征金字塔网络的阻拦着舰拉制状态识别模型。[方法]先使用... [目的]舰载机着舰安全的关键在于尾钩与阻拦索成功挂索,而现有研究中,借助智能化手段辅助着舰指挥官(LSO)识别阻拦着舰状态的工作较少。为此,提出一种融合坐标注意力和加权双向特征金字塔网络的阻拦着舰拉制状态识别模型。[方法]先使用坐标注意力机制(CA)从空间和通道两个维度增强模型捕捉特征的能力;再通过加权双向特征金字塔网络(BiFPN)纳入可学习的权值学习不同输入特征的重要性,实现双向多尺度特征融合;然后采用C2F模块轻量化模型架构,减少参数和计算量;最后通过仿真实验将所提模型与5种基线模型进行对比。[结果]结果表明,在舰载机尾钩和阻拦着舰拉制状态的检测上,该模型综合性能均优于基线模型。[结论]该模型有助于提高尾钩及阻拦索的啮合状态检测的准确率和鲁棒性,对提高舰载机着舰作业的效率、预防潜在的人员伤害和装备损失具有重要意义。 展开更多
关键词 舰载机 阻拦装置 状态识别 双向特征金字塔网络(BiFPN) 航空母舰
在线阅读 下载PDF
上一页 1 2 42 下一页 到第
使用帮助 返回顶部