期刊文献+
共找到583篇文章
< 1 2 30 >
每页显示 20 50 100
BDMFuse:Multi-scale network fusion for infrared and visible images based on base and detail features
1
作者 SI Hai-Ping ZHAO Wen-Rui +4 位作者 LI Ting-Ting LI Fei-Tao Fernando Bacao SUN Chang-Xia LI Yan-Ling 《红外与毫米波学报》 北大核心 2025年第2期289-298,共10页
The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method f... The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method for infrared and visible image fusion is proposed.The encoder designed according to the optimization objective consists of a base encoder and a detail encoder,which is used to extract low-frequency and high-frequency information from the image.This extraction may lead to some information not being captured,so a compensation encoder is proposed to supplement the missing information.Multi-scale decomposition is also employed to extract image features more comprehensively.The decoder combines low-frequency,high-frequency and supplementary information to obtain multi-scale features.Subsequently,the attention strategy and fusion module are introduced to perform multi-scale fusion for image reconstruction.Experimental results on three datasets show that the fused images generated by this network effectively retain salient targets while being more consistent with human visual perception. 展开更多
关键词 infrared image visible image image fusion encoder-decoder multi-scale features
在线阅读 下载PDF
Radar emitter signal recognition based on multi-scale wavelet entropy and feature weighting 被引量:16
2
作者 李一兵 葛娟 +1 位作者 林云 叶方 《Journal of Central South University》 SCIE EI CAS 2014年第11期4254-4260,共7页
In modern electromagnetic environment, radar emitter signal recognition is an important research topic. On the basis of multi-resolution wavelet analysis, an adaptive radar emitter signal recognition method based on m... In modern electromagnetic environment, radar emitter signal recognition is an important research topic. On the basis of multi-resolution wavelet analysis, an adaptive radar emitter signal recognition method based on multi-scale wavelet entropy feature extraction and feature weighting was proposed. With the only priori knowledge of signal to noise ratio(SNR), the method of extracting multi-scale wavelet entropy features of wavelet coefficients from different received signals were combined with calculating uneven weight factor and stability weight factor of the extracted multi-dimensional characteristics. Radar emitter signals of different modulation types and different parameters modulated were recognized through feature weighting and feature fusion. Theoretical analysis and simulation results show that the presented algorithm has a high recognition rate. Additionally, when the SNR is greater than-4 d B, the correct recognition rate is higher than 93%. Hence, the proposed algorithm has great application value. 展开更多
关键词 emitter recognition multi-scale wavelet entropy feature weighting uneven weight factor stability weight factor
在线阅读 下载PDF
Underwater Image Enhancement Based on Multi-scale Adversarial Network
3
作者 ZENG Jun-yang SI Zhan-jun 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第5期70-77,共8页
In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of ea... In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of each layer were enhanced into the global features by the proposed residual dense block,which ensured that the generated images retain more details.Secondly,a multi-scale structure was adopted to extract multi-scale semantic features of the original images.Finally,the features obtained from the dual channels were fused by an adaptive fusion module to further optimize the features.The discriminant network adopted the structure of the Markov discriminator.In addition,by constructing mean square error,structural similarity,and perceived color loss function,the generated image is consistent with the reference image in structure,color,and content.The experimental results showed that the enhanced underwater image deblurring effect of the proposed algorithm was good and the problem of underwater image color bias was effectively improved.In both subjective and objective evaluation indexes,the experimental results of the proposed algorithm are better than those of the comparison algorithm. 展开更多
关键词 Underwater image enhancement Generative adversarial network multi-scale feature extraction Residual dense block
在线阅读 下载PDF
Ship recognition based on HRRP via multi-scale sparse preserving method
4
作者 YANG Xueling ZHANG Gong SONG Hu 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第3期599-608,共10页
In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) ba... In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) based on the maximum margin criterion(MMC) is proposed for recognizing the class of ship targets utilizing the high-resolution range profile(HRRP). Multi-scale fusion is introduced to capture the local and detailed information in small-scale features, and the global and contour information in large-scale features, offering help to extract the edge information from sea clutter and further improving the target recognition accuracy. The proposed method can maximally preserve the multi-scale fusion sparse of data and maximize the class separability in the reduced dimensionality by reproducing kernel Hilbert space. Experimental results on the measured radar data show that the proposed method can effectively extract the features of ship target from sea clutter, further reduce the feature dimensionality, and improve target recognition performance. 展开更多
关键词 ship target recognition high-resolution range profile(HRRP) multi-scale fusion kernel sparse preserving projection(MSFKSPP) feature extraction dimensionality reduction
在线阅读 下载PDF
Digital modulation classification using multi-layer perceptron and time-frequency features
5
作者 Yuan Ye Mei Wenbo 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2007年第2期249-254,共6页
Considering that real communication signals corrupted by noise are generally nonstationary, and timefrequency distributions are especially suitable for the analysis of nonstationary signals, time-frequency distributio... Considering that real communication signals corrupted by noise are generally nonstationary, and timefrequency distributions are especially suitable for the analysis of nonstationary signals, time-frequency distributions are introduced for the modulation classification of communication signals: The extracted time-frequency features have good classification information, and they are insensitive to signal to noise ratio (SNR) variation. According to good classification by the correct rate of a neural network classifier, a multilayer perceptron (MLP) classifier with better generalization, as well as, addition of time-frequency features set for classifying six different modulation types has been proposed. Computer simulations show that the MLP classifier outperforms the decision-theoretic classifier at low SNRs, and the classification experiments for real MPSK signals verify engineering significance of the MLP classifier. 展开更多
关键词 Digital modulation classification Time-frequency feature Time-frequency distribution Multi-layer perceptron.
在线阅读 下载PDF
Research on Feature Extraction of Composite Pseudocode Phase Modulation-Carrier Frequency Modulation Signal Based on PWD Transform
6
作者 李明孜 赵惠昌 《Defence Technology(防务技术)》 SCIE EI CAS 2008年第4期281-284,共4页
The identification features of composite pseudocode phase modulation and carry frequency modulation signal include pseudocode and modulation frequency. In this paper,PWD is used to extract these features. First,the fe... The identification features of composite pseudocode phase modulation and carry frequency modulation signal include pseudocode and modulation frequency. In this paper,PWD is used to extract these features. First,the feature of pseudocode is extracted using the amplitude output of PWD and the correlation filter technology. Then the feature of frequency modulation is extracted by way of PWD analysis on the signal processed by anti-phase operation according to the extracted feature of pseudo code,i.e. position information of changed abruptly point of phase. The simulation result shows that both the features of frequency modulation and phase change position caused by the pseudocode phase modulation can be extracted effectively for SNR=3 dB. 展开更多
关键词 信号接收系统 信号分析 侦察 电子对抗
在线阅读 下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
7
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
一种基于元学习的改进YOLO钢管表面缺陷小样本检测模型 被引量:3
8
作者 李凌波 田彦 +1 位作者 江旭东 董宝力 《机电工程》 北大核心 2025年第5期985-993,共9页
针对产品表面缺陷样本数稀缺时的深度学习缺陷检测效果不佳问题,提出了一种基于元学习策略的改进YOLO-SBN模型,用于小样本缺陷检测。首先,为了提高提取全局特征信息的能力,采用了Swin Transformer作为骨干网络模型,引入注意力机制提取... 针对产品表面缺陷样本数稀缺时的深度学习缺陷检测效果不佳问题,提出了一种基于元学习策略的改进YOLO-SBN模型,用于小样本缺陷检测。首先,为了提高提取全局特征信息的能力,采用了Swin Transformer作为骨干网络模型,引入注意力机制提取了特征图的判别能力;然后,为了提高特征融合能力并降低计算复杂度,通过加权双向特征金字塔网络(BiFPN)结构优化了特征提取器的颈部网络,平衡了YOLO-SBN模型的有效性和效率;最后,采用归一化注意力模块(NAM)优化权重调整了模块,增强了浅层缺陷特征的模型表达,并基于这些增强的特征进行了检测;使用金属表面热轧缺陷公开数据集NEU-DET验证了YOLO-SBN模型的算法性能。研究结果表明:对于小样本缺陷检测,YOLO-SBN模型在平均准确率(mAP)方面提高了4.1%;在新类缺陷样本规模数量为50的小样本情况下,改进后的检测模型对新类数据适应性最强。由此可见,该YOLO-SBN模型在提高检测精度和提升模型泛化能力方面具有一定优势。 展开更多
关键词 小样本目标检测 表面缺陷 元学习 特征网络 归一化注意力模块 平均准确率 双向特征金字塔网络(BiFPN)
在线阅读 下载PDF
基于改进Swin Transformer的人脸活体检测 被引量:1
9
作者 王旭光 卜辰宇 时泽宇 《中国测试》 北大核心 2025年第6期31-39,共9页
随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型... 随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型,即CDCSwin-T(central difference convolution Swin Transformer)模型。该模型以Swin Transformer为主干,利用其滑动窗口注意力机制提取人脸全局信息,同时引入中心差分卷积(central difference convolution,CDC)模块提取人脸局部信息,加强主干模型捕获真假人脸差异的能力,从而增强其面对未知攻击的鲁棒性;另外在主干模型中引入瓶颈注意力模块,引导模型关注人脸关键信息,加速模型训练;最终将主干模型不同阶段的多尺度信息进行自适应融合,进一步提升该文模型的泛化能力。CDCSwin-T模型在OULU-NPU数据集4个协议上的平均分类错误率(ACER)分别为0.2%,1.1%,(1.1±0.6)%,(2.8±1.4)%,在CASIA-MFSD和REPLAYATTACK数据集跨库测试上的半错误率(HTER)分别为14.1%,22.9%,均优于当前的主流模型,表明其面对未知攻击的鲁棒性和泛化能力均有所提升。 展开更多
关键词 人脸活体检测 Swin Transformer 瓶颈注意力模块 特征融合
在线阅读 下载PDF
基于多尺度特征融合SSDLite的光伏组件缺陷检测 被引量:1
10
作者 项新建 汤卉 +3 位作者 肖家乐 王世乾 张颖超 王磊 《太阳能学报》 北大核心 2025年第1期669-675,共7页
为了应对光伏组件缺陷检测中人工检测速度缓慢以及使用YOLO等深度学习模型时速度较慢且硬件成本高的问题,提出一种基于SSDLite的多层特征融合轻量化目标检测方法。该方法采用MobileNetV2作为SSDLite模型的骨干网络,并从中提取3个不同层... 为了应对光伏组件缺陷检测中人工检测速度缓慢以及使用YOLO等深度学习模型时速度较慢且硬件成本高的问题,提出一种基于SSDLite的多层特征融合轻量化目标检测方法。该方法采用MobileNetV2作为SSDLite模型的骨干网络,并从中提取3个不同层次的特征层进行特征融合。针对不同缺陷的尺寸特点,对模型中的先验框的大小也进行了重新设计。在MobileNetV2的瓶颈结构中引入CBAM注意力机制,以提高模型的检测精度。相比传统的SSDLite模型,该文模型平均精度从65.8%提高至72.4%,虽然速度略微下降,但已基本满足实际应用的需求。 展开更多
关键词 光伏组件 目标检测 深度学习 SSDLite 多层特征融合 MobileNetV2
在线阅读 下载PDF
基于显著性特征的多视角动作图像识别研究
11
作者 惠向晖 孙艳红 沈小乐 《现代电子技术》 北大核心 2025年第13期62-65,共4页
文中基于显著性特征的多视角动作图像识别方法,自动学习并提取出运动员动作的关键特征,有助于教练为运动员制定更科学、更个性化的训练计划。将人体骨架序列对齐到统一的时空坐标系中,计算距离图和角度图以捕捉骨架的空间特征,生成人体... 文中基于显著性特征的多视角动作图像识别方法,自动学习并提取出运动员动作的关键特征,有助于教练为运动员制定更科学、更个性化的训练计划。将人体骨架序列对齐到统一的时空坐标系中,计算距离图和角度图以捕捉骨架的空间特征,生成人体运动特征图;构建CNN+CA模型,将处理后的多视角动作视频帧生成感兴趣区域(ROI)拼接图,再将其输入到CNN中,提取多视角融合特征,并在CA模块中突出那些对于动作图像识别最为关键的区域;通过序列匹配算法将多视角动作识别问题转化为预测标签序列的匹配问题,为待识别动作图像分配动作类别标签,实现准确的多视角动作图像识别。实验结果表明:该方法不仅能够有效处理来自不同视角的动作图像,还能够准确识别出篮球运动员的多种动作。 展开更多
关键词 显著性特征 多视角动作图像 运动特征图 ROI拼接图 CNN CA模块 LSTM 序列匹配算法
在线阅读 下载PDF
自适应空间与分组注意的激光点云分割方法
12
作者 李庆祥 覃丽萍 罗训 《激光与红外》 北大核心 2025年第6期893-900,共8页
随着激光点云数据的普及,研究如何提取丰富的点云特征信息变得尤为重要。现有方法多注重局部特征学习,却忽视了点云的位置与特征间的关联,且未对全局信息进行建模。为改进此状况,本文提出了自适应空间特征模块(Adaptive Spatial Feature... 随着激光点云数据的普及,研究如何提取丰富的点云特征信息变得尤为重要。现有方法多注重局部特征学习,却忽视了点云的位置与特征间的关联,且未对全局信息进行建模。为改进此状况,本文提出了自适应空间特征模块(Adaptive Spatial Feature, ASF)和分组注意力(GroupFormer)。ASF包括自适应特征块(adaptive feature block)和混合局部块(mixed local block),其可以动态学习点云位置与特征之间关系以及消除均匀加权。混合局部块将局部最大值特征数据与局部自适应特征数据结合起来,以保留局部上下文细节。ASF融入编码器-解码器结构形成ASF-Net网络,同时引入分组注意力以提取全局点云特征信息。实验表明,ASF-Net在S3DIS和ScanNet v2数据集上的语义分割性能卓越,提高了点云特征提取的准确性。 展开更多
关键词 点云语义分割 自适应空间特征模块 自适应特征块 混合局部块 分组注意力
在线阅读 下载PDF
基于孪生网络的特征融合位移RGB-T目标跟踪
13
作者 李海燕 曹永辉 +1 位作者 郎恂 李海江 《湖南大学学报(自然科学版)》 北大核心 2025年第4期68-78,共11页
为解决现有目标跟踪算法深层次特征提取困难、不能充分利用跨模态信息以及目标特征表示较弱等问题,提出了基于孪生网络的特征融合位移RGB-T目标跟踪算法.首先,基于可见光模态SiameseRPN++的目标跟踪框架,扩展设计红外模态分支,以获得多... 为解决现有目标跟踪算法深层次特征提取困难、不能充分利用跨模态信息以及目标特征表示较弱等问题,提出了基于孪生网络的特征融合位移RGB-T目标跟踪算法.首先,基于可见光模态SiameseRPN++的目标跟踪框架,扩展设计红外模态分支,以获得多模态目标跟踪框架,设计了改进步长的ResNet50作为特征提取网络,有效挖掘目标的深层次特征.随后,设计特征交互学习模块,利用一种模态的判别信息引导另一种模态的目标外观特征学习,挖掘特征空间和通道中的跨模态信息,增强网络对前景信息的关注.然后,设计多模特征融合模块计算输入的可见光图像和红外图像的特征融合度,对不同模态的重要特征进行空间融合以去除冗余信息,并采用级联融合策略重建多模态图像,增强目标特征表示.最后,设计特征空间位移模块,分割红外模态分支的特征图并向四个不同方向移位,增强热源目标特征的边缘表示.在两个RGB-T数据集上的实验验证了提出算法的有效性,消融实验证明了设计的单个模块的优越性. 展开更多
关键词 RGB-T跟踪 多模特征融合模块 特征空间位移模块 特征交互学习模块
在线阅读 下载PDF
CSD-YOLOv8的输电线路故障目标检测
14
作者 马旭 王锐 +6 位作者 邓军 常驰 郝帅 李添麒 刘峥岐 李国亮 赵晴 《西安科技大学学报》 北大核心 2025年第2期383-392,共10页
针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入... 针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入空间金字塔池化将不同尺度特征进行融合;然后,在检测网络头部中引入深度可分离卷积,并将其与交叉卷积连接模块结合,实现对部分遮挡目标的准确检测;此外,设计基于通道注意力机制的特征融合模块对不同层级特征进行加权融合,提高复杂背景下故障目标特征信息提取能力;最后,利用某电力巡检部门近5年的巡检数据对所提出算法进行验证。结果表明:相比于4种经典对比算法,所提方法在对12种故障类型检测效果的综合指标最好,平均检测精度为94.7%,召回率为93.0%。与此同时,所提算法具有较好的实时性,对于分辨率为1280×720的图像检测速度为45帧/s,为输电线路的智能巡检奠定了坚实的理论基础。 展开更多
关键词 YOLOv8 多尺度检测 通道注意力机制 特征融合 深度可分离模块
在线阅读 下载PDF
面向杂乱场景的机械臂抓取位姿预测方法
15
作者 李轩青 陈燕 《机电工程》 北大核心 2025年第6期1185-1192,共8页
针对复杂场景下机器人抓取智能化程度及抓取精度不足等问题,提出了一种新颖的机器人抓取位姿预测方法,即实时抓取网络(RGN)。首先,引入KPConv作为骨干网络,将其用于超点与密集点的特征提取,提出了一种新颖的几何特征计算方法,并利用交... 针对复杂场景下机器人抓取智能化程度及抓取精度不足等问题,提出了一种新颖的机器人抓取位姿预测方法,即实时抓取网络(RGN)。首先,引入KPConv作为骨干网络,将其用于超点与密集点的特征提取,提出了一种新颖的几何特征计算方法,并利用交叉注意力机制实现了多源特征的融合目的;然后,提出了区域关联特征提取模块,借助于几何特征信息进行了区域划分,通过多层感知机进一步完成了抓取位姿的预测,利用抓取系统运动链将夹爪位姿映射到了机械臂关节角特征上,控制机械臂完成了抓取;最后,引入了多样性损失函数,并将其与基线模型进行了对比,利用GraspNet-1Billion数据集和Cornell数据集开展了复杂场景下机械臂抓取性能的测试实验。研究结果表明:采用RGN方法可使抓取预测精度得到大幅提升,最大提升幅度达78.2%;将传统手工特征与深度学习相融合,对机械臂抓取位姿预测精度的提升起到了关键作用,这一规律可为构建良好的机械臂抓取模型提供具体参考方向。 展开更多
关键词 机器人抓取 抓取位姿估计 实时抓取网络 点云 深度学习 特征提取模块 交叉注意力模块
在线阅读 下载PDF
基于Transformer两阶段策略的古代服饰线图提取
16
作者 周蓬勃 冯龙 +1 位作者 武浩东 寇宇帆 《西北大学学报(自然科学版)》 北大核心 2025年第1期75-84,共10页
古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第... 古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第一阶段将图像分割成16×16粗粒度补丁,利用编码器进行全局自注意力计算以捕获补丁间依赖;第二阶段采用8×8细粒度无重叠滑动窗口覆盖图像,通过局部编码器计算窗口内注意力有效捕捉细微边缘且降低成本。设计了轻量特征融合模块,支持全局与局部特征的高效整合。实验结果表明,该方法在古代服饰和公共数据集上边缘轮廓信息提取效果优于现有方法,ODS指标平均提升15.9%。虽然OIS和AP未超过Informative Drawing,但在模型体量和耗时方面具有明显优势。 展开更多
关键词 边缘检测 TRANSFORMER 轻量特征融合模块
在线阅读 下载PDF
一种改进的Faster R-CNN遥感图像多目标检测模型研究
17
作者 苗茹 李祎 +3 位作者 周珂 张俨娜 常然然 孟更 《计算机工程》 北大核心 2025年第8期292-304,共13页
针对遥感图像背景复杂、目标种类多和尺度差异大所造成的目标漏检和误检问题,提出一种改进Faster R-CNN多目标检测模型。首先,采用Swin Transformer来替代ResNet 50骨干网络,增强模型特征提取能力;其次,添加平衡特征金字塔(BFP)模块融... 针对遥感图像背景复杂、目标种类多和尺度差异大所造成的目标漏检和误检问题,提出一种改进Faster R-CNN多目标检测模型。首先,采用Swin Transformer来替代ResNet 50骨干网络,增强模型特征提取能力;其次,添加平衡特征金字塔(BFP)模块融合浅层和高层语义信息,进一步加强特征融合效果;最后,在分类和回归分支中,添加动态权重机制,促进网络在训练过程中更关注高质量候选框,提高目标定位和分类的精确度。在RSOD数据集上的实验结果表明,所提模型相较于Faster R-CNN模型每秒浮点运算次数(FLOPs)大幅度减少,并且模型的mAP@0.5∶0.95提高了10.7百分点,平均召回率提高10.6百分点。相较于其他主流检测模型,所提模型在降低漏检率的同时,取得了更高的精度,能显著提高复杂背景下遥感图像的检测精度。 展开更多
关键词 遥感图像 多目标检测 Faster R-CNN Swin Transformer模块 平衡特征金字塔 动态权重机制
在线阅读 下载PDF
多尺度融合增强与注意力机制结合的图像语义分割
18
作者 刘书刚 杜昊东 王洪涛 《计算机应用与软件》 北大核心 2025年第6期225-233,278,共10页
针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特... 针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特征信息进行融合,在解码器末端使用改进的轻量化卷积注意力模块,使得对于物体边界分割更加充分。通过在Pascal VOC2007和Cityscapes数据集上进行实验验证,结果表明该方法较原有网络的精确度有显著的提高。 展开更多
关键词 语义分割 特征融合增强 注意力模块 编码器 上采样
在线阅读 下载PDF
基于改进TransUNet的肺部图像分割
19
作者 石勇涛 邱康齐 +1 位作者 柳迪 杜威 《现代电子技术》 北大核心 2025年第15期27-36,共10页
语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度... 语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度边缘特征融合的神经网络(MSB-AffTransU2Net)用于肺部图像的分割。首先,替换了TransUNet中的编解码器,采用U2-Net的RSU模块来增强特征提取的性能;然后,使用注意力特征融合机制替换原本的Concat方法,以减少模型参数并且提升特征的融合效果;接着,加入了多尺度特征提取器以及边界引导的上下文聚合模块,以融合提取更加精确的肺部边缘特征;最后,为优化模型损失函数,采纳了Dice损失与交叉熵损失,创建了一个新颖的损失函数。在COVID-19 Radiography Database的COVID类数据集上验证了所提算法的有效性。实验结果证明,MSB-AffTransU2Net在COVID数据集上的前景交并比(pIoU)和平均准确率(mAcc)与TransUNet算法相比,分别提高了3.03%和0.72%,证明了所提算法的有效性。 展开更多
关键词 COVID-19 肺部图像分割 TransUNet 边缘特征 边界引导的上下文聚合模块 注意力特征融合
在线阅读 下载PDF
改进型密集递归残差U-Net的皮肤病变图像分割
20
作者 赵德春 袁杨 +2 位作者 秦璐 韦莉 叶昌荣 《中国生物医学工程学报》 北大核心 2025年第3期291-300,共10页
皮肤病变区域的准确分割对计算机辅助诊断具有重要意义。但皮肤病变图像形状不规则、边界模糊并存在噪声干扰,给皮肤病变区域准确分割造成了困难,极大影响了分割的精度。为此,提出了一种基于改进型密集递归残差U-Net模型(IDR2U-Net),实... 皮肤病变区域的准确分割对计算机辅助诊断具有重要意义。但皮肤病变图像形状不规则、边界模糊并存在噪声干扰,给皮肤病变区域准确分割造成了困难,极大影响了分割的精度。为此,提出了一种基于改进型密集递归残差U-Net模型(IDR2U-Net),实现皮肤病变区域自动分割。首先,将编码层和解码层中的原始卷积块优化为递归残差卷积模块,并且使用密集连接,缓解了梯度消失问题;其次,引入特征自适应模块,通过加强有效特征和抑制无关背景噪声,增强相邻特征之间的融合程度;接着,设计双重注意力机制,其中空间注意力增大全局信息的利用效率,通道注意力用于加强通道特征间的相关性,提升网络对皮肤病变区域分割的准确率,同时采用联合Dice系数与交叉熵的损失函数训练分割网络,解决皮肤镜图像中类别不平衡的问题;最后,采用ISIC 2017皮肤病变数据集中的2000余张图片进行了消融实验和对比实验。实验结果表明,IDR2U-Net模型在Jaccard、Dice系数和准确率上分别达到了78.86%、86.92%和94.61%。改进后的模型不仅提高了精度,还实现了更精细的图像分割,特别是在处理边界模糊图像时,能有效减少欠分割现象。 展开更多
关键词 皮肤病变图像分割 U型网络 密集递归残差卷积模块 特征自适应模块 双重注意力机制
在线阅读 下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部