期刊文献+
共找到485篇文章
< 1 2 25 >
每页显示 20 50 100
单目RGB穿衣人体的手部精细化重建
1
作者 张冀 任志鹏 +3 位作者 张荣华 苑朝 翟永杰 余正秦 《计算机应用研究》 北大核心 2025年第1期300-306,共7页
为解决单目穿衣人体在复杂姿态下手部形状重建存在遮挡和缺失的失真问题,提出了一种结合ECON与MANO手部模型,实现高效穿衣人体的手部精细化重建方法H-ECON(hand-focused explicit clothed humans obtained from normals)。具体而言,该... 为解决单目穿衣人体在复杂姿态下手部形状重建存在遮挡和缺失的失真问题,提出了一种结合ECON与MANO手部模型,实现高效穿衣人体的手部精细化重建方法H-ECON(hand-focused explicit clothed humans obtained from normals)。具体而言,该方法首先以类型无关的手部检测器聚焦手部区域并进行翻转和裁剪;然后,引入注意力机制用于增强对手部区域的感知能力,空洞螺旋卷积则更好地捕捉手部不同尺度的特征;最后,独特的融合模块确保了手部重建与整身模型的融合效果。在FreiHAND和HanCo公开数据集上与其他方法的定量定性对比结果表明了H-ECON的有效性,其独立手部模块明显优于ECON中的替代手部模块。H-ECON实现了对人体手部几何和姿态变化的精确描述,进一步缩小了2D图像生成到3D人体网格之间的差距。 展开更多
关键词 手部重建 穿衣人体 注意力机制 空洞螺旋卷积 深度几何学习
在线阅读 下载PDF
基于改进DeepLabv3+的安全帽佩戴分割算法
2
作者 邵晓艳 董文永 +2 位作者 赵雪专 李玲玲 薄树奎 《西南大学学报(自然科学版)》 北大核心 2025年第7期185-195,共11页
针对物流园区空间跨度大、作业设备繁多导致安全帽佩戴检测分割难度增加的问题,提出一种基于改进DeepLabv3+的安全帽佩戴分割算法。该算法采用ResNet-101膨胀残差网络进行特征提取;在编码阶段引入卷积注意力机制融合模块,有效增强特征... 针对物流园区空间跨度大、作业设备繁多导致安全帽佩戴检测分割难度增加的问题,提出一种基于改进DeepLabv3+的安全帽佩戴分割算法。该算法采用ResNet-101膨胀残差网络进行特征提取;在编码阶段引入卷积注意力机制融合模块,有效增强特征区域表征能力;在特征提取阶段引入图像特征网格化模块,将低分辨率图像进行平均切分,有助于获得局部图像的小目标特征。将该算法在SHWD(Safety Helmet Wearing Detect)数据集中训练测试,结果表明:算法的像素准确率达到89.23%,相比DeepLabv3+提升了2.21个百分点,有效提高了复杂场景下物流园区安全帽佩戴分割精度。 展开更多
关键词 神经网络 注意力机制 膨胀卷积 语义分割
在线阅读 下载PDF
基于金字塔卷积和像素注意力的分割方法
3
作者 阴桂梅 肖易勇 +4 位作者 席鑫华 赵艳丽 谭淑平 强彦 罗士朝 《计算机应用与软件》 北大核心 2025年第6期241-248,289,共9页
针对医学图像分割任务中存在的分割目标大小变化跨度大且结构复杂,以及神经网络对目标边缘细节学习效果差这两个问题,在U-Net网络的基础上构造了金字塔空洞卷积与像素级注意力网络(DP-Net)。设计金字塔空洞卷积模块并替换传统的卷积操作... 针对医学图像分割任务中存在的分割目标大小变化跨度大且结构复杂,以及神经网络对目标边缘细节学习效果差这两个问题,在U-Net网络的基础上构造了金字塔空洞卷积与像素级注意力网络(DP-Net)。设计金字塔空洞卷积模块并替换传统的卷积操作,通过多种空洞卷积的组合扩展了网络感受野并编码得到全局上下文信息;提出像素级注意力模块,在通道注意力机制的基础上进一步编码像素间的依赖关系使网络能从不同通道的特征中学习到更丰富的局部上下文信息。通过在肺部公开数据集LIDC和私人肝肿瘤数据集上进行实验评估,所提出的DP-Net在三种评估指标上都获得优于当前方法的性能,证明所提出网络改进在分割精度方面的有效性。 展开更多
关键词 深度学习 医学图像处理 图像分割 注意力机制 空洞卷积
在线阅读 下载PDF
融合混合空洞卷积和动态卷积的敦煌壁画修复
4
作者 刘仲民 李耀龙 胡文瑾 《计算机工程与设计》 北大核心 2025年第2期595-602,共8页
为有效修复壁画破损区域的语义信息、解决壁画深层特征信息提取不足导致的修复伪影以及修复失真等问题,提出一种融合混合空洞卷积与动态卷积的敦煌壁画修复模型。针对修复伪影问题,在模型编码阶段设计一种混合残差模块;针对修复失真问题... 为有效修复壁画破损区域的语义信息、解决壁画深层特征信息提取不足导致的修复伪影以及修复失真等问题,提出一种融合混合空洞卷积与动态卷积的敦煌壁画修复模型。针对修复伪影问题,在模型编码阶段设计一种混合残差模块;针对修复失真问题,通过在动态核预测分支和动态语义及图像滤波分支中加入动态卷积来提高网络的预测和滤波性能。实验结果表明,所提模型具有更高的评价指标,且视觉效果上具有更细致的纹理,语义信息更丰富,边缘结构更连贯。 展开更多
关键词 信息处理技术 壁画修复 混合空洞卷积 动态卷积 图像滤波 残差网络 深度学习
在线阅读 下载PDF
基于DC-HED网络和骨架提取的岩心图像边缘检测
5
作者 潘少伟 杨怡婷 +2 位作者 尚娅敏 郭智 蔡文斌 《中国石油大学学报(自然科学版)》 北大核心 2025年第3期97-107,共11页
整体嵌套边缘检测(holistically-nested edge detection,HED)网络是目前图像边缘检测领域内一种应用广泛且性能良好的深度网络模型,但存在图像检测边缘缺失、冗余和模糊不清等不足。针对此问题,提出一种扩张卷积(dilated convolution,DC... 整体嵌套边缘检测(holistically-nested edge detection,HED)网络是目前图像边缘检测领域内一种应用广泛且性能良好的深度网络模型,但存在图像检测边缘缺失、冗余和模糊不清等不足。针对此问题,提出一种扩张卷积(dilated convolution,DC)结合HED网络的深度网络模型DC-HED。首先,去除原HED网络最后两层的池化层以进一步保留图像边缘信息;再加入扩张卷积来扩大感受野,更好地还原图像边缘细节,重新设计DC-HED网络。之后利用Zhang-Suen算法对其图像边缘检测结果进行骨架提取。把DC-HED网络和骨架提取应用于中国陕北地区S油田不同岩心铸体薄片图像(简称岩心图像)的边缘检测中,获得较好的试验效果。结果表明:相比已有文献中方法、传统Canny算子、传统Sobel算子和原HED网络,DC-HED网络检测获得的图像边缘更完整,连通性更好;DC-HED网络测试得到的均方误差、结构相似性和峰值信噪比分别为0.1106、0.7997和9.5611,与前面几种方法相比,均有较大幅度的改善。最后将图像骨架提取方法应用于已获得的图像边缘中,剔除了杂乱的图像边缘信息,可得到清晰连续的图像边缘中心轮廓线条。 展开更多
关键词 岩心铸体薄片图像 边缘检测 岩心数字化 HED网络 扩张卷积 骨架提取
在线阅读 下载PDF
改进YOLOv11的药包玻璃瓶缺陷检测方法
6
作者 陈宏彩 程煜 任亚恒 《包装工程》 北大核心 2025年第9期203-208,共6页
目的针对药包玻璃瓶缺陷检测中目标检测精度低及小目标漏检率高的问题,提出一种改进YOLOv11的药包玻璃瓶外观缺陷检测方法。方法首先,在YOLOv11的主干网络中引入动态蛇形卷积网络,通过其自适应地关注不同缺陷特性,有效聚焦不同形状和大... 目的针对药包玻璃瓶缺陷检测中目标检测精度低及小目标漏检率高的问题,提出一种改进YOLOv11的药包玻璃瓶外观缺陷检测方法。方法首先,在YOLOv11的主干网络中引入动态蛇形卷积网络,通过其自适应地关注不同缺陷特性,有效聚焦不同形状和大小的缺陷特征,增强模型对缺陷局部结构特征的提取能力;其次,在浅层网络中构建多尺度空洞注意力机制,全面捕捉并整合多尺度特征信息;最后,设计微小目标检测层,捕捉网络结构浅层特征中丰富的细节信息,进一步提高微小缺陷目标的检测能力。结果实验结果表明,该方法在预灌封注射器数据集上的检测平均准确率达到88.38%,较基准模型提升3.8%,特别是在小目标检测上表现突出。结论改进方法能够有效提高药包玻璃瓶缺陷的检测精度,为自动化检测领域提供一种切实可行的解决方案。 展开更多
关键词 药包玻璃瓶 缺陷检测 YOLOv11 动态蛇形卷积 多尺度空洞注意力 小目标
在线阅读 下载PDF
基于ECA-TCN的数据中心磁盘故障预测 被引量:1
7
作者 张铭泉 王宝兴 《智能系统学报》 北大核心 2025年第2期389-399,共11页
随着数据中心规模的不断扩大,磁盘故障对数据中心的运行稳定性产生越来越大的影响。当前预测方法在面对大规模、高维度和长序列的磁盘运行数据时仍存在不足。本文提出了一种高效通道注意力时间卷积网络(efficient channel attention-tem... 随着数据中心规模的不断扩大,磁盘故障对数据中心的运行稳定性产生越来越大的影响。当前预测方法在面对大规模、高维度和长序列的磁盘运行数据时仍存在不足。本文提出了一种高效通道注意力时间卷积网络(efficient channel attention-temporal convolutional network,ECA-TCN)模型,通过结合传统卷积神经网络一维卷积的优势,融入扩张卷积和残差结构,并引入注意力机制,该模型能够提高磁盘故障预测的准确性和稳定性。在实验中,将ECA-TCN模型与其他经典深度学习方法进行了比较,实验结果表明,ECA-TCN模型在磁盘故障预测任务上具有较高的准确性和稳定性。 展开更多
关键词 磁盘故障预测 长短时记忆网络 循环神经网络 扩张卷积 高效通道注意力机制 神经网络模型 时间序列预测 深度学习优化
在线阅读 下载PDF
改进U-Net模型的隧道掌子面图像语义分割研究
8
作者 陈登峰 程静 +1 位作者 赵蕾 何拓航 《防灾减灾工程学报》 北大核心 2025年第4期776-783,共8页
隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征... 隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征传递到高层的跳跃连接导致特征映射过大。因此,提出加入空洞空间卷积池化金字塔模块ASPP和卷积注意力模块CBAM的改进U-Net模型。在U-Net模型的跳跃连接过程中加ASPP,利用不同膨胀率的空洞卷积捕获不同尺度的上下文信息,融合不同感受野的信息,从而更全面的理解图像内容;U-Net模型的下采样过程中加入CBAM,使网络模型更加关注有用的特征,从而增强特征的表达能力。实验结果表明,改进的网络模型相较于原始U-Net模型分割和识别性能有显著提升,在某隧道工程掌子面岩体图像数据集上Precision达到93.04%,mIoU达到74.98%,mPA达到78.89%。 展开更多
关键词 隧道掌子面 图像语义分割 卷积注意力模块 空洞空间卷积池化金字塔模块
在线阅读 下载PDF
用于交通流预测的时空异质化两阶段融合网络
9
作者 侯越 尹杰 +1 位作者 张志豪 卢可可 《华南理工大学学报(自然科学版)》 北大核心 2025年第5期82-93,共12页
针对现有交通流预测研究中存在的未能充分融合复杂时空相关性和时空异质性的问题,该文设计了一种基于栅格数据的交通流预测网络——时空异质化两阶段融合网络(Spatiotemporal Heterogeneous Two-Stage Fusion Neural Network,ST_HTFNN)... 针对现有交通流预测研究中存在的未能充分融合复杂时空相关性和时空异质性的问题,该文设计了一种基于栅格数据的交通流预测网络——时空异质化两阶段融合网络(Spatiotemporal Heterogeneous Two-Stage Fusion Neural Network,ST_HTFNN)。该网络使用分阶段、层次化的时空特征提取架构,采用静态和动态特征提取阶段串行的新模式,在静态特征提取阶段引入新颖的类曼巴线性注意力(Mamba-Like Linear Attention,MLLA)块作为静态异质化融合单元,实现空间上的相关性和异质性融合挖掘,在动态特征提取阶段设计了简单高效的动态异质化融合单元,通过膨胀卷积和门控机制的结合来自适应融合捕捉全局和局部的时空相关性和异质性。同时,针对细致到道路级的交通流特征,设计了道路特征增强模块来重建和增强道路信息,以解决深度卷积过程中道路特征平滑的问题。最后,设计了外部扰动特征融合模块来融合外部扰动特征对交通流预测结果的影响。在3个现实世界的交通数据集BikeNYC、TaxiCQ和TaxiBJ上进行的模型实验表明,ST_HTFNN模型展现出了超越现有基线模型的卓越性能,相应的预测精度平均绝对误差分别降低了6.13%、0.8%和7.01%。 展开更多
关键词 交通流预测 栅格数据 时空异质化 膨胀卷积 门控机制
在线阅读 下载PDF
融合注意机制的多尺度自适应空洞卷积面部情感识别方法
10
作者 王春影 孟天宇 +2 位作者 张震 葛雄心 杨继伟 《重庆理工大学学报(自然科学)》 北大核心 2025年第5期90-97,共8页
针对面部不连续动作单元的关联特征提取困难,以及不同面部区域对表情识别影响程度不一可能引入无用信息的问题,提出了一种基于双分支注意力机制的多尺度自适应空洞卷积模型(dual branching attention mechanism-adaptive multi-scale di... 针对面部不连续动作单元的关联特征提取困难,以及不同面部区域对表情识别影响程度不一可能引入无用信息的问题,提出了一种基于双分支注意力机制的多尺度自适应空洞卷积模型(dual branching attention mechanism-adaptive multi-scale dilated convolution,DAM-ADCNN)。模型通过双分支注意力机制生成特征映射,表征面部动作单元的局部和全局分布及关联关系;利用多尺度空洞卷积提取面部不连续动作单元的关键特征;采用自适应方式动态调整不同尺度关联特征的权重,以有效减少无用信息的干扰。结果表明,DAM-ADCNN模型在情感识别任务中的表现优于现有方法。在DEAP数据集的唤醒和效价维度上,模型的识别准确率分别提升了3.66%和3.99%。同时,在CK+数据集上,模型的识别准确率提高了3.93%。这些结果证明了DAM-ADCNN模型在面部表情情感识别中的有效性。 展开更多
关键词 面部情感识别 双分支注意力机制 空洞卷积 自适应权重
在线阅读 下载PDF
基于无意调相边带信息的雷达辐射源个体识别
11
作者 黄湘松 王振 +1 位作者 潘大鹏 赵一洋 《电子与信息学报》 北大核心 2025年第6期1762-1771,共10页
无意调相是雷达辐射源个体识别中的关键信息,能够提供细微的相位变化信息,捕捉到不同辐射源的微小差异,在区分具有相似硬件结构的雷达辐射源时具有显著优势。针对同一厂家生产的同型号辐射源无意调相特性区分性不明显的问题,该文提出一... 无意调相是雷达辐射源个体识别中的关键信息,能够提供细微的相位变化信息,捕捉到不同辐射源的微小差异,在区分具有相似硬件结构的雷达辐射源时具有显著优势。针对同一厂家生产的同型号辐射源无意调相特性区分性不明显的问题,该文提出一种基于无意调相边带信息与深度学习相结合的个体识别方法。通过深入挖掘无意调相特性中的边带信息,增强不同辐射源个体间的差异性,并引入双路循环膨胀卷积网络增加神经网络感受野。实验实测数据显示,该方法在信噪比为5 dB的条件下,仍能对10台同型号的辐射源实现87.58%的平均识别准确率,对比1维残差网络,识别精度提高了21.41%。 展开更多
关键词 辐射源个体识别 无意调相 边带信息 循环膨胀卷积网络 同步压缩小波变换
在线阅读 下载PDF
基于门控扩张循环卷积神经网络的语音增强
12
作者 郭业才 周雪 《计算机工程与设计》 北大核心 2025年第6期1818-1824,共7页
为解决语音增强任务中语音信息未充分利用的问题,提出一种基于深度学习的方法,即融合精确比值掩蔽的门控扩张循环卷积神经网络(gate-dilated recurrent convolutional neural network with accurate ratio masking, GDRCNN-ARM)。GDRCN... 为解决语音增强任务中语音信息未充分利用的问题,提出一种基于深度学习的方法,即融合精确比值掩蔽的门控扩张循环卷积神经网络(gate-dilated recurrent convolutional neural network with accurate ratio masking, GDRCNN-ARM)。GDRCNN由编码器、循环卷积层和解码器3部分组成,编码器中借助扩张卷积和门控机制实现对上下文语音信息的捕获,进行并行处理;循环卷积层采用GRU且引入多头注意力机制,捕捉网络中的长期依赖关系;解码器采用逐层解码且通过跳跃连接进行编码器信息的复用,实现对语音细节的还原。实验数据表明,GDRCNN网络在参数量和模型大小方面明显优于DNN、CRN等网络,PESQ平均提高了0.612、0.158,STOI平均提高了0.072、0.020,在语音增强和泛化方面表现出色。 展开更多
关键词 语音增强 深度学习 精确比值掩蔽 扩张卷积 门控机制 循环卷积 并行处理
在线阅读 下载PDF
自适应全景聚焦X射线图像违禁品检测算法
13
作者 崔丽群 杨莹莹 +1 位作者 金海波 吴正伟 《光电工程》 北大核心 2025年第4期31-48,共18页
针对X射线安检图像中样本重叠遮挡占比高、关键特征提取困难、背景噪声大导致的漏检和误检问题,提出一种自适应全景聚焦X射线图像违禁品检测算法。首先,设计前景特征感知模块,通过强化前景目标的边缘结构和纹理细节,精准区分违禁品和背... 针对X射线安检图像中样本重叠遮挡占比高、关键特征提取困难、背景噪声大导致的漏检和误检问题,提出一种自适应全景聚焦X射线图像违禁品检测算法。首先,设计前景特征感知模块,通过强化前景目标的边缘结构和纹理细节,精准区分违禁品和背景噪声,提高特征表达的准确性和完整性。然后,结合多分支结构和双重交叉注意力机制构造多路径双维信息整合模块,优化通道和空间维度的特征交互与融合,加强关键特征的提取能力,有效抑制背景干扰。最后,构建全景动态聚焦检测头,通过频率自适应空洞卷积实现感受野的动态调整,以适配小尺寸违禁品目标的特征频率分布,增强模型对小目标的识别能力。在公开数据集SIXray和OPIXray上进行训练和测试,mAP@0.5分别达到93.3%和92.5%,优于其他对比算法。实验结果表明,该模型显著改善了X射线图像中违禁品的漏检和误检情况,具有较高的准确性和鲁棒性。 展开更多
关键词 X射线图像 违禁品检测 前景特征感知 多路径双维信息整合 频率自适应空洞卷积
在线阅读 下载PDF
基于多尺度时空特征融合的视频异常事件检测 被引量:1
14
作者 李歌 肖洪兵 +2 位作者 闫善武 王瑜 孙梅 《燕山大学学报》 北大核心 2025年第1期74-82,共9页
在视频异常事件检测的问题上,现有的研究方法未充分考虑场景中的背景信息干扰和目标尺度变化,导致检测精度普遍较低。针对此类问题,提出了一种融合多尺度时空信息的异常事件检测方法。首先,应用一种坐标注意力的方法,使模型更多地关注... 在视频异常事件检测的问题上,现有的研究方法未充分考虑场景中的背景信息干扰和目标尺度变化,导致检测精度普遍较低。针对此类问题,提出了一种融合多尺度时空信息的异常事件检测方法。首先,应用一种坐标注意力的方法,使模型更多地关注异常事件发生的区域。其次,为了提取到各层次丰富的时空信息,采用空洞卷积网络构建一种多分支多尺度的特征融合模块。最后,考虑到正常事件的多样性,提出一种规则分数,以便在测试阶段进一步更新记忆增强模块中的记忆项,提高对异常事件的检测精度。在CUHK Avenue和ShanghaiTech数据集的相关实验中,提出方法的帧级AUC分别达到了88.7%和77.5%,且满足视频检测的实时性要求,验证了该方法的可行性和有效性。 展开更多
关键词 视频异常检测 无监督学习 空洞卷积 多尺度时空特征融合 记忆增强模块
在线阅读 下载PDF
基于混合注意力机制和Deeplabv3+的遥感影像建筑物提取方法 被引量:2
15
作者 刘晨晨 葛小三 +2 位作者 武永斌 余海坤 张蓓蓓 《自然资源遥感》 北大核心 2025年第1期31-37,共7页
在大量且复杂的遥感影像中提取建筑物信息是遥感智能应用的重要研究内容之一。针对复杂环境下的遥感影像建筑物提取不精准及小型建筑物易被忽略等问题,文章提出了一种基于混合注意力机制和Deeplabv3+的遥感影像语义分割算法——SC-deep... 在大量且复杂的遥感影像中提取建筑物信息是遥感智能应用的重要研究内容之一。针对复杂环境下的遥感影像建筑物提取不精准及小型建筑物易被忽略等问题,文章提出了一种基于混合注意力机制和Deeplabv3+的遥感影像语义分割算法——SC-deep网络。该网络采用编码-解码结构,利用主干残差注意力网络提取深层特征和浅层特征,通过空洞空间金字塔池化模块和通道空间注意力模块聚合遥感影像的空间和通道信息权重,有效利用了遥感影像建筑物的多尺度信息,从而减少影像细节在训练中的损失。实验结果表明,所提方法在Aerial imagery dataset数据集上的分割结果均优于其他主流分割网络,能够有效识别并提取复杂建筑物边缘和小型建筑物,表现出更优异的建筑物提取性能。 展开更多
关键词 多尺度信息 建筑物提取 语义分割 注意力机制 空洞卷积
在线阅读 下载PDF
ARST-YOLOv7:用于航空遥感图像的小目标检测网络 被引量:1
16
作者 周沁坤 周华平 +1 位作者 孙克雷 邓彬 《计算机工程与应用》 北大核心 2025年第12期232-242,共11页
航空遥感成像具有广泛的军事和民用应用。航空遥感图像中的微小目标检测是遥感图像领域的一个具有挑战性的问题。通用的目标检测方法对小目标不敏感,对于背景复杂、目标特征信息量少的航空遥感图像检测精度较低。为解决上述问题,首次提... 航空遥感成像具有广泛的军事和民用应用。航空遥感图像中的微小目标检测是遥感图像领域的一个具有挑战性的问题。通用的目标检测方法对小目标不敏感,对于背景复杂、目标特征信息量少的航空遥感图像检测精度较低。为解决上述问题,首次提出了一种用于航空遥感图像的小目标检测网络ARST-YOLOv7。针对遥感图像背景复杂,且目标特征较弱,提出一种新的特征增强模块DSPPCFF(dilated spatial pyramid pooling convolution feature fusion),增强模型的特征表达能力。提出一种新的特征金字塔结构(DC-FPN),来解决级联特征图之间的语义差异问题。此外,为了让网络保留更多的空间信息,提出了DCA(dilated convolution attention)模块,增强网络对重要目标的关注,从而提高检测的鲁棒性。在NWPU VHR-10数据集、RSOD数据集和HRRSD数据集上与当前先进的检测方法比较结果表明,该方法对于航空遥感小目标检测更有效。 展开更多
关键词 航空遥感图像 小目标 YOLOv7 空洞卷积 多尺度卷积
在线阅读 下载PDF
基于注意力机制和空洞卷积的无人机图像目标检测 被引量:1
17
作者 赖勤波 马正华 朱蓉 《计算机应用与软件》 北大核心 2025年第2期227-235,共9页
针对现有无人机图像目标检测算法存在小目标检测精度低、多尺度目标漏检等问题,提出一种基于通道注意力机制和并行结构空洞卷积特征融合的无人机图像目标检测算法。该算法在ResNet50特征提取网络中引入SENet和PSDCFFN,从通道和感受野两... 针对现有无人机图像目标检测算法存在小目标检测精度低、多尺度目标漏检等问题,提出一种基于通道注意力机制和并行结构空洞卷积特征融合的无人机图像目标检测算法。该算法在ResNet50特征提取网络中引入SENet和PSDCFFN,从通道和感受野两个层面提高算法的特征表达能力,并使用ROI Align代替ROI Pooling,基于K-Means重新设计RPN(Region Proposal Networks)锚框尺寸,减小目标回归过程的坐标偏差。实验表明,该算法能够提升无人机图像目标检测精度,在RSOD-Dataset和无人机图像数据集上,mAP分别达到92.52%和98.07%。 展开更多
关键词 无人机图像 FASTER R-CNN 注意力机制 空洞卷积 特征融合 目标检测
在线阅读 下载PDF
基于多尺度胶囊Swin Transformer的SAR图像目标识别方法 被引量:1
18
作者 侯宇超 王洁 +4 位作者 李洪涛 郝岩 段晓旗 黄凯文 田有亮 《通信学报》 北大核心 2025年第3期274-290,共17页
通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transfor... 通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transformer编码结构,融合后对输入图像进行分类。每个结构通过基于膨胀卷积切片划分的胶囊令牌编码器和三维胶囊Swin Transformer模块构建,能捕获更深层次、更广泛的语义特征。在运动和静止目标的获取与识别(MSTAR)数据集及FUSAR-Ship数据集上的实验结果表明,MSCSTN在各种测试条件下均优于其他方法。结果表明,MSCSTN展现了良好的识别性能、泛化能力和应用潜力。 展开更多
关键词 膨胀卷积切片分区 胶囊令牌编码器 三维胶囊Swin Transformer模块 多尺度胶囊Swin Transformer网络 SAR图像目标识别
在线阅读 下载PDF
基于组卷积和膨胀卷积的轻量注意力模块
19
作者 张恩淘 郝晓丽 牛保宁 《计算机工程与设计》 北大核心 2025年第2期493-499,共7页
为解决目前的注意力模块中参数量大、通道压缩导致信息丢失、空间信息学习不充分的缺点,提出一种基于组卷积、通道清洗和膨胀卷积的轻量注意力模块。采取组卷积和通道清洗的方式学习通道权重,能够在不压缩通道的前提下减少大量参数,使... 为解决目前的注意力模块中参数量大、通道压缩导致信息丢失、空间信息学习不充分的缺点,提出一种基于组卷积、通道清洗和膨胀卷积的轻量注意力模块。采取组卷积和通道清洗的方式学习通道权重,能够在不压缩通道的前提下减少大量参数,使不同组之间产生交互,充分学习通道信息。采取连续的膨胀卷积,合理设置膨胀率充分且均衡的学习空间信息。通过CIFAR100和VOC 2007+2012数据集对所提模块在图像分类和目标检测中进行实验,验证其能够在较少的花费下带来较大的提升。 展开更多
关键词 深度学习 卷积神经网络 注意力机制 组卷积 膨胀卷积 图像分类 目标检测
在线阅读 下载PDF
基于多尺度感受野的水下双目视觉测距算法研究
20
作者 涂天佳 秦毅 +1 位作者 梁晨 陈然 《兵器装备工程学报》 北大核心 2025年第8期11-19,共9页
基于双目视觉的立体匹配网络被广泛应用于目标定位,其计算速度和精度直接影响机器人的任务执行。针对现有立体匹配网络参数冗余、计算速度缓慢等问题,提出利用混合空洞卷积替代特征提取部分的普通卷积层,减少网络层数,极大地降低了网络... 基于双目视觉的立体匹配网络被广泛应用于目标定位,其计算速度和精度直接影响机器人的任务执行。针对现有立体匹配网络参数冗余、计算速度缓慢等问题,提出利用混合空洞卷积替代特征提取部分的普通卷积层,减少网络层数,极大地降低了网络参数量,提升了网络的运行速度。为增强网络在弱纹理、边缘区域的特征表达能力,提出一种多尺度感受野模块,以融合不同尺度感受野的特征。将该模块嵌入立体匹配网络,构建了多尺度感受野立体匹配网络,实现了目标位置信息的精确检测。基于所提网络和校正模型,在水池模拟环境下开展了水下机器人的目标定位实验。结果表明,所提方法有效解决了现有立体匹配网络在弱纹理、重叠以及边缘区域的误匹配问题,对特定目标物定位精度可达89%,较其他主流视觉测量方法均有显著提升,在水下目标定位中具有重要应用价值。 展开更多
关键词 双目视觉 深度估计 立体匹配 水下机器人 混合空洞卷积 多尺度
在线阅读 下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部