期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
基于多尺度深度可分离ResNet的废弃家电回收图像分类模型
1
作者 雷帅 仇明鑫 +1 位作者 柳先辉 张颖瑶 《计算机科学》 北大核心 2025年第S1期377-383,共7页
针对海量废弃家电回收图像数据在回收技术中难以有效利用的问题,提出了一种基于ResNet和多尺度卷积的废弃家电回收图像分类模型(Multi-scale and Efficient ResNet,ME-ResNet)。首先,基于残差结构设计了多尺度卷积模块以提升不同尺度特... 针对海量废弃家电回收图像数据在回收技术中难以有效利用的问题,提出了一种基于ResNet和多尺度卷积的废弃家电回收图像分类模型(Multi-scale and Efficient ResNet,ME-ResNet)。首先,基于残差结构设计了多尺度卷积模块以提升不同尺度特征信息提取能力,在此基础上基于ResNet设计了针对废弃家电回收图像分类问题的ME-ResNet模型;其次,通过用深度可分离卷积替换多尺度卷积中的部分卷积层,实现ME-ResNet模型轻量化;最后,通过与其他卷积神经网络的对比实验,对ME-ResNet及其轻量化模型的性能进行了验证。研究结果表明:相较于经典的卷积神经网络ResNet34,ME-ResNet及其轻量化模型均能有效提升识别准确度,针对构建的数据集,其最优准确率分别提升了1.2%和0.3%,宏精确率分别提升了1.7%和0.9%,宏召回率分别提升了1.3%和0.2%,宏F1分数分别提升了1.5%和0.5%。 展开更多
关键词 多尺度卷积 ME-ResNet模型 深度可分离卷积 图像分类 残差连接
在线阅读 下载PDF
基于多尺度深度可分离卷积的低照度图像增强算法 被引量:13
2
作者 陈清江 顾媛 《计算机工程与科学》 CSCD 北大核心 2023年第10期1830-1837,共8页
为解决低照度图像颜色失真、对比度低以及现有增强算法存在的细节丢失严重、参数过多等问题,提出基于多尺度深度可分离卷积的低照度图像增强算法。首先,设计多尺度混合空洞卷积模块,在扩大感受野的同时解决网格效应;其次,设计多尺度特... 为解决低照度图像颜色失真、对比度低以及现有增强算法存在的细节丢失严重、参数过多等问题,提出基于多尺度深度可分离卷积的低照度图像增强算法。首先,设计多尺度混合空洞卷积模块,在扩大感受野的同时解决网格效应;其次,设计多尺度特征提取模块,提取不同尺度的特征信息;最后,对不同尺寸的特征图使用2种模块,将低层空间信息与高层语义信息充分融合,获得最终输出。用深度可分离卷积代替标准卷积可大大减少网络参数量与计算量。实验结果表明,所提算法能有效地提高图像的亮度和对比度,减少模型参数量,且图像纹理细节及色彩恢复较好。 展开更多
关键词 低照度图像增强 深度可分离卷积 空洞卷积 多尺度 网格效应
在线阅读 下载PDF
基于多尺度注意力和深度可分离卷积的农田杂草检测 被引量:3
3
作者 王建翠 惠巧娟 吴立国 《中国农机化学报》 北大核心 2023年第5期182-187,共6页
农田杂草根除是促进农业稳定生产的前提。由于杂草种类多,且相同物种因大小、颜色和位置的变化多样,导致传统农田杂草检测算法性能不高。提出一种基于多尺度注意力和深度可分离卷积的农田杂草检测算法。首先,利用深度可分离卷积改进主... 农田杂草根除是促进农业稳定生产的前提。由于杂草种类多,且相同物种因大小、颜色和位置的变化多样,导致传统农田杂草检测算法性能不高。提出一种基于多尺度注意力和深度可分离卷积的农田杂草检测算法。首先,利用深度可分离卷积改进主干网络VGG-16,降低模型参数量,加快模型的训练;然后,采用多尺度注意力模块提取杂草的多尺度特征,增强模型对形态图像特征的捕获能力。通过在不同时间段测试多个农田杂草样本,结果表明:本文算法的精准率为94.69%、召回率为94.88%和F1值为93.82%。与当前主流杂草检测模型相比,在保持较高检测性能的基础上,具有更低的时间开销,可应用于农田杂草的自动检测。 展开更多
关键词 农田杂草检测 深度可分离卷积 多尺度注意力 形态图像特征
在线阅读 下载PDF
基于二次分解时频图和SE-DSMC-BSA的轻量化有载分接开关机械故障识别方法
4
作者 李思奇 夏卯 +4 位作者 鲁思兆 毕贵红 黄一超 阮彦俊 李良创 《振动与冲击》 北大核心 2025年第11期268-279,308,共13页
有载分接开关(on-load tap-changer,OLTC)是有载调压变压器中唯一可动的部件,其频繁切换易导致机械故障。为了实现OLTC机械状态的在线监测,文中提出一种结合二次分解时频图、深度可分离多尺度卷积(depthwise separable multiscale convo... 有载分接开关(on-load tap-changer,OLTC)是有载调压变压器中唯一可动的部件,其频繁切换易导致机械故障。为了实现OLTC机械状态的在线监测,文中提出一种结合二次分解时频图、深度可分离多尺度卷积(depthwise separable multiscale convolution,DSMC)、挤压-激励(squeeze-excitation,SE)注意力机制和广播自注意力(broadcast self-attention,BSA)机制的轻量化OLTC故障识别方法。首先,建立OLTC故障模拟试验平台获取振动信号。在此基础上,引入二次分解和Hilbert变换,将两次分解的分量全部转换为时频图。然后,利用SE-DSMC对时频图进行多尺度的特征提取,并进行通道特征增强。最后,引入BSA对全局特征进行提取,以提升故障识别的准确率。与现有方法相比,该方法特别是在小样本情况下具有识别速度快、准确率高和轻量化等优势。 展开更多
关键词 有载分接开关(OLTC) 故障识别 二次分解 挤压-激励(SE) 深度可分离多尺度卷积(dsmc) 广播自注意力(BSA) 轻量化
在线阅读 下载PDF
嵌入注意力机制的多尺度深度可分离表情识别 被引量:3
5
作者 宋玉琴 高师杰 +1 位作者 曾贺东 熊高强 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第12期2381-2387,共7页
针对面部表情识别中,传统机器学习方法特征提取较为复杂,浅层卷积神经网络识别率不高,以及深度卷积神经网络易带来梯度爆炸或弥散的问题,构建了残差网络嵌入注意力机制的多尺度深度可分离表情识别网络。通过多层多尺度深度可分离残差单... 针对面部表情识别中,传统机器学习方法特征提取较为复杂,浅层卷积神经网络识别率不高,以及深度卷积神经网络易带来梯度爆炸或弥散的问题,构建了残差网络嵌入注意力机制的多尺度深度可分离表情识别网络。通过多层多尺度深度可分离残差单元的叠加进行不同尺度的表情特征提取,使用CBAM注意力机制进行表情特征的筛选,提升有效表情特征权重的表达,削弱训练数据的噪声影响。所提网络模型在Fer-2103和CK+表情数据集分别取得了73.89%和97.47%的准确度,表明所提网络具有较强的泛化性。 展开更多
关键词 表情识别 注意力机制 多尺度特征提取 深度可分离卷积 残差网络
在线阅读 下载PDF
基于AOD-Net改进的多尺度图像去雾算法
6
作者 王超 王婷 +1 位作者 王少军 杨万扣 《计算机工程》 北大核心 2025年第7期305-313,共9页
经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式... 经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式,减少了冗余参数量,加快了计算速度并有效地减少了模型的内存占用量,从而提高了算法去雾效率;同时采用多尺度结构在不同尺度上对雾图进行分析和处理,更好地捕捉图像的细节信息,提升了网络对图像细节的处理能力,解决了原算法去雾时存在的细节模糊问题;最后在网络结构中加入金字塔池化模块,用于整合图像不同区域的上下文信息,扩展了网络的感知范围,从而提高网络模型获取有雾图像全局信息的能力,进而改善图像色调失真、细节丢失等问题。此外,引入一个低照度增强模块,通过明确预测噪声实现去噪的目标,从而恢复曝光不足的图像。在低光去雾图像中,峰值信噪比(PSNR)和结构相似性(SSIM)指标均有显著提升,处理后的图片具有更高的整体自然度。实验结果表明:与经典AOD-Net去雾的结果相比,改进算法能够更好地恢复图像的细节和结构,使得去雾后的图像更自然,饱和度和对比度也更加平衡;在RESIDE的SOTS数据集中的室外和室内场景,相较于经典AOD-Net,改进算法的PSNR分别提升了4.5593 dB和4.0656 dB,SSIM分别提升了0.0476和0.0874。 展开更多
关键词 多尺度网络结构 深度可分离卷积 金字塔池化模块 低照度增强模块 图像去雾
在线阅读 下载PDF
融合并行多卷积注意力的扩散模型去雾方法
7
作者 崔欣桐 王瑛 +3 位作者 邓真楠 王浚瞩 梁铮 邓红霞 《计算机工程与设计》 北大核心 2025年第7期2081-2088,共8页
针对目前去雾方法细节模糊、对真实环境去雾不彻底等问题,提出一种融合并行多卷积注意力的条件扩散模型。将有雾图像作为条件先验引入扩散模型,提升扩散模型对尘雾的理解能力;设计构建并行多卷积注意力残差块,通过不同尺度卷积和不同注... 针对目前去雾方法细节模糊、对真实环境去雾不彻底等问题,提出一种融合并行多卷积注意力的条件扩散模型。将有雾图像作为条件先验引入扩散模型,提升扩散模型对尘雾的理解能力;设计构建并行多卷积注意力残差块,通过不同尺度卷积和不同注意力机制加强模型对尘雾区域的关注,提升模型对有雾图像的特征提取能力;使用SKFusion进行带权特征融合,更大限度保留重要的浅层特征;使用双3次下采样和拉普拉斯金字塔处理图像,降低模型参数和计算复杂度。通过将该方法与其它方法在不同数据集进行多种对比实验和消融实验,验证了该方法在图像去雾上的有效性。 展开更多
关键词 图像去雾 深度学习 扩散模型 并行多卷积注意力 深度可分离卷积 残差连接 多尺度特征融合
在线阅读 下载PDF
融合多尺度注意力神经网络的港口起重装备故障时序数据预测方法 被引量:1
8
作者 雷鹏 谢敬玲 +4 位作者 许洪祖 焦锋 魏立明 张忠岩 吕成兴 《机电工程》 北大核心 2025年第2期277-286,共10页
近年来,深度神经网络在轴承时序预测领域得到了广泛应用。为了进一步提升港口起重装备滚动轴承时序模型预测的准确度,以青岛港门机为例对港口起重装备关键部位的滚动轴承时序预测进行了建模,提出了一种融合改进变分模态分解的多尺度注... 近年来,深度神经网络在轴承时序预测领域得到了广泛应用。为了进一步提升港口起重装备滚动轴承时序模型预测的准确度,以青岛港门机为例对港口起重装备关键部位的滚动轴承时序预测进行了建模,提出了一种融合改进变分模态分解的多尺度注意力机制港口装备故障时序数据预测方法。首先,采用了融合非线性策略与混沌映射的改进灰狼优化算法(IGWO),自适应地确定了变分模态分解(VMD)的模态数与惩罚因子;然后,将变分模态分解得到的本征模态函数进一步作为融合多尺度注意力神经网络(FMANN)模型的时序输入,进行了多尺度通道特征融合;最后,对各个本征模态函数的预测结果进行了融合,得到了最终预测结果。研究结果表明:FMANN模型在回转机构数据集上的均方根误差(RMSE)为0.001 12,平均绝对百分比误差(MAPE)为6.396 3%,决定系数为0.999 8;相比于其他预测模型,FMANN预测效果更加拟合实际数据。FMANN模型能够准确地预测设备轴承的时序振动,有望为未来实际工业生产提供一条新思路。 展开更多
关键词 滚动轴承 故障诊断 变分模态分解 注意力机制 灰狼优化算法 融合多尺度注意力神经网络 深度可分离卷积
在线阅读 下载PDF
基于上下文信息增强和深度引导的单目3D目标检测
9
作者 于家艺 吴秦 《浙江大学学报(工学版)》 北大核心 2025年第1期89-99,共11页
为了充分利用单目图像提供的特征信息,提出上下文信息增强和深度引导的单目3D目标检测方法.设计高效的上下文信息增强模块,使用多个大核卷积自适应地增强多尺度目标的上下文信息,利用深度可分离卷积和条形卷积操作有效减少大核卷积的参... 为了充分利用单目图像提供的特征信息,提出上下文信息增强和深度引导的单目3D目标检测方法.设计高效的上下文信息增强模块,使用多个大核卷积自适应地增强多尺度目标的上下文信息,利用深度可分离卷积和条形卷积操作有效减少大核卷积的参数量和计算复杂度.统计分析3D目标框各个属性的预测误差,发现3D目标框的长度和深度属性预测不准确是导致预测框偏差大的主要原因.设计深度误差加权损失函数,在训练过程中进行目标的长度和深度预测监督,提高长度和深度属性的预测精度,进而提升3D预测框的准确性.在KITTI数据集上开展实验,结果表明,所提方法在数据集的多个级别上的平均准确度高于现有的单目3D目标检测方法. 展开更多
关键词 单目3D目标检测 大核卷积 深度可分离卷积 条形卷积 多尺度目标
在线阅读 下载PDF
基于多尺度特征融合和注意力机制的辣椒病害识别模型 被引量:4
10
作者 尚俊平 张冬阳 +2 位作者 席磊 刘合兵 苏楠 《河南农业大学学报》 CAS CSCD 北大核心 2024年第6期1021-1033,共13页
【目的】设计MobileNet with large convolution Unit(Mobile-LU)模型,解决由于辣椒病害种类复杂和类间差异不明显而造成的病害识别困难、准确率低等问题。【方法】重新构建MobileNetV3的特征提取层,在并行分支单元结构中采用不同尺度... 【目的】设计MobileNet with large convolution Unit(Mobile-LU)模型,解决由于辣椒病害种类复杂和类间差异不明显而造成的病害识别困难、准确率低等问题。【方法】重新构建MobileNetV3的特征提取层,在并行分支单元结构中采用不同尺度的分离卷积,增强模型对辣椒病害尺寸差异特征的表达能力;引入Squeeze-and-Excitation(SE)注意力机制,加强模型对病害相关的特征的学习,提高病害识别准确率;同时使用Leaky ReLU激活函数,在负值区域引入小的斜率,避免网络神经元死亡问题;调整输出层节点个数,更好适应辣椒病害分类任务。【结果】Mobile-LU模型的识别准确率达到98.2%,相较于MobilenetV3-small、ResNet34、VGG16、Alexnet、Swin Transformer、MobileVIT等模型分别高出8.9、7.3、4.4、20.4、6.0、8.3个百分点,且Mobile-LU模型在精确率、召回率、特异度以及F1分数等关键性能指标上也均有优势。【结论】Mobile-LU模型对辣椒病害的识别性能更优,能更好满足辣椒病害识别任务。 展开更多
关键词 辣椒病害 图像分类 SE注意力机制 深度可分离卷积 多尺度特征融合
在线阅读 下载PDF
基于多尺度特征融合的轻量化人脸图像修复算法 被引量:2
11
作者 赵晓 赵子怡 杨晨 《电信科学》 北大核心 2024年第8期42-51,共10页
针对当前遮挡的人脸图像修复中修复图像质量差和模型参数量大的问题,提出了一种基于多尺度特征融合的改进U-Net的轻量化人脸图像修复模型——LM-UNET。首先,使用深度可分离卷积替换原有卷积,增强模型对不同通道和上下文信息的特征表达能... 针对当前遮挡的人脸图像修复中修复图像质量差和模型参数量大的问题,提出了一种基于多尺度特征融合的改进U-Net的轻量化人脸图像修复模型——LM-UNET。首先,使用深度可分离卷积替换原有卷积,增强模型对不同通道和上下文信息的特征表达能力,实现模型轻量化;其次,在跳跃连接中设计了多尺度特征注意力融合模块,充分融合不同尺度特征的信息,内嵌残差块减少特征间语义差距,提高模型修复准确率;最后,引入了位置注意力模块,增强人脸图像的显著信息,提升模型对人脸位置像素信息的有效提取能力。在基于CK+数据集生成的遮挡人脸数据集MFD上对该算法进行训练、验证和测试,修复后的图像的峰值信噪比(PSNR)达到30.49dB,结构相似性(SSIM)达到96.85%,与其他模型的对比实验结果表明,该模型对存在遮挡的人脸修复图像质量和视觉效果更好。 展开更多
关键词 图像修复 人脸图像 深度可分离卷积 多尺度特征注意力融合 位置注意力
在线阅读 下载PDF
Rmcvit:一种融合卷积与自注意力的轻量级图像识别算法
12
作者 孙红 吴一凡 +2 位作者 徐广辉 田鑫驰 朱江明 《小型微型计算机系统》 CSCD 北大核心 2024年第8期1929-1934,共6页
为了解决目前基于Transformer的模型需要较大的参数量而无法有效应用在资源受限的移动端设备中,提出一种融合卷积与Transformer两者优势的轻量级混合模型.模型中Rmcvit Block将输入张量分成多个通道组,利用深度可分离卷积和跨通道维度... 为了解决目前基于Transformer的模型需要较大的参数量而无法有效应用在资源受限的移动端设备中,提出一种融合卷积与Transformer两者优势的轻量级混合模型.模型中Rmcvit Block将输入张量分成多个通道组,利用深度可分离卷积和跨通道维度的互协方差注意力来增加感受野并融合多尺度特征,并融合unflod模块在保证其空间顺序的前提下,降低每个向量序列(token)送入自注意力模块后的计算消耗.基于整理后的Imagenet数据集的对比实验,RmcVit-M以5.81M的参数量大小达到了85.2%的准确率,其模型相关变体性能超过了参数量相似的Transformer模型和卷积神经网络.结果表明,Rmcvit能够有效结合卷积神经网络与Transformer的优势,达到了以较少的模型参数获得更高准确率的目的. 展开更多
关键词 卷积神经网络 互协方差注意力 轻量级混合模型 深度可分离卷积 多尺度
在线阅读 下载PDF
基于GADF-MDSC的特大型轴承深度迁移故障诊断方法 被引量:2
13
作者 姜烨飞 王华 +2 位作者 潘裕斌 王天祥 傅航 《振动与冲击》 EI CSCD 北大核心 2024年第19期10-18,共9页
针对工程应用中特大型轴承运行工况复杂以及故障数据匮乏,导致其故障特征提取不全面的问题,提出了一种基于格拉姆角差场-多尺度深度可分离卷积(Gramian angular difference field-multi-scale depthwise separable convolutions,GADF-MD... 针对工程应用中特大型轴承运行工况复杂以及故障数据匮乏,导致其故障特征提取不全面的问题,提出了一种基于格拉姆角差场-多尺度深度可分离卷积(Gramian angular difference field-multi-scale depthwise separable convolutions,GADF-MDSC)的特大型轴承深度迁移智能诊断方法。首先,构建GADF-MDSC故障诊断网络,该网络分为三大模块:图像转换、特征提取、输出部分。图像转换模块采用GADF编码方式将振动信号转换为二维图像;特征提取模块通过MDSC提取综合故障特征信息,并利用双向门控循环单元筛选融合特征;输出部分由Softmax函数预测轴承故障类型的概率分布。然后,利用源域数据预训练模型,将预训练模型权重参数作为目标域训练模型初始化参数,冻结除底层外的所有参数,使用目标域数据微调模型,实现深度迁移故障诊断任务。最后,通过两种特大型轴承试验对深度迁移模型进行验证。试验结果表明,所提方法在目标域样本仅有5.00%的条件下,仍能保证较高的跨工况精度,达到86.04%,且迁移效果优于其他方法。 展开更多
关键词 特大型轴承 故障诊断 迁移学习 格拉姆角差场(GADF) 多尺度深度可分离卷积(MDSC)
在线阅读 下载PDF
尺度可变有约束图像拼接检测与定位及其对抗优化
14
作者 刘亚奇 蔡强 +4 位作者 石磊 张一凡 吕斌斌 夏超 许盛伟 《智能系统学报》 CSCD 北大核心 2024年第6期1479-1491,共13页
针对有约束图像拼接检测与定位这一图像取证任务,提出一种尺度可变的检测与定位方法及其对抗优化架构。在所提有约束图像拼接检测与定位网络中,设计基于高效通道注意力增强的尺度可变关联性计算模型,采用高效通道注意力增强对通道特征... 针对有约束图像拼接检测与定位这一图像取证任务,提出一种尺度可变的检测与定位方法及其对抗优化架构。在所提有约束图像拼接检测与定位网络中,设计基于高效通道注意力增强的尺度可变关联性计算模型,采用高效通道注意力增强对通道特征进行校准,利用强关联因子截断操作实现处理任意尺度大小的图像;设计一种空间注意力增强的空洞空间金字塔池化对多尺度信息进行挖掘,以及基于深度可分离卷积和残差结构的定位结果重构网络。此外,提出一种块级对抗学习机制对预训练的尺度可变有约束图像拼接检测与定位网络进行优化。在公开数据集上的大量实验证明所提方法的有效性。 展开更多
关键词 有约束图像拼接检测与定位 尺度可变 关联性计算 对抗学习 图像取证 空洞卷积 金字塔池化 深度可分离卷积
在线阅读 下载PDF
基于改进YOLOv8n的矿用提升钢丝绳表面损伤图像识别
15
作者 毛清华 杨帆 +4 位作者 王超 仝旭耀 童军伟 张旭辉 薛旭升 《工矿自动化》 北大核心 2025年第4期100-106,152,共8页
针对矿用提升钢丝绳表面油污覆盖引发背景干扰、绳股间隙较大导致特征混淆及小目标损伤识别难度大等问题,提出了一种基于改进YOLOv8n的矿用提升钢丝绳表面损伤图像识别方法。在YOLOv8n主干网络中引入多尺度注意力模块(MSAM),通过增强损... 针对矿用提升钢丝绳表面油污覆盖引发背景干扰、绳股间隙较大导致特征混淆及小目标损伤识别难度大等问题,提出了一种基于改进YOLOv8n的矿用提升钢丝绳表面损伤图像识别方法。在YOLOv8n主干网络中引入多尺度注意力模块(MSAM),通过增强损伤特征与油污背景的空间特征区分能力,提升模型抗干扰能力;将YOLOv8n原有的3个检测头替换为4个轻量化小目标检测头,强化对小目标损伤的识别能力;采用深度可分离卷积(DSConv)替代标准卷积,减少了计算量,提高了识别速度。实验结果表明:改进YOLOv8n模型的平均精度均值(mAP)、识别精度和推理速度分别达92.6%,89.7%和43.5帧/s,相比YOLOv8n模型分别提高了3.1%,4.9%,34.7%;与Faster-RCNN,YOLOv5s,YOLOv8n,YOLOv10m,TWRD-Net,YOLOv5-TPH等主流模型相比,改进YOLOv8n模型对小目标损伤识别精度最高,同时保证了较高的实时性;在煤矿现场油污覆盖、绳股间隙较大的复杂场景中,改进YOLOv8n模型未出现漏检情况,且误检情况较少,平均识别准确率达90%。 展开更多
关键词 矿用提升钢丝绳 损伤图像识别 YOLOv8n 多尺度注意力模块 小目标检测 深度可分离卷积
在线阅读 下载PDF
基于生成对抗网络的航拍路面阴影去除
16
作者 韩建峰 金聪颖 +1 位作者 宋丽丽 赵悦辰 《电光与控制》 北大核心 2025年第2期86-92,共7页
采用无人机航拍采集路面图像,可有效提高路面健康状况检测的效率。然而,无人机航拍图像因航拍角度和日照变化的影响,产生的长阴影会掩盖路面破损信息,影响破损检测的准确性。针对这一问题,提出一种基于生成对抗网络(GAN)的航拍路面阴影... 采用无人机航拍采集路面图像,可有效提高路面健康状况检测的效率。然而,无人机航拍图像因航拍角度和日照变化的影响,产生的长阴影会掩盖路面破损信息,影响破损检测的准确性。针对这一问题,提出一种基于生成对抗网络(GAN)的航拍路面阴影去除算法,在生成对抗网络中引入多尺度特征提取模块,以增强图像信息特征提取能力;同时,在判别网络结构中采用深度可分离卷积,有效降低模型对非阴影区域的敏感性,提高判别网络的鉴别效果;此外,构建不同路面和光照条件下的航拍路面阴影数据集,提升模型泛化能力及鲁棒性。实验结果表明,所提算法获得的无阴影结果图像在多个无参考图像质量评估指标上均有所提升,能够提高路面破损检测识别的准确性和完整性。 展开更多
关键词 航拍路面 阴影去除 多尺度特征提取 深度可分离卷积
在线阅读 下载PDF
基于MAFM-YOLOv8的学生课堂表现检测
17
作者 莫建文 姜贵昀 +1 位作者 袁华 梁豪昌 《计算机工程与设计》 北大核心 2025年第6期1825-1831,共7页
针对智慧教室场景中学生课堂表现检测遇到的目标尺度大小不一、容易出现遮挡、目标密集度高、重叠以及小目标等问题,提出一种基于MAFM-YOLOv8的学生课堂表现检测模型。提出一个多尺度自适应特征提取模块,增强模型对不同尺度特征信息的... 针对智慧教室场景中学生课堂表现检测遇到的目标尺度大小不一、容易出现遮挡、目标密集度高、重叠以及小目标等问题,提出一种基于MAFM-YOLOv8的学生课堂表现检测模型。提出一个多尺度自适应特征提取模块,增强模型对不同尺度特征信息的自适应特征提取能力,用深度可分离卷积代替普通卷积,减少模块中卷积的计算量;采用高效多尺度注意力模块,增强模型对小目标的特征提取能力;采用WIOU损失函数来增强模型在类别不均衡数据集上的训练效果,提升检测性能。实验结果表明,改进YOLOv8算法在学生课堂表现检测中mAP50达到了87.2%,相比原模型提升了3.2%,验证该方法可以有效提高检测精度。 展开更多
关键词 智慧教室 学生课堂表现检测 MAFM-YOLOv8 多尺度自适应特征提取模块 深度可分离卷积 高效多尺度注意力 WIOU损失函数
在线阅读 下载PDF
基于增强特征融合的轻量级人体姿态估计网络
18
作者 施昕昕 张昊亮 《电子测量技术》 北大核心 2025年第2期189-198,共10页
为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征... 为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征图的信息提取和归纳总结能力;接着设计了结合特征融合模块设计了特征融合分支,以达到保留模型不同阶段的信息不会随长期卷积运算而丢失的效果;最后对模型输出的关键点分类图进行后处理操作,对分类部分使用分类损失增强模块进行进一步增强,使其能够更好地专注于关键点分类任务,以提高模型输出的准确性。在CrowdPose数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为50.7%和48.4%;在S结构下,AP值分别为59.1%和58.3%。在MS COCO val2017数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为41.9%和40.6%;在S结构下,AP值分别为57.0%和56.8%。实验结果表明,本文算法提出的多层级特征融合模块和高分辨率融合分支以及后处理操作对人体姿态估计网络检测性能提升具有正向作用。 展开更多
关键词 人体姿态估计 轻量级网络 多尺度特征融合 深度可分离卷积
在线阅读 下载PDF
多尺度特征融合车辆检测方法 被引量:14
19
作者 王银 王飞翔 孙前来 《系统仿真学报》 CAS CSCD 北大核心 2022年第6期1219-1229,共11页
针对传统的车辆目标检测算法检测精度低,小尺度目标识别效果差等问题,提出了一种基于YOLOv4(you only look once v4)算法的目标检测方法,以提升对交通场景小目标车辆的检测性能。通过对YOLOv4网络进行再设计,使用MobileNetv2深度可分离... 针对传统的车辆目标检测算法检测精度低,小尺度目标识别效果差等问题,提出了一种基于YOLOv4(you only look once v4)算法的目标检测方法,以提升对交通场景小目标车辆的检测性能。通过对YOLOv4网络进行再设计,使用MobileNetv2深度可分离卷积模块代替传统卷积,将CBAM(convolutional block attention module)注意力模块融合到特征提取网络中,在保证模型检测精度的同时减少模型参数。采用PANet-D特征融合网络融合获取到4个尺度特征图深浅层的语义信息,增强对小目标物体的检测能力。通过使用Focal loss优化分类损失函数,加快网络模型的收敛速度。实验结果表明,改进后的网络识别准确率达到96.55%,网络模型大小较原YOLOv4网络降低了92.49 M,同时检测速度比原网络提升了17%,充分证明了本算法的可行性。 展开更多
关键词 车辆检测 YOLOv4 多尺度融合 深度可分离卷积 注意力机制
在线阅读 下载PDF
改进多尺度残差网络病害叶片图像识别 被引量:1
20
作者 周孟然 姚旭 《计算机工程与应用》 CSCD 北大核心 2023年第11期195-202,共8页
针对农作物病害图像识别模型存在参数量较大内存占用较多、识别准确率不高及训练速度慢等问题,提出了融合注意力模块的多尺度卷积网络叶片病害图像识别模型。该网络模型基于残差网络模块,利用多尺度卷积取代了传统的单尺度卷积,使得网... 针对农作物病害图像识别模型存在参数量较大内存占用较多、识别准确率不高及训练速度慢等问题,提出了融合注意力模块的多尺度卷积网络叶片病害图像识别模型。该网络模型基于残差网络模块,利用多尺度卷积取代了传统的单尺度卷积,使得网络加宽以获取更多的特征信息,避免网络堆叠过深引起的过拟合现象;同时为了加快模型训练速度,采用深度可分离卷积代替传统卷积减少模型参数量;将注意力机制引入到残差网络中,增强了模型的关键特征信息的提取能力,从而提高了模型的识别精度。通过对试验数据集进行对比试验,改进网络模型的识别准确率达到99.48%并且模型参数量仅有19.06 MB,试验结果表明所提出的方法能有效地提高模型的识别性能并降低模型参数量,为实现低成本终端运行奠定基础。 展开更多
关键词 图像识别 多尺度卷积 深度可分离卷积 注意力模块
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部