期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
可变形卷积网络的解释性研究及其在蝴蝶物种识别模型中的应用
1
作者 王璐 刘东 刘卫光 《计算机应用》 北大核心 2025年第1期261-274,共14页
近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNe... 近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持。针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用。首先,引入可变形卷积对VGG16、ResNet50和DenseNet121(Dense Convolutional Network121)分类模型进行改进;其次,采用反卷积和类激活映射(CAM)等可视化手段来对比可变形卷积和标准卷积在特征提取能力上的差异,且通过消融实验结果表明可变形卷积在神经网络的较低层且不连续使用时效果更佳;再次,提出显著性移除(SR)并对CAM的性能和激活特征重要性进行统一评价,同时通过设置不同的移除阈值等多个角度,提高评价的客观性;最后,基于评价结果更高的FullGrad(Full Gradient-weighted)解释模型识别的判断依据。实验结果显示,在Archive_80数据集上,所提出的D_v2-DenseNet121的准确率达到97.03%,相较于DenseNet121分类模型提高了2.82个百分点。可见,可变形卷积的引入赋予了神经网络模型不变性特征提取能力,并提高了分类模型的准确率。 展开更多
关键词 可变形卷积网络 可解释性 蝴蝶物种识别 类激活映射 显著性移除
在线阅读 下载PDF
基于运动阵列微波成像与多尺度可变形卷积网络的引信目标识别方法 被引量:1
2
作者 韩燕文 闫晓鹏 +2 位作者 高晓峰 伊光华 代健 《兵工学报》 北大核心 2025年第3期214-224,共11页
针对传统调频连续波(Frequency Modulated Continuous Wave,FMCW)引信探测维度低、方位分辨能力弱导致目标识别能力不足的问题,提出基于运动阵列微波成像与多尺度可变形卷积网络(Multi-Scale Deformable Convolutional Networks,MSDCN)... 针对传统调频连续波(Frequency Modulated Continuous Wave,FMCW)引信探测维度低、方位分辨能力弱导致目标识别能力不足的问题,提出基于运动阵列微波成像与多尺度可变形卷积网络(Multi-Scale Deformable Convolutional Networks,MSDCN)的引信目标识别方法。在充分分析引信运动过程中回波相位变化规律的基础上建立FMCW运动阵列天线模型,通过运动合成扩充引信天线虚拟阵元数,大幅度提升引信方位向分辨率,实现目标距离-方位的二维高分辨成像。同时,深入分析弹目交会过程中由于目标位置、姿态、距离等状态变化形成的图像多尺度特性,构建MSDCN目标识别模型,提高引信对复杂动态交会场景下目标成像多尺度特性的自适应识别能力。实验结果表明,该方法能够显著提高引信方位分辨能力,在不同目标场景下均取得较好的成像和识别效果,对典型目标多尺度像识别准确率达到94%,-6 dB信噪比时目标识别准确率仍能达到88%。 展开更多
关键词 引信 调频连续波 运动阵列 距离-方位二维像 多尺度可变形卷积网络 目标识别
在线阅读 下载PDF
注意力可变形卷积网络的木质板材瑕疵识别 被引量:6
3
作者 朱咏梅 李玉玲 +1 位作者 奚峥皓 盛鸿宇 《西南大学学报(自然科学版)》 CSCD 北大核心 2024年第2期159-169,共11页
为了解决木材缺陷检测中人工成本高、效率低的问题,该文基于可变性卷积网络和注意力机制,提出一种端到端的神经架构模型.首先,可变形卷积网络(Deformable Convolutional Network, DCN)通过将矩形网格转换为变形网格,使模型专注于具有更... 为了解决木材缺陷检测中人工成本高、效率低的问题,该文基于可变性卷积网络和注意力机制,提出一种端到端的神经架构模型.首先,可变形卷积网络(Deformable Convolutional Network, DCN)通过将矩形网格转换为变形网格,使模型专注于具有更多有用图像信息的区域.使用可变形卷积网络可以忽略图像特征中不相关的系数,解决了传统卷积在特征中学习更多信息能力有限的问题.然后,将DCN输出馈送到门控循环单元(Gated Recurrent Unit, GRU)层以学习缺陷图像的高级特征.最后,通过关注输入图像的最重要特征,应用注意力机制加强瑕疵区域的高亮度,从而提高模型识别的准确性.使用Matlab平台在4个木质板材缺陷数据集上将该文方法与现有其他方法进行比较分析,该文方法的准确率比其他3种对比方法提高了2.4%~13.2%的维度,灵敏度提高了3.3%~16.6%的维度,特异性提高了4%~21%的维度.实验结果表明,该文方法在检测精度和其他各个性能方面均优于现有方法,最佳准确率为99.2%,证明了该文方法的有效性. 展开更多
关键词 可变形卷积网络 注意力机制 瑕疵识别 缺陷 深度学习 木质板材
在线阅读 下载PDF
基于可变形卷积网络和YOLOv8的衬砌裂缝检测模型研究 被引量:4
4
作者 孙己龙 刘勇 +3 位作者 路鑫 王志丰 王亚琼 侯小龙 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第8期181-189,共9页
为解决裂缝性状发育随机度高、标注框分辨率低、分布密集易重叠、目标相对小等因素引起的智能检测精度及效率差等问题,基于改进可变形卷积神经网络对YOLOv8骨干网络进行融合,提出1种能够适应隧道复杂场景的裂缝检测模型D-YOLO。模型首... 为解决裂缝性状发育随机度高、标注框分辨率低、分布密集易重叠、目标相对小等因素引起的智能检测精度及效率差等问题,基于改进可变形卷积神经网络对YOLOv8骨干网络进行融合,提出1种能够适应隧道复杂场景的裂缝检测模型D-YOLO。模型首先对第3版可变形卷积网络(DCNv3)的空间聚合权重softmax归一化步骤进行去除以增强网络卷积效率,再利用新DCNv4对骨干网络C2f卷积模块进行融合以提升对网络图像中不同尺度裂缝性状及空间位置变化的细节感知能力,并采用自建裂缝数据集对SSD,Faster-RCNN,YOLOv5和YOLOv84种检测模型进行对比验证。研究结果表明:D-YOLO的F_(1)分数为80.82%,mAP@0.5为86.90%,相较于SSD、Faster-RCNN、YOLOv5和YOLOv8都有所提升;D-YOLO的单张图像检测速度为20.36 ms,相较于各种对比模型分别加快37.06%、65.33%、45.22%和28.39%;同时,D-YOLO对衬砌裂缝图像特征关注范围有所增加。研究结果可为隧道运营期内衬砌安全检测提供新思路。 展开更多
关键词 隧道工程 结构安全 可变形卷积网络 衬砌裂缝 YOLOv8
在线阅读 下载PDF
基于可变形卷积网络的恒星大气物理参数自动测量 被引量:1
5
作者 邓诗宇 刘承志 +8 位作者 康喆 李振伟 刘德龙 张楠 朱成伟 牛炳力 陈龙 丁一高 姜平 《科学技术与工程》 北大核心 2021年第13期5223-5227,共5页
为解决海量恒星光谱数据自动处理问题,更准确地对恒星光谱物理与化学性质的研究,同时更加直观地反映恒星性质参数,通过利用可变形卷积网络(deformable convolutional network,DCN)方法对恒星大气物理参数进行分析,系统地研究了恒星表面... 为解决海量恒星光谱数据自动处理问题,更准确地对恒星光谱物理与化学性质的研究,同时更加直观地反映恒星性质参数,通过利用可变形卷积网络(deformable convolutional network,DCN)方法对恒星大气物理参数进行分析,系统地研究了恒星表面有效温度(T_(eff))、表面重力(logg)、金属丰度([Fe/H])3个物理参数,实验结果对比梯度下降法神经网络(back propagation neural network,BPNN)、人工神经网络(artificial neural network,ANN)、径向基神经网络(radial basis function neural network,RBFNN),评价标准为平均绝对误差(mean absolute error,MAE)、均值误差(mean error,ME)。基于SDSS-DR9、LAMOST-DR3恒星光谱数据得到T_(eff)、logg、[Fe/H]的DCN-MAE分别为97.2136 K、0.2812 dex、0.1252 dex,DCN-ME分别为106.5963 K、0.3856 dex、0.1753 dex。实验结果显示DCN效果优于BPCNN、ANN、RBFNN,为进一步分析与反映恒星真实情况提供参考。 展开更多
关键词 恒星光谱 大气参数 可变形卷积网络 平均绝对误差 均值误差
在线阅读 下载PDF
基于融合卷积神经网络的车辆多目标检测方法 被引量:1
6
作者 曹佳 郑秋梅 段泓舟 《激光杂志》 北大核心 2025年第1期208-213,共6页
在实际场景中,车辆目标往往会被其他车辆、建筑物等对象遮挡,背景也可能非常复杂,为了保障检测精度,提出一种基于融合卷积神经网络的车辆多目标检测方法。采用激光雷达采集车辆目标图像,将采集的车辆行驶图像根据其车道线特征划分为两... 在实际场景中,车辆目标往往会被其他车辆、建筑物等对象遮挡,背景也可能非常复杂,为了保障检测精度,提出一种基于融合卷积神经网络的车辆多目标检测方法。采用激光雷达采集车辆目标图像,将采集的车辆行驶图像根据其车道线特征划分为两侧区域,将车道线以内的区域作为车辆多目标检测初始感兴趣区域(ROI),在ROI中采用车底阴影假设区域分割法获取车辆检测目标的假设区域。在原始卷积神经网络的基础上作进一步优化,设计可变形卷积神经网络(DF-R-CNN)模型,将得到的假设区域作为网络模型所需的车辆多目标检测候选区域,通过该模型实现车辆多目标的精准检测。实验结果表明,所提方法的召回率最高值达到了85%,损失函数最低值约为1.8,说明其具有较高的检测精度和检测效果。 展开更多
关键词 卷积神经网络 车道线划分 感兴趣区域ROI 可变形卷积神经网络 车辆多目标检测
在线阅读 下载PDF
融合CBAM注意力机制与可变形卷积的车道线检测 被引量:3
7
作者 胡丹丹 张忠婷 牛国臣 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第7期2150-2160,共11页
为满足自动驾驶及汽车高级驾驶辅助系统(ADAS)对车道线检测准确性和实时性的要求,提出一种融合卷积块注意力机制(CBAM)与可变形卷积网络(DCN)的车道线检测方法CADCN。在特征提取模块中嵌入CBAM注意力机制,增强有用特征并抑制无用特征响... 为满足自动驾驶及汽车高级驾驶辅助系统(ADAS)对车道线检测准确性和实时性的要求,提出一种融合卷积块注意力机制(CBAM)与可变形卷积网络(DCN)的车道线检测方法CADCN。在特征提取模块中嵌入CBAM注意力机制,增强有用特征并抑制无用特征响应;引入可变形卷积替换常规卷积,用带偏移的采样学习车道线的几何形变,提高卷积核的建模能力;基于行锚分类思想,对行方向上的位置进行选择和分类分析,预测车道线的位置信息,提高车道线检测模型的实时性。在车道线公开数据集上对所提CADCN方法进行训练及验证,在满足实时性的情况下,CADCN方法在TuSimple数据集上准确率达到96.63%,在CULane数据集上综合评估指标F1平均值达到74.4%,验证了所提方法的有效性。 展开更多
关键词 车道线检测 特征提取 注意力机制 可变形卷积网络 行锚分类
在线阅读 下载PDF
基于改进可变形卷积的FDC-YOLO v8水下生物目标检测方法研究 被引量:5
8
作者 袁红春 李春桥 《农业机械学报》 EI CAS CSCD 北大核心 2024年第11期140-146,共7页
水下生物目标检测是实现水下机器人自动化捕捞的关键性技术。针对水下生物目标检测任务中存在的目标重叠、遮挡以及目标尺度小而导致的误检、漏检等问题,提出了一种基于改进YOLO v8n的水下生物目标检测算法FDC-YOLO v8。首先,在主干网... 水下生物目标检测是实现水下机器人自动化捕捞的关键性技术。针对水下生物目标检测任务中存在的目标重叠、遮挡以及目标尺度小而导致的误检、漏检等问题,提出了一种基于改进YOLO v8n的水下生物目标检测算法FDC-YOLO v8。首先,在主干网络中使用融合可变形卷积网络的FDC模块,以增强模型特征提取能力,提升其提取特征的丰富度。其次,引入融合分数阶傅里叶变换和空间注意力机制的FrSAConv模块,进一步分离多样目标特征,增强模型对多种特征的感知能力。最后,引入Wise-IoU损失函数作为模型边界框损失函数,以更好地解决目标不平衡以及尺度差异的问题。使用RUIE数据集进行实验,水下生物包括海胆、海星、海参、扇贝。实验结果表明,改进后的FDC-YOLO v8的平均精度均值达到85.3%,较基准模型提升2.6个百分点,推理速度达到769 f/s,在目标重叠、遮挡以及小尺度目标的水下生物目标检测中有更好的表现。 展开更多
关键词 水下生物识别 目标检测 YOLO v8n Wise-IoU 可变形卷积网络 分数阶傅里叶变换
在线阅读 下载PDF
基于可变形卷积神经网络的数字仪表识别方法 被引量:13
9
作者 郭兰英 韩睿之 程鑫 《计算机科学》 CSCD 北大核心 2020年第10期187-193,共7页
目前,对于数显仪表的识别,多采用传统的图像处理及机器学习等方法,在复杂多变的应用场景中,其对字符、数字的识别准确率低,难以满足实时应用的要求。针对以上问题,将传统图像处理技术与深度学习方法相结合,提出了一种基于可变形卷积神... 目前,对于数显仪表的识别,多采用传统的图像处理及机器学习等方法,在复杂多变的应用场景中,其对字符、数字的识别准确率低,难以满足实时应用的要求。针对以上问题,将传统图像处理技术与深度学习方法相结合,提出了一种基于可变形卷积神经网络的数显仪表示数分割与识别方法。该方法包含图像预处理、字符分割与识别等步骤。首先,使用GrayWorld算法对待识别图像进行亮度均衡,并通过彩色分割提取屏幕区域;其次,对图像进行形态学操作,以便使用投影直方图法完成字符与对应小数点的整体分割;最后,设计并训练了一种可变形卷积神经网络对字符进行识别,优化了卷积神经网络感受野几何结构固定的内在问题。实验结果表明,加入可变形卷积有效提高了图像的识别准确率和网络的收敛速度;该方法的整体识别准确率达到99.45%,检测速度为10FPS,能够满足实际应用需求。 展开更多
关键词 图像处理 字符识别 可变形卷积神经网络 投影直方图
在线阅读 下载PDF
基于可变形全卷积神经网络的冬小麦自动解译研究 被引量:5
10
作者 李旭青 张秦雪 +3 位作者 安志远 金永涛 张秦浩 丁晖 《农业机械学报》 EI CAS CSCD 北大核心 2020年第9期144-151,共8页
以高分二号遥感影像为研究对象进行冬小麦多元特征的提取,在U-Net模型基础上进行改进,将一种可变形全卷积神经网络(DFCNN)模型引入到遥感影像自动解译领域。为提高网络模型对几何变化特征的提取能力,引入可变形卷积的思想,将可训练的二... 以高分二号遥感影像为研究对象进行冬小麦多元特征的提取,在U-Net模型基础上进行改进,将一种可变形全卷积神经网络(DFCNN)模型引入到遥感影像自动解译领域。为提高网络模型对几何变化特征的提取能力,引入可变形卷积的思想,将可训练的二维偏移量加入到网络中的每个卷积层前,使卷积产生形变,并获得对象级语义信息,从而增强了模型对不同尺寸及空间分布的冬小麦特征的表达。使用DFCNN模型对数据集进行训练及微调,得到最优的网络模型,其像素精度为98.1%,解译时间为0.630 s。采用FCNN模型、U-Net模型及RF算法得到的冬小麦自动解译像素精度分别为89.3%、93.9%、90.0%,说明基于DFCNN模型的冬小麦自动解译精度相对较高,且对复杂的几何变化特征有较好的表达,具有较好的泛化能力。 展开更多
关键词 冬小麦 自动解译 可变形卷积神经网络 GF-2
在线阅读 下载PDF
基于改进YOLOv10n网络模型的芯片封装基板外观缺陷检测
11
作者 马一凡 朱晓春 +3 位作者 王鸣昕 胡彬 彭国峰 朱昌飞 《半导体技术》 北大核心 2025年第8期833-842,859,共11页
为提高芯片封装基板外观缺陷检测的精度并减小其计算量,提出一种基于改进YOLOv10n网络模型的芯片封装基板外观缺陷检测方法。该方法利用星形块(Star_Block)与上下文锚点注意力(CAA)机制将C2f模块重构为C2f_Star_CAA模块,通过增加输入映... 为提高芯片封装基板外观缺陷检测的精度并减小其计算量,提出一种基于改进YOLOv10n网络模型的芯片封装基板外观缺陷检测方法。该方法利用星形块(Star_Block)与上下文锚点注意力(CAA)机制将C2f模块重构为C2f_Star_CAA模块,通过增加输入映射的特征维度并整合远距离上下文信息,有效提升了模型的特征提取能力;引入可变形卷积网络(DCNv3),针对不同尺度缺陷自适应调整卷积核大小,显著增强了模型的多尺度缺陷检测能力;用动态检测头(Dyhead)取代普通检测头,通过动态选择不同作用的注意力机制,强化了对缺陷的位置、尺度及类别的感知,提升了模型的泛化能力。基于自定义构建的芯片封装基板数据集进行实验,结果表明,改进模型的计算量较原始模型减小了7.14%,其精确率(P)、召回率(R)、平均精度均值(mAP@0.5)分别达到了84.9%、86.3%、90.4%,较原始模型分别提高了3.4%、4.9%和3.3%,该方法在减小模型计算量的同时提高了检测精度,验证了其在实时监测场景中的可行性。 展开更多
关键词 封装基板 缺陷检测 YOLOv10n C2f_Star_CAA 可变形卷积网络(DCNv3) 动态检测头(Dyhead)
在线阅读 下载PDF
基于可变形卷积神经网络的肺结节假阳性识别 被引量:3
12
作者 王梦南 赵涓涓 +1 位作者 肖宁 郝瑞 《计算机工程与设计》 北大核心 2022年第6期1732-1739,共8页
针对肺结节检测中假阳性高的问题,提出一种基于可变形卷积神经网络的肺结节假阳性降低框架。使用多尺度候选结节作为输入,使用可变形卷积神经网络提取候选结节的多层次上下文特征,渐进融合不同输入顺序的候选结节特征信息。通过端到端... 针对肺结节检测中假阳性高的问题,提出一种基于可变形卷积神经网络的肺结节假阳性降低框架。使用多尺度候选结节作为输入,使用可变形卷积神经网络提取候选结节的多层次上下文特征,渐进融合不同输入顺序的候选结节特征信息。通过端到端的学习方式集成多流渐进特征信息得到最终的分类结果。在LUNA16数据集和合作医院临床数据集上,所提框架CPM评分优于已有方法,检测出的结节数量最多,假阳性结节数量最少,有很好的泛化能力,能有效降低结节假阳性,适用于真实的临床数据。 展开更多
关键词 渐进特征提取 可变形卷积神经网络 多流特征集成 假阳性降低 临床数据
在线阅读 下载PDF
基于卷积神经网络的火灾识别算法 被引量:11
13
作者 李杰 邱选兵 +3 位作者 张恩华 李宁 魏永卜 李传亮 《计算机应用》 CSCD 北大核心 2020年第S02期173-177,共5页
针对传统图像处理和浅层机器学习的火灾识别中准确率不太高、特征难以提取等问题,提出一种基于卷积神经网络的火灾识别算法。首先将图片数据集转化为快速HSI色彩格式,增加图片视觉特性,便于深度学习提取火焰特征;然后采用Inception_Resn... 针对传统图像处理和浅层机器学习的火灾识别中准确率不太高、特征难以提取等问题,提出一种基于卷积神经网络的火灾识别算法。首先将图片数据集转化为快速HSI色彩格式,增加图片视觉特性,便于深度学习提取火焰特征;然后采用Inception_Resnet_V2卷积神经网络结合可变形卷积网络(DCN)对数据集进行训练提取特征,提高卷积神经网络对目标几何变化的适应和建模能力;最后使用支持向量机(SVM)分批次训练提取到的特征来进行分类。实验结果表明,与传统图像处理和其他深度学习识别算法相比,所提算法准确率高、泛化能力强、漏报率低,对测试集识别准确率达99.04%,取得很好的火灾识别效果。 展开更多
关键词 可变形卷积网络 HSI色彩模型 支持向量机 卷积神经网络 深度学习
在线阅读 下载PDF
基于注意力机制和可变形卷积的鸡只图像实例分割提取 被引量:14
14
作者 方鹏 郝宏运 +1 位作者 李腾飞 王红英 《农业机械学报》 EI CAS CSCD 北大核心 2021年第4期257-265,共9页
为提高鸡只个体轮廓分割提取的精度和准确度,实现基于机器视觉技术的鸡只行为、健康、福利状态监测等精准畜牧业管理,保证相关监测技术及决策的可靠性,针对叠层笼养环境下肉鸡图像的实例分割和轮廓提取问题,提出一种优化的基于Mask R-CN... 为提高鸡只个体轮廓分割提取的精度和准确度,实现基于机器视觉技术的鸡只行为、健康、福利状态监测等精准畜牧业管理,保证相关监测技术及决策的可靠性,针对叠层笼养环境下肉鸡图像的实例分割和轮廓提取问题,提出一种优化的基于Mask R-CNN框架的实例分割方法,构建了一种鸡只图像分割和轮廓提取网络,对鸡群图像进行分割,从而实现鸡只个体轮廓的提取。该网络以注意力机制、可变形卷积的41层深度残差网络(Res Net)和特征金字塔网络(Feature pyramid networks,FPN)相融合为主干网络,提取图像特征,并经区域生成网络(Region proposal networks,RPN)提取感兴趣区域(ROI),最后通过头部网络完成鸡只目标的分类、分割和边框回归。鸡只图像分割试验表明,与Mask R-CNN网络相比,优化后网络模型精确率和精度均值分别从78.23%、84.48%提高到88.60%、90.37%,模型召回率为77.48%,可以实现鸡只轮廓的像素级分割。本研究可为鸡只福利状态和鸡只健康状况的实时监测提供技术支撑。 展开更多
关键词 肉鸡 实例分割 轮郭提取 可变形卷积神经网络 注意力机制
在线阅读 下载PDF
基于可变形卷积与特征融合的机场道面裂缝检测算法 被引量:7
15
作者 李海丰 景攀 韩红阳 《南京航空航天大学学报》 CAS CSCD 北大核心 2021年第6期981-988,共8页
机场道面裂缝具有形态多变、宽度狭小、长短不一、且空间走势呈自由曲线的不规则特征,现有算法检测效果不佳。针对此问题,本文构建了一种基于可变形卷积与特征融合的神经网络(Deformable convolution and feature fusion neural network... 机场道面裂缝具有形态多变、宽度狭小、长短不一、且空间走势呈自由曲线的不规则特征,现有算法检测效果不佳。针对此问题,本文构建了一种基于可变形卷积与特征融合的神经网络(Deformable convolution and feature fusion neural network,DFNet)模型。首先由可变形卷积模块来强化特征提取网络对裂缝形态特征的学习;然后经多尺度卷积模块捕获不同感受野下裂缝的全局信息;最后通过特征融合模块来提取裂缝不同层次的特征,通过融合裂缝低级特征与高级特征,实现对机场道面裂缝的准确分割。在采集的实际机场道面裂缝数据集上,与其他6种现有算法进行了对比实验,本文算法在像素级分割的F1-Score上达到了90.95%,效果优于全部对比算法。DFNet算法提高了对机场道面裂缝检测的能力,实验结果表明本文算法较好地达到了工程实际要求。 展开更多
关键词 人工智能 机场道面裂缝检测 可变形卷积与特征融合的神经网络 可变形卷积 多尺度卷积 特征融合
在线阅读 下载PDF
基于改进RT-DETR的葡萄叶片病害检测
16
作者 王海瑞 胡灿 +1 位作者 朱贵富 蒋晨 《湖南农业大学学报(自然科学版)》 北大核心 2025年第4期117-124,共8页
针对葡萄叶片相似表现症状的病害识别率较低及细小病害检测困难的问题,提出一种基于改进RT-DETR网络的葡萄叶片病害检测方法。首先,采用坐标注意力(CA)机制对可变形卷积网络v2(DCNv2)模块进行改进,构建DCNv2_CA模块以增强目标特征的提... 针对葡萄叶片相似表现症状的病害识别率较低及细小病害检测困难的问题,提出一种基于改进RT-DETR网络的葡萄叶片病害检测方法。首先,采用坐标注意力(CA)机制对可变形卷积网络v2(DCNv2)模块进行改进,构建DCNv2_CA模块以增强目标特征的提取能力,并在模型的主干特征提取部分加入DCNv2_CA模块来提高模型对病害深层关键特征的提取能力;其次,在模型的特征交互模块中引入高低频特征交互(HiLo)注意力机制,使模型能同时关注特征的高低频信息,提高模型对葡萄细小病害的检测能力;最后,用聚合–分发机制重构模型的跨层融合网络,使其能更充分地融合各个层级之间的信息,进一步提升模型对相似表型症状病害的识别性能。结果表明:改进RT-DETR模型的病害检测准确率、召回率和平均精度均值分别达到了90.8%、89.5%和93.4%,相较于初始模型分别提升了5.4、3.9和5.6个百分点,且相对于其他模型也具有明显的优势。综上可见,改进后的RT-DETR模型能够准确地实现葡萄叶片病害检测。 展开更多
关键词 葡萄叶片 目标检测 病害检测 RT-DETR 注意力机制 可变形卷积网络 高低频特征交互 聚合–分发机制
在线阅读 下载PDF
基于机器视觉技术的农用车辆发动机水泵气密性检测研究 被引量:1
17
作者 刘兴亚 尹斌 +3 位作者 廉洁 王胜 李赫 余永昌 《中国农机化学报》 北大核心 2025年第6期242-249,共8页
为提高农用车辆发动机生产线检测效率,研究采用多光路视觉成像与非线性光照补偿方法对发动机水泵气密性进行准确检测,并开发基于混合对抗3DCNN的气泡视频检测算法提升检测效率和准确性。此外,通过可变形深度卷积网络和迁移学习的目标检... 为提高农用车辆发动机生产线检测效率,研究采用多光路视觉成像与非线性光照补偿方法对发动机水泵气密性进行准确检测,并开发基于混合对抗3DCNN的气泡视频检测算法提升检测效率和准确性。此外,通过可变形深度卷积网络和迁移学习的目标检测方法提升微小气泡检测的精度和速度。研究结果表明:使用更新数据集的3DCNN模型的平均查准率(mAP)、平均查全率(AR)和平均精度(AP)分别提高至92.39%、95.01%和95.25%,这说明定期更新训练数据集对提升模型的识别精度和适应性有积极影响。将TDD—Net融入3DCNN模型检测发动机水泵壳体气密性,平均查准率、平均查全率和平均精度分别提高至96.27%、97.72%和96.37%,表明深度学习模型在集成先进结构中能够有效提升图像识别、分类等任务的准确度和鲁棒性。为农用车辆发动机水泵气密性检测提供一种新的技术思路和方法,为农业生产提供更加可靠、高效的技术保障。 展开更多
关键词 农用车辆发动机 水泵 气密性检测 非线性光照补偿 三维卷积神经网络 可变形卷积网络 迁移学习
在线阅读 下载PDF
基于D-Unet神经网络的鼻腔鼻窦肿瘤分割算法 被引量:3
18
作者 李富豪 赵希梅 《计算机工程》 CAS CSCD 北大核心 2022年第1期281-287,共7页
鼻腔鼻窦肿瘤为多发性疾病,其CT影像具有形态不规则、分界不均匀等特征,而现有的U-Net分割算法对图片细节不敏感且割裂了图像局部与整体特征的一致性,难以实现精准诊断。提出一种基于D-Unet深度神经网络的改进算法,根据鼻腔鼻窦肿瘤空... 鼻腔鼻窦肿瘤为多发性疾病,其CT影像具有形态不规则、分界不均匀等特征,而现有的U-Net分割算法对图片细节不敏感且割裂了图像局部与整体特征的一致性,难以实现精准诊断。提出一种基于D-Unet深度神经网络的改进算法,根据鼻腔鼻窦肿瘤空间形变特点,将可变形卷积融入U-Net网络,并利用可变形卷积能依据目标形态拥有自适应感受野的特点,充分学习图像细节,从而提升算法的特征提取能力。在此基础上,使用损失函数Tversky解决数据集样本失衡问题,从而获得更高的灵敏度和泛化能力。为方便进一步研究,建立鼻腔鼻窦肿瘤分割数据集。实验结果表明,所提算法能有效提高鼻腔鼻窦肿瘤分割精度,相比U-Net、Res-Unet和Attention U-Net算法,分割精度分别提高了5.01%、2.56%和0.48%。 展开更多
关键词 鼻腔鼻窦肿瘤 U-Net算法 目标分割 可变形卷积网络 Tversky损失函数
在线阅读 下载PDF
基于递归对齐网络的黑白老卡通高清重制
19
作者 李华恩 赵洋 +1 位作者 陈缘 张效娟 《图学学报》 CSCD 北大核心 2022年第3期434-442,共9页
黑白老卡通视频在数字化的过程中会出现诸如划痕、脏点、模糊和分辨率过低等复合问题,老卡通视频增强是视频增强的一类特殊子问题,当前尚缺乏针对性算法,因此提出一种多帧联合的递归对齐增强网络解决老卡通中的复合问题。首先通过递归... 黑白老卡通视频在数字化的过程中会出现诸如划痕、脏点、模糊和分辨率过低等复合问题,老卡通视频增强是视频增强的一类特殊子问题,当前尚缺乏针对性算法,因此提出一种多帧联合的递归对齐增强网络解决老卡通中的复合问题。首先通过递归结构传递重建历史中的长时域信息对划痕与脏点进行修复,解决了连续性划痕与脏点的处理难题。然后在递归单元中通过基于可变形卷积的对齐模块进行相邻帧特征对齐,改善了网络在卡通大幅度运动场景中提取和补充帧间细节的能力。在递归单元末端设计了级联金字塔结构的多尺度重建模块促进特征聚合,以充分挖掘重建所需的时间和空间细节信息。实验使用峰值信噪比等客观评估标准,在降质数据集和真实老卡通数据集上进行实验测试,并与其他主流方法进行对比。实验结果表明,该方法相比于其他主流视频增强方法有较为明显提升,同时在真实黑白老卡通上可获取高视觉质量的重建结果。 展开更多
关键词 视频增强 深度学习 可变形卷积网络 递归网络 多任务重建
在线阅读 下载PDF
基于优化Faster R-CNN算法的金属板材表面缺陷检测 被引量:7
20
作者 孔思曼 周晨阳 +2 位作者 王家华 李林 孙践知 《制造技术与机床》 北大核心 2024年第1期171-178,共8页
传统的图像处理方法对生产过程中各种金属板材表面缺陷检测效率低,难以满足工业生产的需求。为了提高金属板材表面缺陷检测的精度,文章提出了一种基于优化Faster R-CNN算法的金属板材表面缺陷检测方法,以残差网络ResNet50作为主干特征... 传统的图像处理方法对生产过程中各种金属板材表面缺陷检测效率低,难以满足工业生产的需求。为了提高金属板材表面缺陷检测的精度,文章提出了一种基于优化Faster R-CNN算法的金属板材表面缺陷检测方法,以残差网络ResNet50作为主干特征提取网络。首先,融合特征金字塔网络和可变形卷积网络以提高对小目标和不规则性缺陷的检测能力。然后,采用RoI Align和K-means++聚类算法对候选框进行优化,实现缺陷的精准定位。最后,将提出的模型运用在NEU-DET数据集中进行多次实验。实验结果表明,优化后的Faster R-CNN算法在此数据集上的mAP为78.7%,与原始网络相比提高了7.7%,并且其检测性能优于SSD、YOLOv5s和YOLOv7三类目标检测算法。 展开更多
关键词 缺陷检测 Faster R-CNN 特征金字塔网络 可变形卷积网络 聚类算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部