期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
融合PVTv2和DenseNet121的双注意力视网膜病变分级算法
1
作者 梁礼明 钟奕 +1 位作者 陈康泉 王成斌 《光电工程》 北大核心 2025年第4期15-29,共15页
针对视网膜眼底病变图像数据集类间分布不均和病灶区域识别困难的问题,提出一种融合金字塔视觉变压器(pyramid vision transformer v2,PVTv2)和DenseNet121双注意力视网膜病变分级算法。首先,该算法经由PVTv2和DenseNet121组成的双分支... 针对视网膜眼底病变图像数据集类间分布不均和病灶区域识别困难的问题,提出一种融合金字塔视觉变压器(pyramid vision transformer v2,PVTv2)和DenseNet121双注意力视网膜病变分级算法。首先,该算法经由PVTv2和DenseNet121组成的双分支网络,对视网膜图像的全局和局部信息进行初步提取;其次,在PVTv2和DenseNet121输出处分别采用空间通道协同注意力模块和多频率多尺度模块,优化局部特征细节,突显微小病灶特征,增强模型对复杂微小病变特征敏感性和病灶的定位感知;再次设计神经元交叉融合模块,建立病灶区域宏观布局和微观纹理信息之间的远程依赖关系,进而提高视网膜病变分级准确率;最后,利用混合损失函数缓解样本分布不均所导致的各等级之间模型关注度不平衡情况。在IDRID和APTOS 2019数据集上进行实验验证,其二次加权系数分别为90.68%和90.35%,IDRID数据集上的准确率和APTOS 2019数据集ROC曲线下方面积分别为80.58%和93.22%。实验结果表明,所提算法在视网膜病变分级领域具有一定应用价值。 展开更多
关键词 视网膜病变分级 空间通道协同注意力模块 多频率多尺度注意力模块 神经元交叉融合模块
在线阅读 下载PDF
注意力引导多任务学习的前列腺癌盆腔淋巴结转移预测
2
作者 张志远 胡冀苏 +3 位作者 张跃跃 钱旭升 周志勇 戴亚康 《上海交通大学学报》 北大核心 2025年第8期1216-1224,共9页
基于前列腺癌原发灶的术前磁共振影像定量特征预测盆腔淋巴结转移(PLNM)是治疗方案制定的重要参考依据.然而,现有预测方法对肿瘤原发灶内部的异质性信息提取不足,导致提取的图像定量特征与PLNM关联性较弱.针对这一问题,提出一种以肿瘤... 基于前列腺癌原发灶的术前磁共振影像定量特征预测盆腔淋巴结转移(PLNM)是治疗方案制定的重要参考依据.然而,现有预测方法对肿瘤原发灶内部的异质性信息提取不足,导致提取的图像定量特征与PLNM关联性较弱.针对这一问题,提出一种以肿瘤分割任务为辅助任务的注意力引导多任务学习网络用于PLNM预测.首先,在肿瘤分割网络中,提出多分支各向异性大核注意力模块,通过不同分支和各向异性大卷积核的融合扩大的感受野以有效捕获肿瘤的局部和全局信息.其次,在PLNM预测网络中,设计多尺度特征交互融合注意力模块,对多尺度特征进行层次化融合筛选.在320例数据集的实验中,所提方法的精度召回曲线下面积值和受试者操作特征曲线下面积值分别为(85.44±2.04)%和(91.86±2.18)%,优于经典的单任务分类方法和多任务方法. 展开更多
关键词 前列腺癌盆腔淋巴结转移 多任务学习 多分支各向异性大核注意力模块 多尺度特征交互融合注意力模块 多参数磁共振
在线阅读 下载PDF
基于改进YOLOv8n的矿用提升钢丝绳表面损伤图像识别
3
作者 毛清华 杨帆 +4 位作者 王超 仝旭耀 童军伟 张旭辉 薛旭升 《工矿自动化》 北大核心 2025年第4期100-106,152,共8页
针对矿用提升钢丝绳表面油污覆盖引发背景干扰、绳股间隙较大导致特征混淆及小目标损伤识别难度大等问题,提出了一种基于改进YOLOv8n的矿用提升钢丝绳表面损伤图像识别方法。在YOLOv8n主干网络中引入多尺度注意力模块(MSAM),通过增强损... 针对矿用提升钢丝绳表面油污覆盖引发背景干扰、绳股间隙较大导致特征混淆及小目标损伤识别难度大等问题,提出了一种基于改进YOLOv8n的矿用提升钢丝绳表面损伤图像识别方法。在YOLOv8n主干网络中引入多尺度注意力模块(MSAM),通过增强损伤特征与油污背景的空间特征区分能力,提升模型抗干扰能力;将YOLOv8n原有的3个检测头替换为4个轻量化小目标检测头,强化对小目标损伤的识别能力;采用深度可分离卷积(DSConv)替代标准卷积,减少了计算量,提高了识别速度。实验结果表明:改进YOLOv8n模型的平均精度均值(mAP)、识别精度和推理速度分别达92.6%,89.7%和43.5帧/s,相比YOLOv8n模型分别提高了3.1%,4.9%,34.7%;与Faster-RCNN,YOLOv5s,YOLOv8n,YOLOv10m,TWRD-Net,YOLOv5-TPH等主流模型相比,改进YOLOv8n模型对小目标损伤识别精度最高,同时保证了较高的实时性;在煤矿现场油污覆盖、绳股间隙较大的复杂场景中,改进YOLOv8n模型未出现漏检情况,且误检情况较少,平均识别准确率达90%。 展开更多
关键词 矿用提升钢丝绳 损伤图像识别 YOLOv8n 多尺度注意力模块 小目标检测 深度可分离卷积
在线阅读 下载PDF
基于多尺度特征拼接的小样本茶叶病害分类 被引量:2
4
作者 张艳 王林茂 +2 位作者 程志友 章杨凡 储著增 《安徽大学学报(自然科学版)》 CAS 北大核心 2022年第5期58-63,共6页
传统的茶叶病害分类是一项耗时耗力的工作.针对该问题,提出一种基于多尺度特征拼接的网络模型,用于小样本茶叶病害分类.通过多尺度注意力模块提取茶叶叶片的显著性特征,进而得到显著性图像.对显著性图像与原始图像进行通道特征拼接,使... 传统的茶叶病害分类是一项耗时耗力的工作.针对该问题,提出一种基于多尺度特征拼接的网络模型,用于小样本茶叶病害分类.通过多尺度注意力模块提取茶叶叶片的显著性特征,进而得到显著性图像.对显著性图像与原始图像进行通道特征拼接,使拼接后的图像既包含全局特征又包含局部特征.融合多个不同卷积层输出的特征,使特征图包含空间和语义信息.分类实验结果表明:用可分离卷积代替常规卷积后,该文模型参量总数小于关系网络模型参量总数的1/2,提高了分类效率;相对于其他5种模型,该文模型分类准确率最高. 展开更多
关键词 茶叶病害分类 多尺度注意力模块 显著性区域 可分离卷积
在线阅读 下载PDF
基于判别式增强的蒸馏学习自监督缺陷检测
5
作者 冯志远 陈莹 《系统仿真学报》 北大核心 2025年第6期1499-1511,共13页
针对异常缺陷数据稀缺、类型未知,以及传统知识蒸馏缺陷检测方法缺乏对异常表示多样性的问题,提出一种基于判别式增强的自监督蒸馏学习方法。提出一种基于注意力的多尺度融合模块,通过放大学生网络和教师网络多尺度的特征差异来提高对... 针对异常缺陷数据稀缺、类型未知,以及传统知识蒸馏缺陷检测方法缺乏对异常表示多样性的问题,提出一种基于判别式增强的自监督蒸馏学习方法。提出一种基于注意力的多尺度融合模块,通过放大学生网络和教师网络多尺度的特征差异来提高对异常表示的能力;设计一种由特征重加权模块和解码器组成的判别网络,通过进一步强调教师网络中的异常特征来生成更加精准的异常分数图,从而提高缺陷检测分割精度。结果表明:该方法超过了现有的知识蒸馏缺陷检测方法,验证了方法的有效性与优越性。 展开更多
关键词 缺陷检测 知识蒸馏 基于注意力多尺度融合模块 特征重加权模块 判别网络
在线阅读 下载PDF
基于MES−YOLOv5s的综采工作面大块煤检测算法 被引量:6
6
作者 徐慈强 贾运红 田原 《工矿自动化》 CSCD 北大核心 2024年第3期42-47,141,共7页
综采工作面的目标具有高速运动、多尺度、遮挡等特点,现有的目标检测算法存在精度低、模型占用的内存大、硬件依赖强等问题。针对上述问题,提出了一种基于MES−YOLOv5s的综采工作面大块煤检测算法。采用轻量化设计,将MobileNetV3作为主... 综采工作面的目标具有高速运动、多尺度、遮挡等特点,现有的目标检测算法存在精度低、模型占用的内存大、硬件依赖强等问题。针对上述问题,提出了一种基于MES−YOLOv5s的综采工作面大块煤检测算法。采用轻量化设计,将MobileNetV3作为主干网络,以减小模型占用的内存,提高CPU端的检测速度;在颈部网络添加高效多尺度注意力(EMA)模块,融合不同尺度的上下文信息,并进一步减少计算开销;采用SIoU损失函数代替CIoU损失函数,以提高训练速度和推理准确性。消融实验结果表明:MobileNetV3大幅减少了模型占用的内存和检测时间,但mAP损失严重;EMA模块和SIoU损失函数可在一定程度上恢复损失的精度,同时保证模型在CPU上具有较高的检测速度,满足煤矿井下目标实时检测需求。对比实验结果表明,与DETR,YOLOv5n,YOLOv5s,YOLOv7模型相比,MES−YOLOv5s模型综合性能最好,mAP为84.6%,模型占用的内存为11.2 MiB,在CPU端的检测时间为31.8 ms,在高速运动、多尺度、遮挡和多目标的工况环境下能够保持较高的召回率和精度。 展开更多
关键词 综采工作面 目标检测 大块煤检测 YOLOv5s MobileNetV3 高效多尺度注意力模块 SIoU损失函数
在线阅读 下载PDF
基于双流自适应时空增强图卷积网络的手语识别 被引量:1
7
作者 金彦亮 吴筱溦 《应用科学学报》 CAS CSCD 北大核心 2024年第2期189-199,共11页
针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使... 针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使用人体身体、手部和面部节点作为输入,构造基于人体关节和骨骼的双流结构。通过自适应时空图卷积模块生成不同部位之间的连接,并充分利用其中的位置和方向信息。同时采用残差连接方式设计自适应多尺度时空注意力模块,进一步增强该网络在空域和时域的卷积能力。将双流网络提取到的有效特征进行加权融合,可以分类输出手语词汇。最后在公开的中文手语孤立词数据集上进行实验,在100类词汇和500类词汇分类任务中准确率达到了95.57%和89.62%。 展开更多
关键词 骨架数据 双流结构 自适应时空图卷积模块 自适应多尺度时空注意力模块 特征融合
在线阅读 下载PDF
基于MSCAU-Net的视网膜眼底图像的硬渗出液分割
8
作者 傅迎华 张葛 左嵩 《控制工程》 CSCD 北大核心 2024年第7期1244-1253,共10页
硬渗出液是早期糖尿病性视网膜病变(diabetic retinopathy,DR)的主要病症之一,在眼底图像中占据的像素点较少,其检测容易受视盘、软渗出液的干扰。针对这些问题,在U型网络(U-Net)结构的基础上,通过在编码器和解码器中融入残差模块和残... 硬渗出液是早期糖尿病性视网膜病变(diabetic retinopathy,DR)的主要病症之一,在眼底图像中占据的像素点较少,其检测容易受视盘、软渗出液的干扰。针对这些问题,在U型网络(U-Net)结构的基础上,通过在编码器和解码器中融入残差模块和残差通道注意力模块学习硬渗出液的细微特征,在跳跃连接中加入一种新的多尺度通道注意力(multi-scale channel attention,MSCA)模块提升网络对稀疏小病灶的分割能力,提出了MSCA U-Net。基于超广角眼底图像数据集和印度糖尿病性视网膜病变图像数据集的实验结果表明,与其他基于卷积神经网络的图像分割方法相比,所提方法具有更高的硬渗出液分割精度。 展开更多
关键词 MSCA U-Net 多尺度通道注意力模块 超广角眼底图像 硬渗出液分割
在线阅读 下载PDF
联合超声甲状腺结节分割与分类的多任务方法研究 被引量:1
9
作者 刘侠 吕志伟 +2 位作者 王波 王狄 谢林浩 《智能系统学报》 CSCD 北大核心 2023年第4期764-774,共11页
针对超声图像中甲状腺结节多尺度、结节边缘模糊、良恶分类不平衡问题,提出一种联合超声甲状腺结节分割与分类的多任务方法。以全卷积网络作为主干共享网络,将提取到的浅层特征共享给多任务分支网络,在分割网络分支中,先加入深层卷积块... 针对超声图像中甲状腺结节多尺度、结节边缘模糊、良恶分类不平衡问题,提出一种联合超声甲状腺结节分割与分类的多任务方法。以全卷积网络作为主干共享网络,将提取到的浅层特征共享给多任务分支网络,在分割网络分支中,先加入深层卷积块,获取分割分支深层特征,再对深层特征进行上采样。本文提出一种改进卷积注意力模块的多尺度卷积注意力模块,将上采样结果与主干共享网络每个特征提取阶段经过带有多尺度卷积注意力模块跳跃连接后的特征张量进行拼接,减少结节边缘模糊问题,提高分割性能。同时将多尺度卷积注意力模块融入到分类分支中,优化分类性能。实验结果表明:本文所提多任务方法能有效提升分割和分类的精度,较单任务深度学习网络具有更优的分割与分类性能,能有效处理甲状腺结节多尺度、结节边缘模糊的问题,降低良恶分类不平衡带来的影响。 展开更多
关键词 深度学习 多任务学习 甲状腺结节超声图像 图像分割 图像分类 深层卷积块 多尺度卷积注意力模块 残差结构
在线阅读 下载PDF
煤体红外热像异常区域分割方法 被引量:4
10
作者 赵小虎 车亭雨 +2 位作者 叶圣 田贺 张凯 《工矿自动化》 北大核心 2022年第9期92-99,共8页
红外辐射可反映煤岩受载破坏情况,用于监测和预防煤岩动力灾害,但红外热像仪生成的红外热像图像素分辨率低、噪声较大,导致检测结果受主观因素影响较大,无法准确识别煤体损伤区域。将深度学习和红外热像结合进行无损检测已成为趋势,但... 红外辐射可反映煤岩受载破坏情况,用于监测和预防煤岩动力灾害,但红外热像仪生成的红外热像图像素分辨率低、噪声较大,导致检测结果受主观因素影响较大,无法准确识别煤体损伤区域。将深度学习和红外热像结合进行无损检测已成为趋势,但目前结合深度学习和红外热像对煤体受载破坏进行识别检测的研究相对较少。针对上述问题,提出一种基于多尺度通道注意力模块(MS-CAM)U-Net模型的煤体红外热像异常区域分割方法。在传统U-Net模型的编码器中引入MS-CAM,设计了基于MS-CAM的U-Net模型结构,使模型在关注煤体红外热像异常区域显著特征的同时,还关注异常区域小目标特征,以提高异常区域分割精度。为降低煤体红外热像数据集匮乏对模型准确率和适用性的影响,对创建的煤体红外热像数据集进行数据增强操作,并采用MS COCO数据集对基于MS-CAM的U-Net模型进行预训练,再采用煤体红外热像数据集训练,得出最终网络权重。实验结果表明,该方法可有效分割煤体红外热像异常区域,精确率、F1分数、Dice系数和平均交并比分别为94.75%,94.94%,94.65%,90.03%,均优于Deeplab模型、U-Net模型和基于SENet注意力机制的U-Net模型。 展开更多
关键词 煤岩动力灾害 煤岩受载破坏 红外辐射 红外热像 异常区域分割 U-Net模型 多尺度通道注意力模块 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部