期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
基于改进Res2Net与迁移学习的水果图像分类 被引量:3
1
作者 吴迪 肖衍 +2 位作者 沈学军 万琴 陈子涵 《电子科技大学学报》 北大核心 2025年第1期62-71,共10页
针对传统水果图像分类算法特征学习能力弱和细粒度特征信息表示不强的缺点,提出一种基于改进Res2Net与迁移学习的水果图像分类算法。首先,针对网络结构,在Res2Net的残差单元中引入动态多尺度融合注意力模块,对各种尺寸的图像动态地生成... 针对传统水果图像分类算法特征学习能力弱和细粒度特征信息表示不强的缺点,提出一种基于改进Res2Net与迁移学习的水果图像分类算法。首先,针对网络结构,在Res2Net的残差单元中引入动态多尺度融合注意力模块,对各种尺寸的图像动态地生成卷积核,利用meta-ACON激活函数优化ReLU激活函数,动态学习激活函数的线性和非线性,自适应选择是否激活神经元;其次,采用基于模型迁移的训练方式进一步提升分类的效率与鲁棒性。实验结果表明,该算法在Fruit-Dataset和Fruits-360数据集上的测试准确率相比Res2Net提升了1.2%和1.0%,召回率相比Res2Net提升了1.13%和0.89%,有效提升了水果图像分类性能。 展开更多
关键词 图像分类 res2net 动态多尺度融合注意力 激活函数 迁移学习
在线阅读 下载PDF
基于Res2Net注意力机制网络智能检测CT肺动脉成像急性肺动脉栓塞
2
作者 李曼 蒋德攀 +5 位作者 王麦林 李艳若 张晗宇 王颖 张岚 黄婷婷 《中国医学影像学杂志》 北大核心 2025年第4期356-361,369,共7页
目的基于Res2Net注意力机制网络实现CT肺动脉成像急性肺动脉栓塞(APE)的智能检测。资料与方法回顾性收集2015年2月—2023年5月河南中医药大学第一附属医院疑似APE行CT肺动脉成像并确诊为APE的患者。按照7∶2∶1将数据随机分为训练集、... 目的基于Res2Net注意力机制网络实现CT肺动脉成像急性肺动脉栓塞(APE)的智能检测。资料与方法回顾性收集2015年2月—2023年5月河南中医药大学第一附属医院疑似APE行CT肺动脉成像并确诊为APE的患者。按照7∶2∶1将数据随机分为训练集、验证集和测试集。基于Res2Net网络框架,结合多孔空间金字塔池化和注意力机制模块训练模型,对模型进行五折交叉内部验证;在测试集上采用受试者工作特征曲线下面积、敏感度、特异度评估模型的诊断效能;同时采用戴斯相似系数、精确率、交集比并集(IOU)评估模型的分割效能并绘制相应曲线。比较该模型与经典的U-Net模型及CE-Net模型的效能。结果最终纳入303例APE患者,训练集212例,验证集61例,测试集30例。模型的曲线下面积为0.95,敏感度为0.90,特异度为1.00;戴斯相似系数为0.86,精确率为0.90,Pos-IOU为0.78,Neg-IOU为1.00。参数曲线图及雷达图显示Res2Net注意力机制网络多项参数均优于U-Net及CE-Net模型。分割对比的可视化结果显示Res2Net注意力机制网络对肺动脉栓子的分割精准度更高。结论Res2Net注意力机制网络模型对APE具有良好的检测性能。 展开更多
关键词 肺栓塞 CT肺动脉成像 体层摄影术 螺旋计算机 深度学习 res2net 注意力机制
在线阅读 下载PDF
基于ASP-SERes2Net的说话人识别算法 被引量:1
3
作者 令晓明 陈鸿雁 +1 位作者 张小玉 张真 《北京工业大学学报》 CAS 北大核心 2025年第1期42-50,共9页
为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(sq... 为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(squeeze-and-excitation,SE)注意力模块;然后,用注意力统计池化(attention statistics pooling,ASP)代替原来的平均池化;最后,采用附加角裕度的Softmax(additive angular margin Softmax,AAM-Softmax)对说话人身份进行分类。通过实验,将ASP-SERes2Net算法与时延神经网络(time delay neural network,TDNN)、ResNet34和Res2Net进行对比,ASP-SERes2Net算法的最小检测代价函数(minimum detection cost function,MinDCF)值为0.0401,等误率(equal error rate,EER)为0.52%,明显优于其他3个模型。结果表明,ASP-SERes2Net算法性能更优,适合应用于噪声环境下的说话人识别。 展开更多
关键词 说话人识别 梅尔语谱图 res2net 压缩激活(squeeze-and-excitation SE)注意力模块 注意力统计池化(attention statistics pooling ASP) 附加角裕度的Softmax(additive angular margin Softmax AAM-Softmax)
在线阅读 下载PDF
融合Res2Net和部分卷积的带钢表面缺陷检测算法 被引量:3
4
作者 胡凯涛 马向华 +1 位作者 孙向宇 刘闯 《计算机工程与应用》 北大核心 2025年第5期334-343,共10页
为提升带钢表面缺陷的层次性特征提取能力和检测效率,提出基于多尺度表征和部分卷积(PConv)的快速检测网络(multi-scale and partially convolutional network,MSPC-Net)。将限制对比度自适应直方图均衡技术(contrast limited adaptive ... 为提升带钢表面缺陷的层次性特征提取能力和检测效率,提出基于多尺度表征和部分卷积(PConv)的快速检测网络(multi-scale and partially convolutional network,MSPC-Net)。将限制对比度自适应直方图均衡技术(contrast limited adaptive histogram equalization,CLAHE)引入到该模型以突出带钢表面的缺陷特征;在YOLOv5s的基础上新增检测层,提高对不同尺寸缺陷目标的检测率;设计了融合Res2Net的多尺度特征提取块并引入ECA注意力机制(BRE-block),既可以获取细粒度层面的特征,同时也增加了模型感受野;通过结合PConv减少了模型计算量(FLOPs),且增强了部分特征信息的聚合。在NEU-DET数据集上的实验结果表明,平均精度均值(mAP@IoU=0.5)达到了80.2%,较原基线网络提高了5.9个百分点;同时改进后网络的FPS达到157,远高于近期应用广泛的目标检测算法,有效提高了带钢表面缺陷的检测效率。 展开更多
关键词 对比度增强 多尺度特征提取 改进res2net 融合PConv 信息聚合
在线阅读 下载PDF
基于Ghost-SE-Res2Net的多模型融合语音唤醒词检测方法 被引量:2
5
作者 虞秋辰 周若华 袁庆升 《计算机工程》 CAS CSCD 北大核心 2024年第3期52-59,共8页
语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测... 语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测窗,均基于轻量化的挤压与激励残差网络(SE-Res2Net)模块,即GhostSE-Res2Net,SE-Res2Net结构的多尺度机制可显著提升WWD的能力。在Ghost-SE-Res2Net中,首先使用Ghost卷积替换SE-Res2Net中的普通卷积以降低模型参数量,然后使用注意力池化层替换SE-Res2Net中的全局平均池化层进一步提升WWD能力。在实际检测时融合连续3个小检测窗模型的检测结果的最大值和1个大检测窗模型的检测结果,来判断唤醒词是否被触发。在训练时引入困难样本挖掘算法,选择性地学习较难检测的唤醒词信息以提高分类模型的检测性能。在包含2个唤醒词的Mobvoi数据集上评估系统性能,实验结果表明,在每小时0.5次错误唤醒的情况下,该系统在2个唤醒词上的错误拒绝率分别为0.46%和0.43%,实现了与先进基线相似的性能,并且系统参数量比基线少31%。 展开更多
关键词 唤醒词检测 Ghost模块 res2net结构 错误拒绝 多模型融合
在线阅读 下载PDF
基于CA-Res2Net和可变形卷积的图像去模糊方法 被引量:1
6
作者 李武斌 李春国 杨绿溪 《无线电通信技术》 2022年第5期945-950,共6页
针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时... 针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时CADNet嵌入了细粒度多尺度的残差模块,可以在更细粒度的层次上表示图片的多尺度特征信息,从而可以获得更强的特征表示能力。实验结果表明,CADNet是一种高效的去模糊算法,在获得更高去模糊性能的同时,压制住了计算开销。 展开更多
关键词 图像去模糊 非均匀模糊 可变形卷积 通道注意力 res2net
在线阅读 下载PDF
基于残差网络的有限元分析结果云图的加密方法
7
作者 董正方 代鹏翔 +3 位作者 曾繁凯 康腾奥 李运华 田林杰 《科学技术与工程》 北大核心 2025年第25期10766-10772,共7页
在有限元分析中,提高网格密度能够显著增强仿真结果的准确性,但同时也需要消耗更多的计算资源,为了解决这一矛盾,通过将Res2Net、U-Net、通道注意力机制、几何特征提取融合在一起,对低网格密度的有限元结果云图数据进行学习,预测高网格... 在有限元分析中,提高网格密度能够显著增强仿真结果的准确性,但同时也需要消耗更多的计算资源,为了解决这一矛盾,通过将Res2Net、U-Net、通道注意力机制、几何特征提取融合在一起,对低网格密度的有限元结果云图数据进行学习,预测高网格密度的有限元结果云图,从而在不牺牲精度的前提下,减少所需的计算成本。模型通过在2倍、4倍和8倍等不同尺度条件下进行实验,在测试数据上的均方误差和平均绝对误差都有显著降低,充分证明了模型在数值预测准确性方面的卓越表现,结果表明,在较少的计算资源投入下,在保证输出结果的高精度下,可利用此模型进行有限元结果云图的加密。 展开更多
关键词 有限元分析 结果云图 res2net残差网络 跳跃连接 注意力机制
在线阅读 下载PDF
考虑时空耦合关系的电力变压器油中溶解气体多尺度融合预测方法 被引量:1
8
作者 张倩倩 李敏 +3 位作者 耿绍胜 王春鑫 谢军 谢庆 《绝缘材料》 北大核心 2025年第6期122-130,共9页
对油中溶解气体的时空耦合关系进行多尺度挖掘,有助于提高油中溶解气体预测精度,为变压器运维决策提供可靠理论依据。为此,提出一种考虑时空耦合信息的变压器油中溶解气体多尺度融合预测方法。首先,利用Res2Net对油中溶解气体数据进行... 对油中溶解气体的时空耦合关系进行多尺度挖掘,有助于提高油中溶解气体预测精度,为变压器运维决策提供可靠理论依据。为此,提出一种考虑时空耦合信息的变压器油中溶解气体多尺度融合预测方法。首先,利用Res2Net对油中溶解气体数据进行多尺度时间特征提取,捕捉特征气体不同频率的周期性时间特征信息。其次,通过计算互信息捕捉特征气体间隐性关系,以拓扑关系图的形式描述不同气体间关联性,并使用图卷积神经网络(GCN)提取空间信息特征。最后,将多尺度时间信息与空间信息进行融合拼接,采用时间卷积网路(TCN)对油中溶解气体进行预测,并使用某500 kV变压器油色谱在线监测数据对所提方法进行验证。结果表明:相比于传统预测方法,Res2NetGCN-TCN模型可有效提高油中溶解气体含量预测精度,平均预测精度可达98.68%。 展开更多
关键词 油中溶解气体预测 res2net 图卷积 时间卷积 时空信息融合
在线阅读 下载PDF
一种用于中介轴承故障诊断的网络模型Res2APCNN
9
作者 田晶 王敬迪 +2 位作者 丁小飞 林政 高明浩 《仪器仪表学报》 北大核心 2025年第8期49-62,共14页
针对航空发动机中介轴承在强噪声背景下的健康监测问题,提出了一种结合数据融合和自适应注意力机制的多尺度残差神经网络(Res2APCNN)模型。首先,采用格拉姆角差场(GADF)、格拉姆角和场(GASF)以及马尔科夫转移场(MTF)方法,将轴承信号转... 针对航空发动机中介轴承在强噪声背景下的健康监测问题,提出了一种结合数据融合和自适应注意力机制的多尺度残差神经网络(Res2APCNN)模型。首先,采用格拉姆角差场(GADF)、格拉姆角和场(GASF)以及马尔科夫转移场(MTF)方法,将轴承信号转化为二维灰度图像,并将这3种图像分别映射至RGB的3个通道,构建复合彩色图像,从而增强对时间序列信息的捕获能力。其次,引入Res2Net模块,通过并行卷积操作提取不同尺度的信息,过滤噪声干扰并优化信息流动。再次,嵌入自适应并联特征融合模块,对各特征维度的重要性赋予差异化权重,对关键特征信号进行筛选和放大。最后,通过特征提取和分类模块输出中介轴承故障类型。采用意大利都灵理工大学、哈尔滨工业大学轴承数据集和自建试验台数据集对模型进行验证。实验结果表明,所提出的Res2APCNN模型在强噪声环境下表现出优异的故障诊断性能,与当前先进方法相比,在都灵理工大学数据集上,相较于IDRSN方法准确率提升了1.52%;在HIT数据集上,相较于MC-CNN方法准确率提升了6.65%;在自建数据集上,相较于Wen-CNN方法准确率提升了2.35%。此外,该模型的诊断准确率波动最小,稳定性最高。在强噪声条件下,Res2APCNN模型仍能保持较高的识别精度,展现出良好的抗干扰能力。 展开更多
关键词 中介轴承 故障诊断 自适应特征融合 res2net
在线阅读 下载PDF
基于YOLOv7的木材缺陷检测模型Wood-Net的研究 被引量:12
10
作者 王正 江莺 +3 位作者 严飞 孙佑鹏 张园 张柳磊 《林业工程学报》 CSCD 北大核心 2024年第1期132-140,共9页
为改善利用人工方式识别木材缺陷存在的效率低、人工成本高的问题,同时实现在木材加工过程中使用新兴方式对不同的缺陷进行快速准确检测以提高木材利用率,针对现有的目标检测网络在木材缺陷检测方面存在诸如检测精度低、报错率高以及识... 为改善利用人工方式识别木材缺陷存在的效率低、人工成本高的问题,同时实现在木材加工过程中使用新兴方式对不同的缺陷进行快速准确检测以提高木材利用率,针对现有的目标检测网络在木材缺陷检测方面存在诸如检测精度低、报错率高以及识别种类少等局限,设计了用于木材缺陷检测的深度学习网络Wood-Net。Wood-Net将注意力机制ECA(efficient channel attention module)引入YOLOv7的主干网络,以便更好地区分木材缺陷之间的细微差别;将ECA与Res2Net结合后形成ECA-Res2Net模块,ECA-Res2Net模块克服了单纯的Res2Net跨通道交流能力不足的问题,增强了网络对更细粒度特征的提取能力;将ECA-Res2Net模块与SPPCSPC(spatial pyramid pooling and channel spatial pyramid convolution)并联形成ResSPPCSPC模块,增加了描述图像本身特征数量的能力,由此构成新方法Wood-Net。本研究将准确度、召回值、mAP@0.5以及mAP@0.5∶mAP@0.95 4个数值作为系统性能的评价指标。利用自建数据集训练Wood-Net,得到试验数据。试验结果表明:Wood-Net模型比基准模型YOLOv7在木材优选上精确率提高了4.52%,mAP@0.5∶mAP@0.95提高了6.62%;比基准模型YOLOv5s在木材优选上精确率提高了6.79%,mAP@0.5∶mAP@0.95提高了5.67%。ECA注意力机制能够有效提升E-ELAN的通道间信息交互能力;Res2Net模块具有很强的细粒度特征提取能力,在网络中引入Res2Net模块后,网络各项性能指标收敛速度快,在Res2Net中加入ECA后能够使单纯的Res2Net考虑多通道特征之间的关系,完成信息融合,提高检测性能。 展开更多
关键词 Wood-Net 木材优选 ECA-res2net ECA res2net
在线阅读 下载PDF
基于改进YOLOv5的行人检测方法研究 被引量:2
11
作者 薛继伟 薛鹏杰 胡馨元 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第7期101-109,共9页
针对行人检测中出现的目标遮挡和小尺度目标漏检等现象,提出一种基于YOLOv5改进的行人检测模型DROE-YOLO。在YOLOv5的C3模块中引入了Res2Net的残差结构以增强网络对行人目标的表征能力。采用Dynamic Head作为YOLOv5的检测头,提高检测的... 针对行人检测中出现的目标遮挡和小尺度目标漏检等现象,提出一种基于YOLOv5改进的行人检测模型DROE-YOLO。在YOLOv5的C3模块中引入了Res2Net的残差结构以增强网络对行人目标的表征能力。采用Dynamic Head作为YOLOv5的检测头,提高检测的准确性和鲁棒性。在标签分配策略方面采用了Simplified OTA方法,可以更准确地匹配真实框与预测框。最后,使用soft-NMS+EIOU的方法,进一步提高行人目标的检测准确率。在CrowdHuman数据集上的实验结果表明,DROE-YOLO在行人检测任务上取得了较好的效果。与基准模型相比,在增加少量参数的情况下,DROE-YOLO模型的检测精度提升了3.3%,召回率提升了6.5%,相比原模型更适用于实际的行人检测任务。 展开更多
关键词 行人检测 res2net Dynamic-Head Simplified-OTA Soft-NMS
在线阅读 下载PDF
国标麻将的多尺度骨干神经网络模型 被引量:1
12
作者 代君学 李霞丽 +1 位作者 刘博 王昭琦 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期137-144,共8页
在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数... 在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数据,做出更准确的游戏策略。基于IJCAI 2020 Champion的对局数据,对训练数据进行数据增强。采用增强后的数据,在NVIDAI GeForce RTX3090 LapTop GPU上进行了5天的监督学习训练,训练出的模型有52 M参数,动作准确率达到93.47%,弃牌准确率达到83.93%,鸣牌准确率达到97.56%。将提出的模型部署到北京大学开发的Botzone平台上,进入天梯榜前1%。 展开更多
关键词 深度学习 麻将 卷积神经网络 res2net50 多尺度骨干架构
在线阅读 下载PDF
基于多尺度时空卷积的唇语识别方法
13
作者 叶鸿 危劲松 +3 位作者 贾兆红 郑辉 梁栋 唐俊 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第11期4170-4177,共8页
现有的唇语识别模型大多采用将单层的3维卷积与2维卷积神经网络结合的方式,从唇语视频序列中挖掘出时空联合特征。然而,由于单层的3维卷积不能很好地提取时间信息,同时2维卷积神经网络对细粒度的唇语特征的挖掘能力有限,该文提出一种多... 现有的唇语识别模型大多采用将单层的3维卷积与2维卷积神经网络结合的方式,从唇语视频序列中挖掘出时空联合特征。然而,由于单层的3维卷积不能很好地提取时间信息,同时2维卷积神经网络对细粒度的唇语特征的挖掘能力有限,该文提出一种多尺度唇语识别网络(MS-LipNet)以改善唇语识别任务。该文在Res2Net网络中,采用3维时空卷积替代传统的2维卷积以更好地提取时空联合特征,同时提出时空坐标注意力模块,使网络关注于任务相关的重要区域特征。在LRW和LRW-1000数据集上进行实验,验证了所提方法的有效性。 展开更多
关键词 唇语识别 多尺度时空卷积网络 res2net 时空坐标注意力 数据增强
在线阅读 下载PDF
基于局部和全局特征提取及多级特征聚合的中文方言识别模型
14
作者 孟一凡 陈宁 李泓锴 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期898-904,共7页
与其他语种的方言相比,中文方言种类较多,且方言类间差异小,类内差异大,因此中文方言识别极具挑战性。考虑到中文方言间的差异性可能体现在语音的局部(短时)特性上,也可能体现在语音的全局(长时)特性上,同时还可能反映在语音不同层级的... 与其他语种的方言相比,中文方言种类较多,且方言类间差异小,类内差异大,因此中文方言识别极具挑战性。考虑到中文方言间的差异性可能体现在语音的局部(短时)特性上,也可能体现在语音的全局(长时)特性上,同时还可能反映在语音不同层级的特性上,本文提出一种融合语音局部和全局特征提取以及多级特征聚合的中文方言识别模型。首先通过Res2Block提取语音的局部特征,然后利用Conformer提取语音的全局特征,最后通过将多个Conformer级联输出进行多层级特征的聚合。跨域和非跨域的实验结果表明,该模型取得了比基线模型更高的识别准确率。 展开更多
关键词 CONFORMER 方言识别 多层级特征聚合 Res2Block 注意力统计池化
在线阅读 下载PDF
采用轻量级网络MobileNetV2的酿酒葡萄检测模型 被引量:15
15
作者 李国进 黄晓洁 +1 位作者 李修华 艾矫燕 《农业工程学报》 EI CAS CSCD 北大核心 2021年第17期168-176,F0003,共10页
为提高田间葡萄图像中小目标葡萄检测的速度和精度,该研究提出了一种基于轻量级网络的酿酒葡萄检测模型(Wine Grape Detection Model,WGDM)。首先,采用轻量级网络MobileNetV2取代YOLOv3算法的骨干网络DarkNet53完成特征提取,加快目标检... 为提高田间葡萄图像中小目标葡萄检测的速度和精度,该研究提出了一种基于轻量级网络的酿酒葡萄检测模型(Wine Grape Detection Model,WGDM)。首先,采用轻量级网络MobileNetV2取代YOLOv3算法的骨干网络DarkNet53完成特征提取,加快目标检测的速度;其次,在多尺度检测模块中引入M-Res2Net模块,提高检测精度;最后,采用平衡损失函数和交并比损失函数作为改进的定位损失函数,增大目标定位的准确性。试验结果表明,提出的WGDM模型在公开的酿酒葡萄图像数据集的测试集上平均精度为81.20%,网络结构大小为44 MB,平均每幅图像的检测时间为6.29 ms;与单发检测器(Single Shot Detector,SSD)、YOLOv3、YOLOv4和快速区域卷积神经网络(Faster Regions with Convolutional Neural Network,Faster R-CNN)4种主流检测模型相比,平均检测时间分别减少了4.91、7.75、14.84和158.20 ms。因此,该研究提出的WGDM模型对田间葡萄果实具有更快速、更准确的识别与定位,为实现葡萄采摘机器人的高效视觉检测提供了可行方法。 展开更多
关键词 机器视觉 图像处理 模型 葡萄 检测 YOLO res2net
在线阅读 下载PDF
Res2-Unet深度学习网络的RGB-高光谱图像重建 被引量:15
16
作者 宋蓓蓓 马穗娜 +1 位作者 何帆 孙文方 《光学精密工程》 EI CAS CSCD 北大核心 2022年第13期1606-1619,共14页
针对高光谱成像设备价格昂贵而难以推广应用的问题,利用深度学习网络从易获得的RGB图像重建高质量的高光谱图像。提出的Res2-Unet深度学习网络以Unet框架为基础,以Res2Net为主要模块构建其骨干网络,可以在更加细粒度级别提取局部和全局... 针对高光谱成像设备价格昂贵而难以推广应用的问题,利用深度学习网络从易获得的RGB图像重建高质量的高光谱图像。提出的Res2-Unet深度学习网络以Unet框架为基础,以Res2Net为主要模块构建其骨干网络,可以在更加细粒度级别提取局部和全局的图像特征。引入通道注意力机制自适应调节通道特征响应,并在编解码间通过跳跃连接以充分融合不同尺度和不同深度的信息。最后在图像恢复与增强新趋势2020年国际挑战赛提供的数据集上进行训练和测试。实验结果表明,与自适应加权注意力机制网络、分层回归网络相比,提出的方法在平均相对绝对误差、均方根误差、峰值信噪比和平均光谱角制图等4种客观评价指标上均获得了最好的结果;在Clean赛道中平均峰值信噪比分别高出0.08 dB和1.73 dB,在Real World赛道中平均峰值信噪比分别高出0.72 dB和0.97 dB。对比高光谱参考图像与重建图像,无论是在图像的低频平坦区还是在图像的高频纹理区,提出方法均获得了更好的主观视觉效果。 展开更多
关键词 深度学习 高光谱图像 图像重建 res2net 通道注意力机制
在线阅读 下载PDF
基于改进的YOLOv3算法的乳腺超声肿瘤识别 被引量:3
17
作者 徐立芳 傅智杰 莫宏伟 《智能系统学报》 CSCD 北大核心 2021年第1期21-29,共9页
为了提高乳腺癌诊断的效率以及准确性,本文提出一种基于改进的YOLOv3算法来构建一个乳腺超声肿瘤识别算法,辅助医生进行乳腺癌的诊断。首先在Res2Net网络上融入SE模块构建SE-Res2Net网络来取代原始YOLOv3中的特征提取网络,以此提升模型... 为了提高乳腺癌诊断的效率以及准确性,本文提出一种基于改进的YOLOv3算法来构建一个乳腺超声肿瘤识别算法,辅助医生进行乳腺癌的诊断。首先在Res2Net网络上融入SE模块构建SE-Res2Net网络来取代原始YOLOv3中的特征提取网络,以此提升模型特征提取的能力。然后通过搭建一个新型下采样模块(downsample block)来解决原始模型中下采样操作容易出现信息丢失的不足。最后为了进一步提升模型特征提取的能力,结合残差连接网络以及密集连接网络的优点构建Res-DenseNet网络来替换原始模型的残差连接方式。实验结果表明:改进后的YOLOv3算法比原始YOLOv3算法的m AP提高了4.56%,取得较好的检测结果。 展开更多
关键词 乳腺癌 超声影像 YOLOv3 SE-res2net 下采样模块 残差连接 密集连接
在线阅读 下载PDF
一种适应不同距离的低清人脸深度识别算法 被引量:1
18
作者 邵文泽 胡洪明 +1 位作者 李金叶 邓海松 《南京邮电大学学报(自然科学版)》 北大核心 2023年第1期1-10,共10页
针对多数人脸识别算法对于实际低清影像鲁棒性弱的问题,构建了一种融合知识蒸馏和域自适应的低清人脸识别新模型,包含教师网和学生网。首先,两分支骨干网均引入Res2Net模块,以助于提取细粒度强的人脸身份特征;其次,骨干网的不同阶段均... 针对多数人脸识别算法对于实际低清影像鲁棒性弱的问题,构建了一种融合知识蒸馏和域自适应的低清人脸识别新模型,包含教师网和学生网。首先,两分支骨干网均引入Res2Net模块,以助于提取细粒度强的人脸身份特征;其次,骨干网的不同阶段均引入知识蒸馏,以助于提升学生网的低清人脸特征提取能力;最后,在学生网引入域自适应学习机制,以助于实现域不变的特征提取能力。公开数据集上的实验结果验证了新模型对于不同距离低清人脸的有效性。 展开更多
关键词 人脸识别 知识蒸馏 域自适应 res2net 视频监控
在线阅读 下载PDF
基于CNN的血液细胞图像自动识别算法 被引量:3
19
作者 李国权 姚凯 庞宇 《计算机科学》 CSCD 北大核心 2022年第4期247-253,共7页
全血细胞计数是医学诊断中评价健康状况的重要检测手段。为解决传统血细胞计数器及其他设备对血细胞人工计数程序繁琐且耗时较长的问题,提出了一种基于卷积神经网络的血液细胞识别算法,即基于Res2Net和YOLO对象检测算法对3种类型的血液... 全血细胞计数是医学诊断中评价健康状况的重要检测手段。为解决传统血细胞计数器及其他设备对血细胞人工计数程序繁琐且耗时较长的问题,提出了一种基于卷积神经网络的血液细胞识别算法,即基于Res2Net和YOLO对象检测算法对3种类型的血液细胞进行自动识别和计数。通过将Res2Net融入YOLO模型来提取更细粒度表示的多尺度特征和增加每个网络层的感受野范围,以提升血液细胞识别模型的性能。在公开血液涂片图像数据集的训练和测试结果表明,所提方法能够自动识别和计数红细胞、白细胞和血小板,识别准确率分别达到了96.09%,93.44%,96.36%。与其他基于卷积神经网络的识别模型相比,所提方法识别准确率高且具有较强的泛化性,能显著提升血液检测的效率。 展开更多
关键词 卷积神经网络 res2net YOLO算法 血液细胞识别
在线阅读 下载PDF
基于多尺度特征提取深度残差网络的水稻害虫识别 被引量:7
20
作者 郑显润 郑鹏 +2 位作者 王文秀 程亚红 苏宇锋 《华南农业大学学报》 CAS CSCD 北大核心 2023年第3期438-446,共9页
[目的]在水稻生产过程中,针对不同虫害需要采用不同的防治方案,水稻害虫的准确识别分类是制定针对性防治方案的前提。[方法]采用深度学习结合机器视觉的方法,基于Res2Net结构提出了一种多尺度特征提取的深度残差网络,通过准确地提取害... [目的]在水稻生产过程中,针对不同虫害需要采用不同的防治方案,水稻害虫的准确识别分类是制定针对性防治方案的前提。[方法]采用深度学习结合机器视觉的方法,基于Res2Net结构提出了一种多尺度特征提取的深度残差网络,通过准确地提取害虫特征实现复杂自然背景下的水稻害虫识别;采用改进的残差结构,使用等级制的类残差连接取代了原本的3×3卷积核,增加了每个网络层的感受野,可以更细粒度地提取多尺度特征。[结果]本网络训练的模型能够有效地识别自然背景下的水稻害虫,在自建的包含22类常见水稻害虫的图像数据集上,平均识别准确率达到了92.023%,优于传统的ResNet、VGG等网络。[结论]本文提出的模型可应用于水稻虫情自动监测系统,为实现水稻害虫虫情的机器视觉监测提供参考。 展开更多
关键词 水稻害虫 res2net 残差网络 深度学习 图像识别 图像分类 多尺度特征
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部