期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
基于RepVGG的鲁棒头部姿态估计算法
1
作者 孟雪莹 傅由甲 《计算机工程与设计》 北大核心 2025年第10期2927-2935,共9页
针对头部姿态估计方法中特征鲁棒性较差,关键特征捕捉不足以及模型的稳定性和准确率不平衡等问题,提出基于改进RepVGG的鲁棒头部姿态估计方法 RepVGG-DP。该方法在RepVGG模型前添加特征增强模块以优化特征质量;加入PNB模块以融合原始和... 针对头部姿态估计方法中特征鲁棒性较差,关键特征捕捉不足以及模型的稳定性和准确率不平衡等问题,提出基于改进RepVGG的鲁棒头部姿态估计方法 RepVGG-DP。该方法在RepVGG模型前添加特征增强模块以优化特征质量;加入PNB模块以融合原始和加工特征细节信息,提升特征提取能力;融合测地线距离和调整尺度的Frobenius范数构建新的损失函数。实验结果表明,在AFLW2000和BIWI数据集上,RepVGG-DP的MAE值分别降低0.21°、0.29°和0.38°,显示出显著的性能提升。 展开更多
关键词 深度学习 头部姿态估计 repvgg模型 特征优化 特征提取 多尺度信息 融合损失
在线阅读 下载PDF
基于双线性RepVGG注意力网络的花卉分类 被引量:1
2
作者 侯向宁 赵金伟 +1 位作者 黄孝斌 蒋维成 《激光杂志》 CAS 北大核心 2024年第4期165-171,共7页
为进一步提高花卉分类的准确率,在对双线性卷积神经网络、RepVGG及注意力机制进行研究的基础上,提出一种基于双线性RepVGG注意力机制的网络模型。首先利用RepVGG网络替换原始的特征提取网络VGG,以提高对花卉主要特征的提取能力;然后在两... 为进一步提高花卉分类的准确率,在对双线性卷积神经网络、RepVGG及注意力机制进行研究的基础上,提出一种基于双线性RepVGG注意力机制的网络模型。首先利用RepVGG网络替换原始的特征提取网络VGG,以提高对花卉主要特征的提取能力;然后在两个RepVGG网络中分别引入通道注意力及空间注意力机制,并利用两个RepVGG网络外积后生成的高维双线性特征,来提取花卉的细粒度特征;最后通过结构重参数化,将RepVGG的各层转换为单路结构,以提高模型推理的速度。实验结果表明,在增强的Oxford-102数据集上,新模型与原始模型及常见模型相比,其推理速度及分类准确率均有较大的提升,与未引入注意力前相比,分类准确率也有一定的提升。 展开更多
关键词 双线性卷积神经网络 repvgg 注意力机制 细粒度 结构重参数化
在线阅读 下载PDF
融合RepVGG的YOLOv5交通标志识别算法 被引量:2
3
作者 郭华玲 刘佳帅 +2 位作者 郑宾 殷云华 赵棣宇 《科学技术与工程》 北大核心 2024年第9期3869-3875,共7页
实现自动驾驶的安全性需要准确检测交通标志。针对传统方法在交通标志检测方面存在准确度不高的问题,提出一种融合RepVGG模块的改进YOLOv5的交通标志识别算法。首先通过将RepVGG模块替换原算法中的部分CBS模块,增强了特征提取能力。并... 实现自动驾驶的安全性需要准确检测交通标志。针对传统方法在交通标志检测方面存在准确度不高的问题,提出一种融合RepVGG模块的改进YOLOv5的交通标志识别算法。首先通过将RepVGG模块替换原算法中的部分CBS模块,增强了特征提取能力。并在特征融合模块引入通道注意力模块(channel block attention module,CBAM),强化检测模型的抗干扰能力。最后,在网络训练过程中,使用高效交并比(efficient-IoU,EIoU)损失函数实现对目标更精确的定位,提高算法的检测精度与迭代速度。实验结果表明,改进后的YOLOv5算法迭代速度更快,在CCTSDB交通标志数据集上,其相较于原YOLOv5算法的准确率、召回率和平均准确率分别提升了4.99%、3.62%、1.73%,能够更好地应用到实践当中。 展开更多
关键词 深度学习 YOLOv5 repvgg 注意力机制 EIoU 交通标志识别
在线阅读 下载PDF
基于RepVGG网络的实时车道线检测方法
4
作者 蔡汶良 黄俊 《计算机科学》 CSCD 北大核心 2024年第7期236-243,共8页
针对现有车道线检测方法存在的检测速度慢、检测精度低的问题,将车道线检测视为分类问题,提出了基于RepVGG网络的实时车道线检测方法。在RepVGG网络中融合不同层级特征图,减少空间定位信息的损失,提高车道线的定位精度。采用曲线建模的... 针对现有车道线检测方法存在的检测速度慢、检测精度低的问题,将车道线检测视为分类问题,提出了基于RepVGG网络的实时车道线检测方法。在RepVGG网络中融合不同层级特征图,减少空间定位信息的损失,提高车道线的定位精度。采用曲线建模的后处理方法,从整体和局部两个角度修正车道线预测结果。挖掘车道线定位中的分布信息,提出了基于分布指导的车道线存在预测分支,直接从车道线定位分布中学习车道线的存在特征,在略微提升推理速度的同时进一步提升检测精度。在TuSimple和CULane数据集上的实验表明,该模型在检测速度和精度上取得了良好的平衡。在CULane数据集上,所提方法的推理速度为目前同类方法中检测速度最快的UFLDv2算法的1.13倍,同时F1分数从74.7%提高到77.1%,达到了实时检测任务的需求。 展开更多
关键词 计算机视觉 repvgg 车道线检测 曲线拟合 特征融合 后处理
在线阅读 下载PDF
结合振动信号图像化和RepVGG的滚动轴承故障诊断方法 被引量:1
5
作者 周建民 王云庆 李家辉 《机械科学与技术》 CSCD 北大核心 2024年第12期2024-2031,共8页
针对滚动轴承故障诊断中一维振动数据的细微特征提取不明显,以及实时诊断速度慢的问题,采用振动数据转图像数据的预处理方法,使用连续小波变换将振动信号转换为二维时频图,同时提出一种基于结构重参数化技术(RepVGG)的轴承故障诊断方法... 针对滚动轴承故障诊断中一维振动数据的细微特征提取不明显,以及实时诊断速度慢的问题,采用振动数据转图像数据的预处理方法,使用连续小波变换将振动信号转换为二维时频图,同时提出一种基于结构重参数化技术(RepVGG)的轴承故障诊断方法。将训练模型的多分支网络结构等价转换为单路径网络结构,从而提高推理模型的精度和速度。以轴承故障诊断数据集进行实验验证,并与EfficientNet模型和ResNet50模型进行比较分析,结果表明,RepVGG模型能够准确识别轴承故障类别,平均准确率优于其他方法,并且在相同的实验硬件条件下,推理时长分别减少了81%和66.19%,有效提升了诊断的速度和精度,具有较好的适应性和优越性。 展开更多
关键词 轴承 故障诊断 时频图 repvgg模型
在线阅读 下载PDF
基于RepVGG的疲劳驾驶检测算法
6
作者 夏庆锋 李明阳 +1 位作者 宋志强 许可儿 《兵工自动化》 北大核心 2024年第12期26-29,41,共5页
为提高疲劳驾驶检测方法的准确率和可部署性,提出一种基于RepVGG的疲劳驾驶检测算法。在模型中增添空洞卷积金字塔池化(atrous spatial pyramid pooling,ASPP)模块,以捕捉多尺度疲劳特征信息。将卷积块注意力模块(convolutional block a... 为提高疲劳驾驶检测方法的准确率和可部署性,提出一种基于RepVGG的疲劳驾驶检测算法。在模型中增添空洞卷积金字塔池化(atrous spatial pyramid pooling,ASPP)模块,以捕捉多尺度疲劳特征信息。将卷积块注意力模块(convolutional block attention module,CBAM)与ASPP模块结合,单独应用于模型中,进一步强调和捕捉疲劳特征表达的多尺度信息和重要区域信息,并抑制图像中的背景信息,从而提高模型的性能和鲁棒性。结果表明:改进RepVGG算法在疲劳驾驶数据集上的准确率达到了97.34%,比原算法提高了2.51%,且模型参数量仅为7.1×106,具有良好的检测精度和可部署性。 展开更多
关键词 repvgg 疲劳驾驶检测 ASPP CBAM
在线阅读 下载PDF
一种融合RepVGG和YOLOv5的行人检测方法 被引量:11
7
作者 刘春雷 李志华 +2 位作者 王超 王连贺 张元彪 《科学技术与工程》 北大核心 2023年第7期2945-2951,共7页
现如今,基于YOLOv5的网络模型被广泛应用在行人检测的任务中,在精度和速度上有着良好的效果。但在终端设备上部署使用,往往受到算力的限制。因而,基于RepVGG模型改进的主干网络,并且为了提高在密集人群和复杂环境下的适应性,加入了坐标... 现如今,基于YOLOv5的网络模型被广泛应用在行人检测的任务中,在精度和速度上有着良好的效果。但在终端设备上部署使用,往往受到算力的限制。因而,基于RepVGG模型改进的主干网络,并且为了提高在密集人群和复杂环境下的适应性,加入了坐标注意力机制,扩大感受野的同时增强感兴趣区域的权重。经过实验测试,这种轻量化的网络参数量和计算量比较小,而且检测精度和鲁棒性也比较高,能够在一定程度下满足工程应用的要求。 展开更多
关键词 行人检测 repvgg 注意力机制 YOLOv5
在线阅读 下载PDF
结合改进RepVGG-A0网络和重新标签的人脸表情识别研究 被引量:2
8
作者 李婉婷 罗晓曙 +1 位作者 蒙志明 陈吉 《现代电子技术》 2022年第20期69-74,共6页
目前大规模人脸表情识别的主要问题在于不确定性,这些不确定性来源于模棱两可的面部表情、低质量的脸部图像和标注者的主观性。为此,文中提出一种基于RepVGG-A0改进后的网络模型。该模型引入有效通道注意力机制,即在卷积层和ReLU激活函... 目前大规模人脸表情识别的主要问题在于不确定性,这些不确定性来源于模棱两可的面部表情、低质量的脸部图像和标注者的主观性。为此,文中提出一种基于RepVGG-A0改进后的网络模型。该模型引入有效通道注意力机制,即在卷积层和ReLU激活函数之间插入ECA通道注意力模块,在特征提取后引入加权模块来预计样本的权重,对于不确定的样本给予的权重较小,并采用重新标签的方法对低权重的人脸表情图片重新给予伪标签,目的是使修改过的样本在下一次训练中获得高权重,从而提高人脸表情识别率。最后,在RAF-DB和FER-2013数据集上进行实验验证。结果表明,文中改进模型的人脸表情识别率分别达到88.90%和75.61%,说明该方法对人脸表情识别具有有效性。 展开更多
关键词 人脸表情识别 repvgg-A0 重新标签 网络模型 特征提取 数据预处理 ReLU
在线阅读 下载PDF
带钢表面缺陷的RepVGG网络改进及其识别 被引量:1
9
作者 沈希忠 谢旭 《现代制造工程》 CSCD 北大核心 2023年第5期121-126,共6页
对带钢表面缺陷准确快速识别是带钢外观质量评价的一项重要内容,应用深度学习进行带钢表面缺陷识别是一个持续的热点。提出了一种基于改进RepVGG网络的带钢表面缺陷识别方法。首先为提高RepVGG网络在带钢表面缺陷识别中的稳定性和准确率... 对带钢表面缺陷准确快速识别是带钢外观质量评价的一项重要内容,应用深度学习进行带钢表面缺陷识别是一个持续的热点。提出了一种基于改进RepVGG网络的带钢表面缺陷识别方法。首先为提高RepVGG网络在带钢表面缺陷识别中的稳定性和准确率,该方法引入了高效通道注意力(Efficient Channel Attention,ECA)网络,然后为了防止神经网络训练中神经元坏死,使得神经元参数得不到更新,应用了高斯误差线性激活函数。在测试集上,改进RepVGG网络对带钢表面缺陷的识别率达到了99.94%,而其运行速度并没有降低,单张图片的平均检测时间为5.4 ms。 展开更多
关键词 缺陷检测 repvgg网络:高效通道注意力网络 高斯误差线性单元 可视化
在线阅读 下载PDF
基于RepVGG和LSTM两阶段移动众包任务分配算法 被引量:1
10
作者 于嵩 潘庆先 +2 位作者 童向荣 刘庆菊 褚佳静 《燕山大学学报》 CAS 北大核心 2023年第2期152-163,共12页
移动众包是一种新型的感知模式,已被广泛应用于移动计算和城市生活交通服务,任务分配是移动众包中核心研究问题之一。但由于任务是动态到达的,移动众包平台在初始并不了解所有的众包任务,导致任务分配往往会陷入局部最优。为了解决上述... 移动众包是一种新型的感知模式,已被广泛应用于移动计算和城市生活交通服务,任务分配是移动众包中核心研究问题之一。但由于任务是动态到达的,移动众包平台在初始并不了解所有的众包任务,导致任务分配往往会陷入局部最优。为了解决上述问题,本文提出了一种基于深度学习的两阶段预测算法,第一阶段使用基于RepVGG的网络进行任务可用性的预测,第二阶段使用基于LSTM的网络进一步进行任务持续时间的预测。通过实验对比,本文所提出的算法在预测任务可用性上的准确度比传统的机器学习算法提高了32%,比同样基于深度学习的算法提高了14.2%,在预测任务持续性上的准确度相比其他算法提高了10.5%。 展开更多
关键词 移动众包 任务分配 repvgg LSTM 任务可用性 任务持续性
在线阅读 下载PDF
基于改进RepVGG网络的图像畸变矫正算法研究
11
作者 刘南艳 关宁宁 《现代电子技术》 2025年第23期48-57,共10页
当前的畸变矫正技术都是在有参照物的基础上进行的,比如直线、人脸等,应用范围有限。一些深度学习方法也只聚焦于单一的畸变矫正问题,其矫正效果不够好。为了有效解决生活中广泛存在的多种畸变问题,文中提出一种基于RepVGG网络架构的图... 当前的畸变矫正技术都是在有参照物的基础上进行的,比如直线、人脸等,应用范围有限。一些深度学习方法也只聚焦于单一的畸变矫正问题,其矫正效果不够好。为了有效解决生活中广泛存在的多种畸变问题,文中提出一种基于RepVGG网络架构的图像混合畸变矫正方法。该方法对于提取到的特征,分别采用预测模型和分类模型获取预测数据和畸变类型数据,通过这两组数据训练出畸变矫正模型,实现畸变图像的预测、分类以及矫正过程。网络还引入空间注意力机制来关注变形严重区域。同时,为了降低模型训练复杂度,引入线性缩放层代替RepVGG块中的非线性结构,使训练时可以合并块中的操作。再通过压缩块的方式将多分支结构转换为单个卷积层,既加速训练过程,同时又保持了多分支结构的表达优势。通过实验证明该模型在6种类型的畸变图像上都有出色的矫正能力。与现有算法相比,该算法的矫正率均可以达到98%以上,模型训练速度提升了约1.53倍,该方法在图像畸变矫正领域具有一定的适用性。 展开更多
关键词 图像畸变矫正 深度学习 混合畸变 repvgg 空间注意力机制 多分支结构
在线阅读 下载PDF
基于改进YOLOv5的水下鱼蟹检测算法
12
作者 顾寅武 王玉周 +3 位作者 张舜尧 马海亮 马一鸣 宋雪桦 《江苏大学学报(自然科学版)》 北大核心 2025年第4期402-408,共7页
针对现有水下检测品种单一,目标密集导致检测准确率低等问题,提出一种基于改进的YOLOv5算法RSC-YOLOv5.在主干网络(Backbone)中使用RepVGG Block模块,以提高不同尺度目标的识别精度,同时提升推理速度;添加SA(shuffle attention)注意力... 针对现有水下检测品种单一,目标密集导致检测准确率低等问题,提出一种基于改进的YOLOv5算法RSC-YOLOv5.在主干网络(Backbone)中使用RepVGG Block模块,以提高不同尺度目标的识别精度,同时提升推理速度;添加SA(shuffle attention)注意力模块来增加算法的特征提取能力;在多尺度特征融合模块(Neck)中使用内容感知特征重组(CARAFE)上采样,以获得更大的感受野;引入Varifocal Loss,以在密集目标样本训练中更加关注高质量的正样本.试验结果表明:RSC-YOLOv5鱼蟹检测算法均值平均精度为93.6%,对水下鱼蟹检测有很好的效果. 展开更多
关键词 鱼蟹检测 识别精度 特征提取 YOLOv5 repvgg Block
在线阅读 下载PDF
面向目标检测的红外与可见光图像融合
13
作者 陈坤亚 刘俊 《激光与红外》 北大核心 2025年第7期1121-1127,共7页
针对现有的红外与可见光图像融合算法对源图像的细节特征提取不够充分,以及未能考虑融合网络和检测网络之间的关系等问题。文中提出了一种基于RepVGG的改进的红外与可见光图像融合算法。算法首先采用PIAfusion的网络架构。将该网络架构... 针对现有的红外与可见光图像融合算法对源图像的细节特征提取不够充分,以及未能考虑融合网络和检测网络之间的关系等问题。文中提出了一种基于RepVGG的改进的红外与可见光图像融合算法。算法首先采用PIAfusion的网络架构。将该网络架构中图像特征提取部分的卷积块和特征重建卷积块部分替换为RepVGG卷积块。然后YOLOv5检测网络检测融合图像。YOLOv5用于构建检测损失。然后,利用检测损失通过反向传播指导融合网络的训练。使融合网络输出的融合图像能够更加容易被检测模型检测。最后得到融合网络输出的融合图像在YOLOv5检测网络的检测结果。对比现有的融合方法,从客观指标和YOLOv5的检测结果来看,所提方法获得的融合图像效果较好。 展开更多
关键词 红外与可见光 repvgg PIAfusion YOLOv5 M3FD
在线阅读 下载PDF
改进YOLOv8的轻量化车辆目标检测算法研究
14
作者 蒋康 孙仁云 +2 位作者 李卓霖 张国灏 刘金庆 《重庆理工大学学报(自然科学)》 北大核心 2025年第7期35-42,共8页
提出了一种改进YOLOv8的车辆目标改进算法,采用改进的REPELAN模块替换C2f模块,以减少参数量,实现模型轻量化。使用一种轻量化共享卷积检测头(LSCD head)取代原始检测头,在减小模型的基础上提高精度。在骨干网络中引入坐标注意力机制,以... 提出了一种改进YOLOv8的车辆目标改进算法,采用改进的REPELAN模块替换C2f模块,以减少参数量,实现模型轻量化。使用一种轻量化共享卷积检测头(LSCD head)取代原始检测头,在减小模型的基础上提高精度。在骨干网络中引入坐标注意力机制,以提高对车辆目标的检测性能。使用WISE-IoU损失函数替换YOLOv8网络中的原CIOU损失函数,以加快网络收敛速度。使用处理后的KITTI和SODA10M数据集进行实验。结果表明,改进后的算法相比YOLOv8n,mAP0.5、mAP0.5~95、召回率和精确率分别提升了1.4%、1.0%、1.8%和1.2%,计算量、参数量、模型体积分别减少37.0%、46.7%、46.8%,有效实现了模型轻量化和性能的平衡,并具有良好的泛化能力,满足了在计算资源受限环境下的部署需求。 展开更多
关键词 车辆检测 轻量化 YOLOv8 repvgg 坐标注意力机制 Wise-IoU
在线阅读 下载PDF
面向铁路领域的多方言免切换语音识别方法
15
作者 杨立鹏 胡从刚 +3 位作者 陈华龙 韩可可 刘峰 张志科 《中国铁路》 北大核心 2025年第1期30-39,共10页
随着铁路智能客服系统的持续发展,现有语音识别模型的准确率已达到较高水平,但面对铁路领域术语和多样化方言场景,其语音识别效果仍然较差,因此提出1种融合铁路领域知识的多方言免切换语音识别方法。基于RepVGG网络模型构建方言语种识别... 随着铁路智能客服系统的持续发展,现有语音识别模型的准确率已达到较高水平,但面对铁路领域术语和多样化方言场景,其语音识别效果仍然较差,因此提出1种融合铁路领域知识的多方言免切换语音识别方法。基于RepVGG网络模型构建方言语种识别器,以获取语种信息;对Transformer语音识别模型进行改进,通过在编码器中融合注意力机制的语种残差模块,并在解码器中嵌入语种信息,以实现多方言免切换功能;基于LSTM网络模型在铁路文本语料库上训练铁路领域专用的语言模型,并将其与改进的Transformer模型进行融合,以提升对铁路术语的识别准确率;在自建数据集上对所提方法进行实验验证,结果表明:所提方法在粤语、四川话和普通话上的识别准确率均超过90%,且有效提升对铁路领域术语的识别性能,具有一定应用价值。 展开更多
关键词 铁路领域语言模型 多方言 语音识别 repvgg TRANSFORMER LSTM
在线阅读 下载PDF
YOLO-LCR:X光违禁品检测模型
16
作者 倪东海 段先华 +1 位作者 陶宇诚 卢开喜 《计算机工程与设计》 北大核心 2025年第9期2480-2486,共7页
针对目前主流X光违禁品检测模型太过于庞大,无法应用在小型安检设备等问题,提出了一种基于YOLOv7改进得到的X光违禁品检测模型YOLO-LCR。设计信道洗牌重参数化卷积模块(channel-reduced shuffle concat moudle,CRSC)提升整体训练精度以... 针对目前主流X光违禁品检测模型太过于庞大,无法应用在小型安检设备等问题,提出了一种基于YOLOv7改进得到的X光违禁品检测模型YOLO-LCR。设计信道洗牌重参数化卷积模块(channel-reduced shuffle concat moudle,CRSC)提升整体训练精度以及降低网络参数量。引入重参数化卷积神经网络(RepVGG)。修改头部部分,引入空间金字塔池化分解模块(spatial pyramid pooling factorization,SPPF)并且删除了对于小目标分支的检测模块,在保障精度的前提下大幅降低网络参数量和网络训练时所需的显存大小。在SIXray数据集的基础上YOLO-LCR精度比基准模型提升了1.40%、参数量下降了24.06 M、检测速度达到231张每秒。 展开更多
关键词 X光安检 目标检测 YOLOv7 RCS-OSA repvgg 轻量化 卷积神经网络
在线阅读 下载PDF
基于YOLOv6的输电线路电力部件识别及缺陷检测算法研究 被引量:13
17
作者 游越 伊力哈木·亚尔买买提 吐松江·卡日 《高压电器》 CAS CSCD 北大核心 2024年第5期194-205,213,共13页
在输电线路巡检中,关键电力部件经常会出现锈蚀、脱落等缺陷,从而造成误检、漏检问题,导致人力成本大大增加。文中针对此类问题,提出一种基于YOLOv6的改进算法,主要在neck部分增加了RepFPN结构,额外的增加了一个自底向上的路径聚合网络... 在输电线路巡检中,关键电力部件经常会出现锈蚀、脱落等缺陷,从而造成误检、漏检问题,导致人力成本大大增加。文中针对此类问题,提出一种基于YOLOv6的改进算法,主要在neck部分增加了RepFPN结构,额外的增加了一个自底向上的路径聚合网络,从而增强输出特征的表达能力,提升模型性能,然而增加了计算成本。为了降低计算量,增加了RepVGG结构,它有着类似残差的结构,拥有丰富的梯度信息,经实验数据表明,当使用3个RepVGG结构替代C3层时,会提升1~2点精度;同时将ConvBNAct的算子进行融合后,只需要采用一个Conv+inplace activation就可以完成原有的3次Op计算,绝大多数情况下还能得到一致的数值结果,缓解了上述改进增加计算量的问题。实验表明,改进后的模型mAP_0.5:0.95提高了12%,精确度提高了3.9%,各项loss值显著降低,同时很好地检测出了电力部件各种缺陷以及输电线路上的异物。 展开更多
关键词 输电线路巡检 缺陷检测 YOLOv6 repvgg ConvBNAct
在线阅读 下载PDF
基于YOLOv8改进的服装疵点检测算法 被引量:11
18
作者 鲍禹辰 徐增波 田丙强 《东华大学学报(自然科学版)》 CAS 北大核心 2024年第4期49-56,共8页
针对服装疵点检测方法,提出了基于YOLOv8改进的算法YOLOv8-MBRGA,用于完成服装疵点的检测任务。引入BiFPN金字塔替换head层中的concat连接,将语义信息传递到不同的特征尺度上,从而增强特征融合。为加速模型的收敛速度和推理速度,在检测... 针对服装疵点检测方法,提出了基于YOLOv8改进的算法YOLOv8-MBRGA,用于完成服装疵点的检测任务。引入BiFPN金字塔替换head层中的concat连接,将语义信息传递到不同的特征尺度上,从而增强特征融合。为加速模型的收敛速度和推理速度,在检测头上增加RepVGG网络,有助于更好地训练深层次的网络模型。采用分离卷积替换Conv卷积降低网络的复杂度并融入注意力机制EffectiveSE增强模型的特征提取和多尺度信息融合的能力。试验结果表明,YOLOv8-MBRGA算法在服装疵点检测上获得了显著的效果,平均精度均值提高了5.50%,精确度提高11.06%,在推理速度基本保持不变的情况下,模型的计算量下降30.48%。 展开更多
关键词 服装疵点 BiFPN金字塔 repvgg网络 YOLOv8
在线阅读 下载PDF
基于Conformer的端到端语音识别方法 被引量:3
19
作者 胡从刚 申艺翔 +1 位作者 孙永奇 赵思聪 《计算机应用研究》 CSCD 北大核心 2024年第7期2018-2024,共7页
针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构,增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将... 针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构,增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将多分支融合为单分支,以降低计算复杂度、加快模型推理速度。然后,利用基于压缩和激励网络的通道注意力机制弥补缺失的通道特征信息,以提高语音识别准确率。最后,在公开数据集Aishell-1上的实验结果表明:相较于Conformer,所提出方法的字错误率降低了10.67%,验证了方法的先进性。此外,RepVGG-SE声学输入网络能够有效提高多种Transformer变体的端到端语音识别模型的整体性能,具有很好的泛化能力。 展开更多
关键词 语音识别 CONFORMER repvgg 压缩和激励网络
在线阅读 下载PDF
基于改进YOLO v8的轻量化玉米害虫识别方法 被引量:6
20
作者 李志良 李梦霞 +1 位作者 董勇 李龙 《江苏农业科学》 北大核心 2024年第14期196-206,共11页
针对目前玉米害虫识别领域中识别算法参数量大、计算量大导致玉米害虫识别算法不能部署在移动智慧农业设备中及玉米害虫识别算法检测精度低等问题,基于网络复杂程度最小的YOLO v8n,提出一种轻量化玉米害虫识别算法YOLO v8n-ERM。首先,... 针对目前玉米害虫识别领域中识别算法参数量大、计算量大导致玉米害虫识别算法不能部署在移动智慧农业设备中及玉米害虫识别算法检测精度低等问题,基于网络复杂程度最小的YOLO v8n,提出一种轻量化玉米害虫识别算法YOLO v8n-ERM。首先,在骨干特征提取网络引入EfficientNet-B0轻量化网络,通过对神经网络模型进行缩放,采用深度可分离卷积,有效降低了模型参数量、计算量;在颈部网络中引入RepVGG结构重参数化模块,融合多分支特征以提升模型的检测精度,同时有效降低模型的计算量;最后,用MPDIoU损失函数替换原损失函数,使最终预测框更接近真实框。用本研究算法处理数据增强后的IP102数据集,结果表明,相较于基线模型YOLO v8n,YOLO v8n-ERM算法的参数量为2.4 M,计算量为3.7 GFLOPs,二者分别下降了0.6 M、4.4 GFLOPs,而且YOLO v8n-ERM算法的mAP@0.5、mAP@0.5∶0.95分别为91.8%、62.0%,相较于基线模型分别提升了3.6、2.1百分点,表明使用更少的参数量、计算量得到了更高的精度。另外在黑暗、有遮挡、个体重叠及害虫与环境背景相似的复杂环境下的处理结果表明,YOLO v8n-ERM算法能够准确识别出玉米害虫个体,极大降低了复杂环境下的漏检率,具有一定的鲁棒性,可为玉米病虫害的数字智能防控提供技术支持。 展开更多
关键词 玉米害虫识别 YOLO v8 EfficientNet-B0 repvgg MPDIoU
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部