期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于跨层连接与多尺度自注意的金属表面缺陷检测 被引量:1
1
作者 朱生升 王炎 刘锁兰 《计算机工程与设计》 北大核心 2025年第8期2396-2402,共7页
针对特征提取中池化下采样导致的信息损失影响检测精度问题,提出了一种融合跨层连接与多尺度自注意机制的缺陷检测模型。跨层连接模块通过融合深浅层特征,以弥补因池化导致的信息丢失。同时,多尺度自注意模块捕获多尺度特征,增强模型学... 针对特征提取中池化下采样导致的信息损失影响检测精度问题,提出了一种融合跨层连接与多尺度自注意机制的缺陷检测模型。跨层连接模块通过融合深浅层特征,以弥补因池化导致的信息丢失。同时,多尺度自注意模块捕获多尺度特征,增强模型学习和获取缺陷特征的能力。在KSDD、KSDD2和STEEL数据集上,测试结果均有一定程度提升。KSDD2数据集上与最新的算法对比,在图像级标注下精度(AP)提升了11.7%,在像素级标注下精度(AP)提升了1.0%,实验结果表明了所提方法的有效性。 展开更多
关键词 深度学习 缺陷检测 连接 多尺度 自注意 卷积神经网络 特征提取
在线阅读 下载PDF
基于边缘特征融合和跨连接的车道线语义分割神经网络 被引量:10
2
作者 庞彦伟 修宇璇 《天津大学学报(自然科学与工程技术版)》 EI CSCD 北大核心 2019年第8期779-787,共9页
无人驾驶中的车道线检测任务需要同时确定车道线的位置、颜色和线型,而现有方法通常仅识别车道线的位置,不识别车道线的类型.为了端到端地解决这一问题,设计了一种语义分割神经网络,将一幅图像中不同车道线分割为不同区域,用每个区域的... 无人驾驶中的车道线检测任务需要同时确定车道线的位置、颜色和线型,而现有方法通常仅识别车道线的位置,不识别车道线的类型.为了端到端地解决这一问题,设计了一种语义分割神经网络,将一幅图像中不同车道线分割为不同区域,用每个区域的类别标签表示其对应的车道线类型.首先,在主流的编码器-解码器框架下,构建了一个结构较为简单的基础网络.考虑到边缘特征是车道线检测中的重点,为基础网络的编码器并联了一个边缘特征提取子网络,通过逐层融合边缘特征图和原始特征图增强车道线的特征.边缘特征提取子网络的结构与基础网络的编码器相同,其输入是对车道线图像进行Sobel滤波的结果.此外,编码器和解码器对称位置的卷积层输出的特征图尺寸相同,但具有不同的语义层级.为了更好地利用这一特性,建立从编码器到解码器对称位置的跨连接,在解码器逐层上采样的过程中融合编码器对应尺寸的特征图.在TSD-Lane车道线检测数据集上的实验表明,相比于基础网络,基于边缘特征融合和跨连接的神经网络的分割性能得到了较为显著的提高.该网络具有较好的车道线分割性能,能够在确定车道线位置的同时,区分黄线或白线、虚线或实线.在计算资源充足的前提下,该网络能够达到实时的检测速度. 展开更多
关键词 车道线检测 语义分割 边缘特征 连接 神经网络
在线阅读 下载PDF
基于跨连接LeNet-5网络的面部表情识别 被引量:103
3
作者 李勇 林小竹 蒋梦莹 《自动化学报》 EI CSCD 北大核心 2018年第1期176-182,共7页
为避免人为因素对表情特征提取产生的影响,本文选择卷积神经网络进行人脸表情识别的研究.相较于传统的表情识别方法需要进行复杂的人工特征提取,卷积神经网络可以省略人为提取特征的过程.经典的LeNet-5卷积神经网络在手写数字库上取得... 为避免人为因素对表情特征提取产生的影响,本文选择卷积神经网络进行人脸表情识别的研究.相较于传统的表情识别方法需要进行复杂的人工特征提取,卷积神经网络可以省略人为提取特征的过程.经典的LeNet-5卷积神经网络在手写数字库上取得了很好的识别效果,但在表情识别中识别率不高.本文提出了一种改进的LeNet-5卷积神经网络来进行面部表情识别,将网络结构中提取的低层次特征与高层次特征相结合构造分类器,该方法在JAFFE表情公开库和CK+数据库上取得了较好的结果. 展开更多
关键词 卷积神经网络 面部表情识别 特征提取 连接
在线阅读 下载PDF
金字塔底层市场的跨部门合作网络研究述评 被引量:5
4
作者 邢小强 彭瑞梅 仝允桓 《华东经济管理》 CSSCI 2014年第8期143-148,共6页
金字塔底层(BOP)市场由全球广大的低收入群体构成,蕴含着尚未发掘的巨大财富,而企业在该市场内进行商业创新时与政府部门、非营利机构、社区组织与穷人自身等非传统组织与个体形成的跨部门合作网络是实现多元价值创造与分享的关键组织... 金字塔底层(BOP)市场由全球广大的低收入群体构成,蕴含着尚未发掘的巨大财富,而企业在该市场内进行商业创新时与政府部门、非营利机构、社区组织与穷人自身等非传统组织与个体形成的跨部门合作网络是实现多元价值创造与分享的关键组织形式。文章结合相关文献对BOP市场的跨部门合作网络的内涵、形成动因、网络特征与绩效产出等方面进行归纳与阐述,提出后续研究的重点与方向。 展开更多
关键词 金字塔底层市场 部门合作网络 网络特征 网络治理 网络绩效
在线阅读 下载PDF
基于跨连特征融合网络的面部表情识别 被引量:5
5
作者 黄倩露 王强 《计算机工程与设计》 北大核心 2019年第10期2969-2973,共5页
传统神经网络特征单向处理难以有效利用高层抽象特征和低层细节特征,不能获得更多有用信息,为此提出跨连特征融合神经网络(cross-connected feature fuse,CFF)模型,进一步提高面部表情分类的准确率。在AlexNet卷积神经网络的基础上,通... 传统神经网络特征单向处理难以有效利用高层抽象特征和低层细节特征,不能获得更多有用信息,为此提出跨连特征融合神经网络(cross-connected feature fuse,CFF)模型,进一步提高面部表情分类的准确率。在AlexNet卷积神经网络的基础上,通过结合低层池化层与高层池化层中的特征,获取更多全面、细致的表情特征信息,使用矩阵的方式表示模型处理过程。在REN_VFEdb面部表情数据库上的实验结果表明,CFF的分类准确率为93.56%,比AlexNet卷积神经网络提高了1.12%。 展开更多
关键词 面部表情识别 卷积神经网络 特征融合 AlexNet 连接
在线阅读 下载PDF
基于多尺度特征融合和密集连接网络的疏果期黄花梨植株图像分割 被引量:3
6
作者 魏超宇 韩文 +1 位作者 庞程 刘辉军 《江苏农业学报》 CSCD 北大核心 2021年第4期990-997,共8页
由于自然环境下果蔬植株的果实、枝干和叶片等目标尺度不一、边缘不规则,因此造成其准确分割较为困难。针对该问题,提出1种多尺度特征融合和密集连接网络(Multi-scale feature fusion and dense connection networks,MDNet)以实现黄花... 由于自然环境下果蔬植株的果实、枝干和叶片等目标尺度不一、边缘不规则,因此造成其准确分割较为困难。针对该问题,提出1种多尺度特征融合和密集连接网络(Multi-scale feature fusion and dense connection networks,MDNet)以实现黄花梨疏果期植株图像的准确分割。在研究中借鉴了编码-解码网络,其中编码网络采用DenseNet对多层特征进行复用和融合,以改善信息传递方式;解码网络使用转置卷积进行上采样,结合跳层连接融合浅层细节信息与深层语义信息;在编码、解码之间加入空洞空间金字塔池化(Atrous spatial pyramid pooling,ASPP)用于提取不同感受野的特征图以融合多尺度特征,聚合上下文信息。结果表明,ASPP有效提高了模型的分割精度,MDNet在测试集上的平均局域重合度(MIoU)为77.97%,分别较SegNet、Deeplabv2和DNet提高了8.10个、5.77个和2.17个百分点,果实、枝干和叶片的像素准确率分别为93.57%、90.31%和95.43%,实现了黄花梨植株果实、枝干和叶片等目标的准确分割。在翠冠梨植株图像的独立测试中,MIoU为70.93%,表明该模型具有较强的泛化能力,对自然环境下果蔬植株图像的分割有一定的参考价值。 展开更多
关键词 黄花梨植株 多尺度特征融合 密集连接网络 图像分割 空洞空间金字塔池化(ASPP) 感受野
在线阅读 下载PDF
基于跨模态注意力融合的煤炭异物检测方法 被引量:5
7
作者 曹现刚 李虎 +3 位作者 王鹏 吴旭东 向敬芳 丁文韬 《工矿自动化》 CSCD 北大核心 2024年第1期57-65,共9页
为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采... 为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采用浅层的特征提取策略提取Depth图像的低级特征,用深度边缘与深度纹理等基础特征辅助RGB图像深层特征,以有效获得2种特征的互补信息,从而丰富异物特征的空间与边缘信息,提高检测精度;构建了基于坐标注意力与改进空间注意力的跨模态注意力融合模块(CAFM),以协同优化并融合RGB特征与Depth特征,增强网络对特征图中被遮挡异物可见部分的关注度,提高被遮挡异物检测精度;使用区域卷积神经网络(R-CNN)输出煤炭异物的分类、回归与分割结果。实验结果表明:在检测精度方面,该方法的AP相较两阶段模型中较优的Mask transfiner高3.9%;在检测效率方面,该方法的单帧检测时间为110.5 ms,能够满足异物检测实时性需求。基于跨模态注意力融合的煤炭异物检测方法能够以空间特征辅助色彩、形状与纹理等特征,准确识别煤炭异物之间及煤炭异物与输送带之间的差异,从而有效提高对复杂特征异物的检测精度,减少误检、漏检现象,实现复杂特征下煤炭异物的精确检测与像素级分割。 展开更多
关键词 煤炭异物检测 实例分割 特征金字塔网络 模态注意力融合 Depth图像 坐标注意力 改进空间注意力
在线阅读 下载PDF
基于全局位置信息和残差特征融合的SAR船舶检测算法 被引量:4
8
作者 方小宇 黄丽佳 《系统工程与电子技术》 EI CSCD 北大核心 2024年第3期839-848,共10页
针对合成孔径雷达(synthetic aperture radar,SAR)图像船舶目标尺度不一且易受海面、地面杂波和相干斑噪声的影响,难以提取目标多维特征且特征融合过程中易产生语义歧义,造成船舶目标检测率低,虚警率高的问题,提出一个基于全局位置信息... 针对合成孔径雷达(synthetic aperture radar,SAR)图像船舶目标尺度不一且易受海面、地面杂波和相干斑噪声的影响,难以提取目标多维特征且特征融合过程中易产生语义歧义,造成船舶目标检测率低,虚警率高的问题,提出一个基于全局位置信息和残差特征融合的SAR船舶目标检测算法。基于Faster区域卷积神经网络(region convolutional neural network,R-CNN)目标检测算法,在特征提取网络和特征融合网络中进行改进:在特征提取网络中使用高宽注意力机制提取目标在图像中的全局位置信息,增强目标的多维特征提取能力;在特征融合网络中使用带有残差连接的双向特征金字塔网络削弱特征融合过程中的语义歧义,降低复杂背景下的船舶目标虚警率,同时进行不同层级的多尺度特征双向融合,增强高低层特征的联系,提升多尺度船舶目标的检测能力。在SAR船舶数据集上达到98.2%的均值平均精度,超过部分算法2.4%以上。实验表明,所提算法有效提取了目标的多维特征,显著缓解了语义歧义问题,具有较好的检测能力和泛化能力。 展开更多
关键词 合成孔径雷达 船舶检测 注意力机制 特征金字塔网络 残差连接
在线阅读 下载PDF
基于跳跃连接金字塔模型的小目标检测 被引量:7
9
作者 单义 杨金福 +1 位作者 武随烁 许兵兵 《智能系统学报》 CSCD 北大核心 2019年第6期1144-1151,共8页
随着深度学习的发展,目标检测已经获得了较高的精度和效率。但是小目标的检测仍然是一个挑战。小目标检测准确率较低的重要原因是没有充分利用高层特征的语义信息和低层特征的细节信息之间的关系。针对上述问题,本文提出一种基于跳跃连... 随着深度学习的发展,目标检测已经获得了较高的精度和效率。但是小目标的检测仍然是一个挑战。小目标检测准确率较低的重要原因是没有充分利用高层特征的语义信息和低层特征的细节信息之间的关系。针对上述问题,本文提出一种基于跳跃连接金字塔模型的小目标检测方法。与其他的目标检测方法不同,本文提出利用跳跃连接金字塔结构来融合多层高层语义特征信息和低层特征图的细节信息。而且为了更好地提取不同尺度物体对应的特征信息,在网络模型中采用不同大小的卷积核和不同步长的空洞卷积来提取全局特征信息。在PASCAL VOC和MS COCO数据集上进行了实验,验证了算法的有效性。 展开更多
关键词 跳跃连接金字塔 全局感受野 目标检测 深度学习 特征提取 卷积神经网络 空洞卷积 图像处理
在线阅读 下载PDF
融合多尺度特征的遮挡番茄病害图像识别研究 被引量:4
10
作者 黄晓宇 张聪 陈晓玲 《中国农机化学报》 北大核心 2024年第7期194-200,共7页
针对复杂环境下因叶片重叠遮挡以及目标较小等原因而导致番茄病害识别准确率较低的问题,提出一种多尺度级联模型(IMS-Cascade)。该模型以级联神经网络(Cascade R-CNN)为基础,在主干网络中引入融合上下文信息的可切换空洞卷积,使用复杂... 针对复杂环境下因叶片重叠遮挡以及目标较小等原因而导致番茄病害识别准确率较低的问题,提出一种多尺度级联模型(IMS-Cascade)。该模型以级联神经网络(Cascade R-CNN)为基础,在主干网络中引入融合上下文信息的可切换空洞卷积,使用复杂的多尺度卷积核提取目标特征,解决同种病害因叶片遮挡而形状差异较大的问题,并在特征融合网络中添加反馈连接模块,使模型可以进行多次的特征提取,提高浅层信息的利用率。最后在损失函数上增大准确样本的梯度,降低异常样本对模型的影响。将该模型用于Plant Village公开发表的部分番茄叶病害数据集上,mAP达到89.1%,平均准确率达到99.36%,分别比原始Cascade R-CNN模型提高2.5%和1.84%,具有更高检测精度,有利于复杂环境下的番茄病害检测。 展开更多
关键词 番茄病害检测 反馈连接 特征金字塔网络 空洞卷积 多尺度
在线阅读 下载PDF
基于多尺度特征融合的红外单目测距算法 被引量:11
11
作者 刘斌 李港庆 +2 位作者 安澄全 王水根 王建生 《计算机应用》 CSCD 北大核心 2022年第3期804-809,共6页
由于MonoDepth2的提出,无监督单目测距在可见光领域取得了重大发展;然而在某些场景例如夜间以及一些低能见度的环境,可见光并不适用,而红外热成像可以在夜间和低能见度条件下获得清晰的目标图像,因此对于红外图像的深度估计显得尤为必... 由于MonoDepth2的提出,无监督单目测距在可见光领域取得了重大发展;然而在某些场景例如夜间以及一些低能见度的环境,可见光并不适用,而红外热成像可以在夜间和低能见度条件下获得清晰的目标图像,因此对于红外图像的深度估计显得尤为必要。由于可见光和红外图像的特性不同,直接将现有可见光单目深度估计算法迁移到红外图像是不合理的。针对该问题,对MonoDepth2算法进行改进,提出了基于多尺度特征融合的红外单目测距算法。针对红外图像低纹理的特性设计了一项新的损失函数边缘损失函数,旨在降低图像重投影时的像素误匹配。不同于以往的无监督单目测距单纯地将四个尺度的深度图统一上采样到原图像分辨率计算投影误差而忽略了尺度之间的关联性以及不同尺度之间的贡献差异,将加权的双向特征金字塔网络(BiFPN)应用于多尺度深度图的特征融合,解决了深度图边缘模糊问题。另外用跨阶段部分网络(CSPNet)替换残差网络(ResNet)结构,以降低网络复杂度并提高运算速度。实验结果表明,边缘损失更适合红外图像测距,使得深度图质量更高;在加入BiFPN结构之后,深度图像的边缘更加清晰;将ResNet替换为CSPNet之后,推理速度提高了大约20个百分点。该算法能够准确估计出红外图像的深度,解决夜间低光照场景以及一些低能见度场景下的深度估计难题;该算法的应用也可以在一定程度上降低汽车辅助驾驶的成本。 展开更多
关键词 无监督 单目测距 红外图像 双向特征金字塔网络 阶段部分网络
在线阅读 下载PDF
基于EESP与ODConv的多尺度轴承故障诊断方法
12
作者 任义 陈大鹏 +1 位作者 栾方军 袁帅 《机电工程》 北大核心 2025年第5期832-844,920,共14页
为了解决轴承故障诊断中多尺度特征提取准确性和稳定性不足的问题,提出了一种融合增强高效空间金字塔(EESP)与全维动态卷积(ODConv)的多尺度轴承诊断方法,即基于多尺度全维动态卷积网络(MSODConvNet)的轴承故障诊断模型。首先,采用了基... 为了解决轴承故障诊断中多尺度特征提取准确性和稳定性不足的问题,提出了一种融合增强高效空间金字塔(EESP)与全维动态卷积(ODConv)的多尺度轴承诊断方法,即基于多尺度全维动态卷积网络(MSODConvNet)的轴承故障诊断模型。首先,采用了基于EESP的空洞卷积金字塔模块,利用了多尺度空洞卷积结构增强了特征提取能力,有效地捕捉了不同尺度的特征信息,从而提升了模型对复杂信号的感知能力;其次,采用的ODConv模块使卷积核在多个维度上同时进行了高效运作,使用动态调整卷积核结构提升了模型的灵活性和适应性,使其能够更好地应对复杂数据中的多样化模式和特征;最后,在ODConv模块中引入了双跳跃连接机制,进一步强化了信息在深层网络中的传递效果,确保了特征信息的完整性和高效传递。研究结果表明:基于EESP和ODConv的多尺度模型在分类准确率方面得到较大的提高,在凯斯西储大学(CWRU)数据集上的准确率可达99.50%,表现出较高的准确性和稳定性,并在与其他对比方法的比较中展现出较高的优势。该研究可为工业设备的智能维护和故障诊断提供新的方法和思路,为实现更精确和更高效的故障诊断提供理论依据。 展开更多
关键词 轴承故障诊断 多尺度特征提取 增强高效空间金字塔 多尺度全维动态卷积网络 双跳跃连接机制 故障诊断模型
在线阅读 下载PDF
复杂环境下的路面交通标线检测与分割方法
13
作者 顾宗文 吴志周 +2 位作者 徐里鹏 朱陈强 梁韵逸 《计算机工程与应用》 北大核心 2025年第14期274-285,共12页
针对数字化交通标线损伤诊断数据需求,提出了基于Mask R-CNN的FE-Mask R-CNN模型,通过目标检测与实例分割,获得损伤交通标线及其对应的修复图像。采集了复杂环境下的交通标线数据集,根据数据集的大小及分析数据中路面交通标线的环境特征... 针对数字化交通标线损伤诊断数据需求,提出了基于Mask R-CNN的FE-Mask R-CNN模型,通过目标检测与实例分割,获得损伤交通标线及其对应的修复图像。采集了复杂环境下的交通标线数据集,根据数据集的大小及分析数据中路面交通标线的环境特征,将Mask R-CNN主干替换为改进的VGG16。构建了跨层连接的特征金字塔(cross-linking FPN)网络,使模型能自适应实现不同特征层权重融合,挖掘不同特征层之间的重要性信息。在每一特征层提取网络中添加了efficient channel attention(ECA)注意力机制,以捕捉不同通道之间的关系,增强了模型在复杂环境下的特征提取能力。实验结果表明,采用改进的VGG16,参数量较原模型降低了21.18%;采用cross-linking FPN网络及改进后的Mask R-CNN模型,在低阈值(IoU=0.5)下,目标检测和语义分割精度分别为97.93%、98.7%、97.74%、97.8%;在高阈值(IoU=0.75)下,目标检测和语义分割精度分别为95.56%、97.90%、81.48%、92.0%;检测速度由33 FPS降低至24 FPS。相对于低阈值分割精度提升效果,高阈值下的分割精度的大幅提升,为图像的高精度修复提供了数据基础。 展开更多
关键词 复杂环境 目标检测 实例分割 损伤交通标线 改进的VGG16 连接特征金字塔 注意力机制
在线阅读 下载PDF
成像制导运动模糊目标检测算法
14
作者 赵春博 莫波 +1 位作者 李大维 赵洁 《兵工学报》 北大核心 2025年第2期265-274,共10页
为提升弹载成像制导中运动模糊图像目标检测的精确性与效率,提出一种轻量化且高效的运动模糊图像目标检测(Lighter and More Effective Motion-blurred Image Object Detection,LEMBD)网络。通过深入分析运动模糊图像的成因,基于成像机... 为提升弹载成像制导中运动模糊图像目标检测的精确性与效率,提出一种轻量化且高效的运动模糊图像目标检测(Lighter and More Effective Motion-blurred Image Object Detection,LEMBD)网络。通过深入分析运动模糊图像的成因,基于成像机理构建了专用的运动模糊图像数据集。在不增加网络参数的前提下,采用共享权重的孪生网络设计,并引入先验知识,将清晰图像的特征学习用于模糊图像的特征提取,以同时实现对清晰与模糊图像的精准检测。此外,设计了部分深度可分离卷积替代普通卷积,显著减少了网络的参数量与计算量,并提升了学习性能。为进一步优化特征融合质量,提出跨层路径聚合特征金字塔网络,有效利用低级特征的细节信息和高级特征的语义信息。实验结果表明,所提LEMBD网络在运动模糊图像目标检测任务中的性能优于传统目标检测方法和主流运动模糊检测算法,能够为精确制导任务提供更精准的目标相对位置信息。 展开更多
关键词 精确目标检测 运动模糊 轻量化 部分深度可分离卷积 层路径聚合特征金字塔网络
在线阅读 下载PDF
结合优化U⁃Net和残差神经网络的单通道语音增强算法 被引量:7
15
作者 许春冬 徐琅 周滨 《现代电子技术》 2022年第9期35-40,共6页
语音增强的目的是从带噪语音中恢复出干净的语音信号,为了解决现有深度神经网络中语音增强算法不稳定,语音增强效果不理想的问题,提出一种改进的U⁃Net网络与残差神经网络相结合的语音增强算法。首先,该方法构建了一个基于U⁃Net网络的端... 语音增强的目的是从带噪语音中恢复出干净的语音信号,为了解决现有深度神经网络中语音增强算法不稳定,语音增强效果不理想的问题,提出一种改进的U⁃Net网络与残差神经网络相结合的语音增强算法。首先,该方法构建了一个基于U⁃Net网络的端到端的语音增强模型;然后在该模型的编解码块中引入残差单元,将残差神经网络结构的跨层连接和拟合残差项应用到模型训练中,该方法更有利于恢复目标语音的细节特征信息,增强了模型训练的稳定性,提高了模型的特征提取能力和训练效率,改进后的Residual⁃U⁃Net网络模型能够实现更优的语音增强效果。仿真实验结果表明:与现有的其他几种语音增强方法相比,文中所提出的Residual⁃U⁃Net算法更有效地实现了语音增强,此外,该算法具有良好的去噪效果,进一步提高了语音信号的质量及其可懂度。 展开更多
关键词 语音增强 深层神经网络 U⁃Net 残差神经网络 连接 模型训练 残差单元引入 特征提取
在线阅读 下载PDF
融合优化特征提取结构的目标检测算法 被引量:2
16
作者 向南 潘传忠 虞高翔 《计算机应用》 CSCD 北大核心 2022年第11期3558-3563,共6页
针对DETR对小目标的检测精度低的问题,基于DETR提出一种优化特征提取结构的目标检测算法——CF⁃DETR。首先通过结合了优化跨阶段部分(CSP)网络的CSP⁃Darknet53对原始图进行特征提取并输出4种尺度的特征图;其次利用特征金字塔网络(FPN)对... 针对DETR对小目标的检测精度低的问题,基于DETR提出一种优化特征提取结构的目标检测算法——CF⁃DETR。首先通过结合了优化跨阶段部分(CSP)网络的CSP⁃Darknet53对原始图进行特征提取并输出4种尺度的特征图;其次利用特征金字塔网络(FPN)对4种尺度特征图进行下采样和上采样后进行拼接融合,并输出52×52尺寸的特征图;最后将该特征图与位置编码信息结合输入Transformer后得到特征序列,输入到作为预测头的前向反馈网络后输出预测目标的类别与位置信息。在COCO2017数据集上,与DETR相比,CF⁃DETR的模型的超参数量减少了2×10^(6),在小目标上的平均检测精度提高2.1个百分点,在中、大尺寸目标上的平均检测精度提高了2.3个百分点。实验结果表明,优化特征提取结构能够在降低模型超参数量的同时有效提高DETR的检测精度。 展开更多
关键词 目标检测 小目标 DETR算法 特征提取 阶段部分网络 特征金字塔网络 TRANSFORMER
在线阅读 下载PDF
基于CSPNet-YOLOv7目标检测算法的煤矸图像识别模型 被引量:10
17
作者 韦小龙 王方田 +2 位作者 何东升 刘超 徐大连 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第S01期238-248,共11页
煤矸识别技术是矿井智能化建设的关键技术之一,针对工作面低照度高粉尘环境造成的煤矸识别模型精度不高以及小目标煤矸难以识别的问题,提出一种基于CSPNet-YOLOv7目标检测算法的煤矸图像识别模型。采用跨阶段部分网络(Cross Stage Parti... 煤矸识别技术是矿井智能化建设的关键技术之一,针对工作面低照度高粉尘环境造成的煤矸识别模型精度不高以及小目标煤矸难以识别的问题,提出一种基于CSPNet-YOLOv7目标检测算法的煤矸图像识别模型。采用跨阶段部分网络(Cross Stage Partial Network,CSPNet)改进YOLOv7模型的主干特征提取网络,优化梯度信息减少网络参数,同时采用递归特征金字塔(Recursive Feature Pyr-amid,RFP)和可切换卷积(Switchable Auto Convolution,SAC)替换颈部特征提取网络中简单的上下采样和普通卷积模块,并采用3次迁移训练进行不同宽度和深度的特征学习,增强网络的泛化能力。试验结果表明,CSPNet-YOLOv7模型的平均精度均值为97.53%,准确率为92.24%,召回率为97.91%,F1得分为0.95,模型的参数量为30.85×10^(6),浮点运算次数为42.15×10^(9),每秒传输帧数为24.37 f/s,与YOLOv7模型相比,平均精度均值提高了7.46%,参数量和浮点运算次数分别降低了17.23%和60.41%,相较于FasterRCNN-Resnet50、YOLOv3、YOLOv4、MobileNet V2-YOLOv4、YOLOv4-VGG、YOLOv5s模型、CSPNet-YOLOv7模型对煤矸识别的平均精度均值最高,同时参数量和浮点运算次数较小,在识别精度和速度之间有着较好的平衡。最后,通过井下现场试验验证了CSPNet-YOLOv7模型,为煤矸精准识别提供了有效技术手段。 展开更多
关键词 煤矸识别 YOLOv7 阶段部分网络 递归特征金字塔 可切换自动卷积 迁移学习
在线阅读 下载PDF
基于YOLOv8算法改进的小目标交通标志检测 被引量:1
18
作者 王斌 徐洪华 +1 位作者 孙兜成 俞泳帆 《计算机应用》 CSCD 北大核心 2024年第S2期274-279,共6页
为解决现有的目标检测模型在处理小目标交通标志时精度不足以及漏检率较高的问题,提出一种基于YOLOv8算法的改进型目标检测模型。首先,融合残差网络(ResNet)的设计理念,在Backbone中引入残差连接机制使模型更有效地整合多层特征信息,从... 为解决现有的目标检测模型在处理小目标交通标志时精度不足以及漏检率较高的问题,提出一种基于YOLOv8算法的改进型目标检测模型。首先,融合残差网络(ResNet)的设计理念,在Backbone中引入残差连接机制使模型更有效地整合多层特征信息,从而增强对小目标的识别能力;其次,逆转Neck部分的路径聚合特征金字塔网络(PAFPN)结构,提出I-PAFPN(Inverse PAFPN)结构,从而使网络更集中地捕捉目标的关键特征;再次,将原先的3级检测扩展为4级检测,使模型关注并更细致地提取小目标的特征,从而提高模型对小目标的敏感度;最后,引入WIoU(Wise Intersection over Union)损失函数弱化低质量样例对模型的影响,提高模型准确率。在数据增强后的TT100K(Tsinghua-Tencent 100K)数据集上的实验结果表明,经过改进的YOLOv8模型的mAP_(50)和mAP_(50:95)相较于原始的YOLOv8模型分别提高17.1和12.5个百分点,验证了改进YOLOv8模型在小目标交通标志检测方面的有效性和优越性。 展开更多
关键词 交通标志检测 小目标 YOLOv8 残差连接 路径聚合特征金字塔网络 WIoU
在线阅读 下载PDF
复杂背景下的SAR图像多尺度舰船检测 被引量:5
19
作者 林鑫伟 徐志京 黄海 《中国航海》 CSCD 北大核心 2023年第2期17-24,32,共9页
合成孔径雷达(Synthetic Aperture Radar,SAR)图像中复杂背景舰船目标的定位和检测,是SAR图像用于海洋监测的关键技术之一。提出一种基于跨连接特征金字塔网络(Cross Connected Feature Pyramid Networks,CCFPN)的SAR图像多尺度舰船目... 合成孔径雷达(Synthetic Aperture Radar,SAR)图像中复杂背景舰船目标的定位和检测,是SAR图像用于海洋监测的关键技术之一。提出一种基于跨连接特征金字塔网络(Cross Connected Feature Pyramid Networks,CCFPN)的SAR图像多尺度舰船目标检测算法,较好地解决了复杂背景下的多尺度目标检测问题。构建CCFPN增强舰船目标深层特征与浅层特征的传递;利用多路空洞卷积提高浅层特征提取能力;使用通道拼接方式丰富融合后特征图的信息量。所提出的算法在公开数据集的检测结果表明:该算法能够实现不同数据集复杂、模糊背景下的舰船多尺度目标检测,算法的平均精度(Average Precision,AP)达到95.62%,整体性能优于现有主流目标检测算法。 展开更多
关键词 舰船目标检测 跨连接特征金字塔网络 空洞卷积 通道特征融合 单次多框检测器
在线阅读 下载PDF
复杂场景下基于改进YOLOv3的口罩佩戴检测算法 被引量:57
20
作者 王艺皓 丁洪伟 +2 位作者 李波 杨志军 杨俊东 《计算机工程》 CAS CSCD 北大核心 2020年第11期12-22,共11页
新型冠状病毒可以通过呼吸道飞沫等方式传播,正确佩戴口罩可以有效防止病毒传染,但是自然场景中通常存在遮挡、密集人群和小尺度目标等复杂因素,对人脸佩戴口罩的检测效果产生影响。针对该问题,在YOLOv3算法的基础上,提出复杂场景下的... 新型冠状病毒可以通过呼吸道飞沫等方式传播,正确佩戴口罩可以有效防止病毒传染,但是自然场景中通常存在遮挡、密集人群和小尺度目标等复杂因素,对人脸佩戴口罩的检测效果产生影响。针对该问题,在YOLOv3算法的基础上,提出复杂场景下的口罩佩戴检测算法。结合跨阶段局部网络对DarkNet53骨干网络进行改进,以降低计算消耗并提高训练速度。在YOLOv3算法中引入改进的空间金字塔池化结构,通过自上而下和自下而上的特征融合策略优化多尺度预测网络,从而实现特征增强。选取CIoU作为损失函数,考虑目标与检测框之间的中心点距离、重叠率以及长宽比信息。实验结果表明,与YOLOv3算法相比,该算法在人脸目标和人脸佩戴口罩目标上的检测精度分别提高7.3%和14.9%,检测速度平均提高6FPS。 展开更多
关键词 YOLOv3算法 口罩佩戴检测 阶段局部网络 空间金字塔池化 特征融合 损失函数
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部