期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于特征分治与融合的铁路扣件轻量化实时检测模型
1
作者 鄢化彪 林初欣 +3 位作者 黄绿娥 李东丽 刘词波 徐方奇 《北京交通大学学报》 北大核心 2025年第3期56-67,共12页
为解决嵌入式设备实时处理海量铁路扣件视觉图像数据时无法兼顾精确度与检测速度的问题,提出一种基于特征分治与融合的轻量化实时检测模型.首先,利用基于空间与通道特征的分治混合注意力模块强化模型的特征提取能力,降低图像中复杂背景... 为解决嵌入式设备实时处理海量铁路扣件视觉图像数据时无法兼顾精确度与检测速度的问题,提出一种基于特征分治与融合的轻量化实时检测模型.首先,利用基于空间与通道特征的分治混合注意力模块强化模型的特征提取能力,降低图像中复杂背景对目标的干扰;其次,提出一种二重分治特征融合方法,提升对不同大小目标的检测能力,同时在检测头(YOLO Head)的代价体构建方面,引入可变焦距损失函数(Varifocal Loss,VFL)代替YOLOX-Nano检测头的二值交叉熵损失函数,提高轻量化实时检测的精度;再次,使用随机Alpha-IoU(RAL)损失函数动态调整参数,延缓算法的收敛速度从而优化模型的训练曲线,避免模型训练过程陷入局部最优解;最后,采集10233个检测目标并划分为6种类型,选择YOLOX-Nano、Faster R-CNN及YOLOv8n等主流目标检测模型作为对比进行实验.实验结果表明:所提模型的每秒帧数(Frames Per Second,FPS)为60.24,平均精度(Average Precision,AP)为83.40%,较基线模型提高了3.24%;参数量为2.31 M,较YOLOX-Tiny减少54.08%,浮点数计算量为1.99 G,较YOLOX-Tiny减少69.15%.研究成果可为轻量级实时检测模型与计算系统提供参考. 展开更多
关键词 轻量级嵌入式系统 分治混合注意力模块 分治特征融合 代价体构建
在线阅读 下载PDF
融合混合注意力的自编码器视频异常检测 被引量:3
2
作者 郑重 杨晓文 +3 位作者 谢剑斌 欧阳楠楠 忽欣谕 王晋涛 《计算机工程与设计》 北大核心 2024年第2期516-523,共8页
为提高视频异常检测的准确率,提出一种融合混合注意力的自编码器视频异常检测算法。针对自编码器网络强大的“泛化”能力可能重构异常行为问题,提出一种混合注意力模块(CSCFAM)并将其融合至编码器和解码器之间的跳跃连接层以限制异常行... 为提高视频异常检测的准确率,提出一种融合混合注意力的自编码器视频异常检测算法。针对自编码器网络强大的“泛化”能力可能重构异常行为问题,提出一种混合注意力模块(CSCFAM)并将其融合至编码器和解码器之间的跳跃连接层以限制异常行为的生成。为考虑正常样本的多样性,在编码器和解码器之间的瓶颈处引入存储记忆模块(Memory),记录正常样本潜在特征的原型模式。实验结果表明,该算法在UCSD Ped2、CUHK Avenue数据集上帧级AUC分别达到97.3%、87.0%,与当前先进的视频异常检测算法相比,异常检测能力得到有效提升。 展开更多
关键词 视频异常检测 自编码器 跳跃连接 混合注意力模块 存储记忆模块 异常行为 原型模式
在线阅读 下载PDF
PAW-YOLOv7:河道微小漂浮物检测算法 被引量:2
3
作者 栾庆磊 常昕昱 +3 位作者 吴叶 邓从龙 史艳琼 陈梓华 《光电工程》 CAS CSCD 北大核心 2024年第4期101-113,共13页
河道漂浮物检测对于船舶自动驾驶以及河道清理有着重大意义,但现有的方法在针对河道漂浮物目标尺寸小且互相遮挡、特征信息少时出现检测精度低等问题。为解决这些问题,本文基于YOLOv7,提出了一种改进模型PAWYOLOv7。首先,为了提高网络... 河道漂浮物检测对于船舶自动驾驶以及河道清理有着重大意义,但现有的方法在针对河道漂浮物目标尺寸小且互相遮挡、特征信息少时出现检测精度低等问题。为解决这些问题,本文基于YOLOv7,提出了一种改进模型PAWYOLOv7。首先,为了提高网络模型对小目标的特征表达能力,构建了小目标物体检测层,并将自注意力和卷积混合模块(ACmix)集成应用于新构建的小目标检测层;其次,为了减少复杂背景的干扰,采用全维动态卷积(ODConv)代替颈部的卷积模块,使网络具有捕获全局上下文信息能力;最后,将PConv(partial convolution)模块融入主干网络,替换部分标准卷积,同时采用WIoU(Wise-IoU)损失函数取代CIoU,实现网络模型计算量的降低,提高网络检测速度,同时增加对低质量锚框的聚焦能力,加快模型收敛速度。实验结果表明,PAW-YOLOv7算法在本文利用数据扩展技术改进的FloW-Img数据集上的检测精度达到89.7%,较原YOLOv7提升了9.8%,且检测速度达到54帧/秒(FPS),在自建的稀疏漂浮物数据集上的检测精度比YOLOv7提高了3.7%,能快速准确地检测河道微小漂浮物,同时也具有较好的实时检测性能。 展开更多
关键词 YOLOv7 漂浮物检测 混合卷积自注意力机制 全维动态卷积 Wise-IoU损失函数
在线阅读 下载PDF
基于残差混合注意力机制的脑部CT图像分类卷积神经网络模型 被引量:19
4
作者 乔思波 庞善臣 +3 位作者 王敏 翟雪 于世行 丁桐 《电子学报》 EI CAS CSCD 北大核心 2021年第5期984-991,共8页
针对阿尔兹海默症、病变(如脑肿瘤)和健康老化的3类脑部CT图像分类问题,本文提出了一种改进的ResNet-10卷积神经网络模型.该模型在网络的残差映射结构中加入残差混合注意力模块,解决了原模型提取的特征分辨性弱的问题,精确捕捉了脑部组... 针对阿尔兹海默症、病变(如脑肿瘤)和健康老化的3类脑部CT图像分类问题,本文提出了一种改进的ResNet-10卷积神经网络模型.该模型在网络的残差映射结构中加入残差混合注意力模块,解决了原模型提取的特征分辨性弱的问题,精确捕捉了脑部组织在CT图像中的位置和内容信息;此外,本文设计了全局平均池化层,简化了模型的复杂度,并在其后引入Dropout机制,缓解了过拟合.在训练阶段,该模型建立了标签平滑交叉熵损失函数,使模型在样本数量有限的情况下仍有较强的泛化能力.系列实验证明了改进后的ResNet-10网络模型在分类脑部CT图像时达到97.47%的分类精度. 展开更多
关键词 残差混合注意力模块 标签平滑 脑部CT 卷积神经网络
在线阅读 下载PDF
基于轻量化HPG−YOLOX−S模型的煤矸石图像精准识别 被引量:9
5
作者 陈彪 卢兆林 +3 位作者 代伟 邵明 于大伟 董良 《工矿自动化》 北大核心 2022年第11期33-38,共6页
针对现有基于视觉技术的煤矸石分选方法存在模型参数量大、特征提取能力差、识别精度低等问题,提出了一种基于轻量化Ghost−S网络与混合并联注意力模块(HPAM)YOLOX−S模型(HPG−YOLOX−S模型)的煤矸石识别方法。首先,在YOLOX−S模型主干网络... 针对现有基于视觉技术的煤矸石分选方法存在模型参数量大、特征提取能力差、识别精度低等问题,提出了一种基于轻量化Ghost−S网络与混合并联注意力模块(HPAM)YOLOX−S模型(HPG−YOLOX−S模型)的煤矸石识别方法。首先,在YOLOX−S模型主干网络中加入HPAM,以增强图像中重要信息,抑制次要信息,加强主干网络的特征提取能力。其次,将YOLOX−S模型主干网络替换为参数量更小的Ghost−S网络,提高利用率与特征融合能力。最后,在预测层中采用SIOU损失函数来替换YOLOX−S模型的损失函数,提升检测与定位精度,加强对目标的提取能力。为验证所提方法对大块煤矸石的检测效果,将HPG−YOLOX−S模型与YOLOX−S模型进行对比,结果表明,HPG−YOLOX−S模型对煤与矸石的识别准确率分别为99.53%和99.60%,较YOLOX−S模型识别准确率分别提高了2.51%,1.27%。有效性验证结果表明,HPG−YOLOX−S模型的精确率、召回率和F1值均在94%以上,较YOLOX−S模型分别提高了5.68%,3.51%,2.91%;HPG−YOLOX−S模型的参数为7.8 MB,较YOLOX−S模型降低了1.2 MB。消融试验结果表明,HPG−YOLOX−S模型的平均精度均值较YOLOX−S模型提高了9.17%。热力图可视化试验结果表明,HPG−YOLOX−S模型关注煤与矸石的纹理和轮廓等表面差异,对煤矸石目标的全局关注度更加显著。 展开更多
关键词 煤矸石检测 图像识别 轻量化网络 HPG−YOLOX−S 混合并联注意力模块
在线阅读 下载PDF
基于深度学习的脊椎CT图像分割 被引量:4
6
作者 黄昆 张俊华 普钟 《电子测量技术》 北大核心 2022年第20期151-159,共9页
脊椎CT图像分割是脊椎三维重建可视化的关键。针对脊椎CT图像中脊椎边缘模糊,结构复杂,形状多变等问题,基于深度学习方法提出一种双解码器网络。该网络在编码解码网络U-Net结构基础上增加了一条结构相同的并行解码分支,两个解码分支可... 脊椎CT图像分割是脊椎三维重建可视化的关键。针对脊椎CT图像中脊椎边缘模糊,结构复杂,形状多变等问题,基于深度学习方法提出一种双解码器网络。该网络在编码解码网络U-Net结构基础上增加了一条结构相同的并行解码分支,两个解码分支可以互补地提取图像特征。并且,在编码与解码之间加入双重特征融合模块,解决网络在下采样和上采样过程中造成的语义信息丢失问题。同时用密连混合卷积模块代替原始卷积模块,提高网络对多尺度特征的提取能力。此外加入高效注意力模块,使网络在空间上注重学习感兴趣区域,在通道上抑制无关信息。在CSI2014公开数据集上进行测试,Dice系数达到0.970,Jaccard系数达到0.945,召回率达到0.962。实验结果表明,该网络能够提高脊椎分割精度,具有较好的泛化能力,可以满足临床脊椎CT图像分割需求。 展开更多
关键词 脊椎分割 深度学习 双解码器网络 双重特征融合模块 密连混合卷积模块 高效注意力模块
在线阅读 下载PDF
基于混合注意力机制的调制识别算法
7
作者 李佳宜 刘芸江 +1 位作者 李泊含 刘浩 《电光与控制》 2025年第9期41-46,60,共7页
针对目前基于卷积神经网络(CNN)进行调制识别的方法,在卷积层不断加深的过程中浅层空间信息丢失、训练耗时长等问题,提出一种基于混合注意力机制的调制识别算法。首先,通过构建多尺度金字塔池化(MSPP)对输入进行并行处理,提取信号的深... 针对目前基于卷积神经网络(CNN)进行调制识别的方法,在卷积层不断加深的过程中浅层空间信息丢失、训练耗时长等问题,提出一种基于混合注意力机制的调制识别算法。首先,通过构建多尺度金字塔池化(MSPP)对输入进行并行处理,提取信号的深度特征和多尺度特征;然后,引入改进卷积的混合级联注意力机制,包括缩放点积注意力(SDPA)和挤压-激发块(SEB)从空间和通道维度关注有利于调制识别的关键特征,使模型具有适应性更强的特征表达能力,同时有效缩短了模型的训练时间。实验结果表明,所提算法在信噪比为-20 dB、0 dB、20 dB时的识别准确率分别达到52.16%、61.87%、91.69%,均高于其他算法;相比于多尺度金字塔池化算法,训练时间缩短了50.84%。证明了所提算法能有效地提取信号特征,具有更好的识别准确率。 展开更多
关键词 信号调制 调制识别 多尺度金字塔池化 混合注意力机制 卷积神经网络
在线阅读 下载PDF
彩色图像引导高低频特征调制融合的深度图像超分辨率算法研究
8
作者 徐晗智 李嘉莹 +1 位作者 梁宇栋 魏巍 《计算机科学》 2025年第6期228-238,共11页
深度图像能够有效描述三维场景的信息,然而由于采集设备的局限性和不理想的成像环境,深度传感器获取的深度图像往往分辨率较低、高频信息较少,提高深度图像的分辨率具有重要意义。部分深度图超分辨率算法通过引入同一场景下的RGB图像为... 深度图像能够有效描述三维场景的信息,然而由于采集设备的局限性和不理想的成像环境,深度传感器获取的深度图像往往分辨率较低、高频信息较少,提高深度图像的分辨率具有重要意义。部分深度图超分辨率算法通过引入同一场景下的RGB图像为深度图超分辨率过程提供指导信息,显著提升了算法性能。如何充分、有效地利用RGB信息,改善深度图和RGB图像的模态不一致性,引导深度图超分辨率重建过程极具挑战。已有方法多关注于高频信息,忽略了低频全局的信息,影响了算法性能的提升。对此,提出了彩色图像引导的、高低频特征调制融合的深度图像超分辨率重建算法。具体地,设计了一个双分支特征提取模块,分别针对彩色图像和深度图像进行高低频特征提取,在各个分支采用CNN和Transformer分别提取局部高频和全局低频信息,通过构造双向调制模块,实现对彩色和深度图像高频信息之间和低频信息之间的双向转换与融合。模型经过不同模态不同频率内的双向调制及后续高低频信息的融合,充分挖掘深度图像与彩色图像之间的互补信息,使得基于彩色图像引导的深度超分辨率算法能够取得更好的重建效果。另外,利用可逆神经网络INN进行无损信息压缩,以更好地提取高频细节信息,采用四叉树注意力机制有效降低了Transformer提取全局信息的计算复杂度,提高了算法效率。在公开数据集上进行了实验,结果表明,所提方法在定量和定性两方面均优于对比方法,取得了较好的主观视觉效果。 展开更多
关键词 深度图超分重建 混合特征 双向调制 四叉树注意力机制
在线阅读 下载PDF
融合Transformer和级联聚合模块的细胞分割算法
9
作者 杨国亮 王乾琛 +1 位作者 耿珍 熊文楷 《计算机工程与应用》 2025年第17期292-303,共12页
针对细胞形态不规则、大小差异大、目标区域密度高和目标区域受到遮挡干扰等问题,提出一种融合Transformer和级联聚合模块肠镜活检组织细胞分割算法。运用金字塔视觉变压器PVTv2作为主干特征提取网络,逐层地提取细胞图像的空间细节和语... 针对细胞形态不规则、大小差异大、目标区域密度高和目标区域受到遮挡干扰等问题,提出一种融合Transformer和级联聚合模块肠镜活检组织细胞分割算法。运用金字塔视觉变压器PVTv2作为主干特征提取网络,逐层地提取细胞图像的空间细节和语义信息,构建特征信息之间的长期交互。设计级联聚合模块,不断将高维信息向低维映射来完成全局空间信息与语义信息的融合,同时依靠输入依赖的深度卷积来聚合局部信息,完成特征信息的全面融合。构造混合压缩注意力机制,减少通道维度特征信息冗余并聚焦有效信息,增强空间感知能力,有效减少遮挡和噪声的干扰。在EBHI-Seg数据集上进行实验,并在其子数据集Low-grade IN和Serratedadenoma上取得最佳结果,Dice相似系数和Jaccard指数分别达到93.00%、93.75%和87.21%、88.44%。实验结果表明,该算法能够有效解决细胞分割中被遮挡问题和目标区域细胞过于密集等问题,分割性能较已有算法有所提升。 展开更多
关键词 肠镜活检组织细胞 Transformer 级联聚合模块 混合压缩注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部