期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于Ghost卷积与自适应注意力的点云分类 被引量:1
1
作者 舒密 王占刚 《现代电子技术》 北大核心 2025年第6期106-112,共7页
点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,... 点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,提出一种基于点云Transformer的轻量级特征增强融合分类网络EFF-LPCT。EFF-LPCT使用一维化Ghost卷积对原始网络进行重构,以降低计算复杂度和内存要求;引入自适应支路权重,以实现注意力层级间的多尺度特征融合;利用多个通道注意力模块增强特征的通道交互信息,以提高模型分类效果。在ModelNet40数据集进行的实验结果表明,EFF-LPCT在达到93.3%高精度的同时,相较于点云Transformer减少了1.11 GFLOPs的浮点计算量和0.86×10^(6)的参数量。 展开更多
关键词 点云分类 Transformer网络 Ghost卷积 特征增强融合模块 ECA通道注意力 特征学习
在线阅读 下载PDF
基于改进YOLOv8n的手机屏幕瑕疵检测算法:PGS-YOLO
2
作者 周思瑜 徐慧英 +4 位作者 朱信忠 黄晓 盛轲 曹雨淇 陈晨 《计算机工程》 北大核心 2025年第5期326-339,共14页
手机屏幕作为人机交互的主窗口,已成为影响用户体验和终端整体性能的重要因素。因此,市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求,针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况,提出... 手机屏幕作为人机交互的主窗口,已成为影响用户体验和终端整体性能的重要因素。因此,市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求,针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况,提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头,并结合SeaAttention注意力模块,有效提升对小目标的探测能力;将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块,在保证精度的同时降低模型的参数量,提高瑕疵检测的速度与效率。实验结果表明,在北京大学手机屏幕表面瑕疵数据集中,相较于YOLOv8n,PGS-YOLO算法的mAP@0.5提升了2.5百分点,mAP@0.5∶0.95提升了2.2百分点,在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测,还能对小瑕疵保持一定的准确度。此外,检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时,参数量仅为2.0×10^(6),小于YOLOv8n,满足工业场景对手机屏幕瑕疵检测的需求。 展开更多
关键词 YOLOv8n模型 手机屏幕瑕疵检测 小目标检测 部分卷积 GhostNetV2轻量化模块 挤压增强轴向注意力
在线阅读 下载PDF
基于AOD-Net改进的多尺度图像去雾算法
3
作者 王超 王婷 +1 位作者 王少军 杨万扣 《计算机工程》 北大核心 2025年第7期305-313,共9页
经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式... 经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式,减少了冗余参数量,加快了计算速度并有效地减少了模型的内存占用量,从而提高了算法去雾效率;同时采用多尺度结构在不同尺度上对雾图进行分析和处理,更好地捕捉图像的细节信息,提升了网络对图像细节的处理能力,解决了原算法去雾时存在的细节模糊问题;最后在网络结构中加入金字塔池化模块,用于整合图像不同区域的上下文信息,扩展了网络的感知范围,从而提高网络模型获取有雾图像全局信息的能力,进而改善图像色调失真、细节丢失等问题。此外,引入一个低照度增强模块,通过明确预测噪声实现去噪的目标,从而恢复曝光不足的图像。在低光去雾图像中,峰值信噪比(PSNR)和结构相似性(SSIM)指标均有显著提升,处理后的图片具有更高的整体自然度。实验结果表明:与经典AOD-Net去雾的结果相比,改进算法能够更好地恢复图像的细节和结构,使得去雾后的图像更自然,饱和度和对比度也更加平衡;在RESIDE的SOTS数据集中的室外和室内场景,相较于经典AOD-Net,改进算法的PSNR分别提升了4.5593 dB和4.0656 dB,SSIM分别提升了0.0476和0.0874。 展开更多
关键词 多尺度网络结构 深度可分离卷积 金字塔池化模块 低照度增强模块 图像去雾
在线阅读 下载PDF
基于多尺度卷积神经网络的屋顶光伏建筑轮廓提取方法研究
4
作者 胡家宇 白建波 +1 位作者 肖宇航 严家乐 《可再生能源》 北大核心 2025年第7期887-895,共9页
针对我国整县分布式光伏的推进,屋顶光伏可利用潜力评估成为政策落实的前提条件。高效准确获取区域内屋顶的轮廓,是评估区域内光伏可利用潜力的最关键因素。现有屋顶光伏建筑物轮廓提取方法忽略了图像的多尺度特征,导致提取建筑物轮廓... 针对我国整县分布式光伏的推进,屋顶光伏可利用潜力评估成为政策落实的前提条件。高效准确获取区域内屋顶的轮廓,是评估区域内光伏可利用潜力的最关键因素。现有屋顶光伏建筑物轮廓提取方法忽略了图像的多尺度特征,导致提取建筑物轮廓模糊及精度不高等弊端。文章提出了多尺度增强卷积耦合注意力调节的建筑物轮廓提取方法。首先,利用多扩张率的空洞卷积构造多尺度增强卷积模块,并将其融入到U_Net网络中,用来采集不同感受野下的建筑特征,这样提取的结果能更全面地表达建筑物轮廓的整体和细节特征;然后,将注意力机制引入到U_Net网络中参与跳跃连接,更为精确地提取建筑物轮廓;最后,利用交叉熵损失函数和Dice系数损失函数,构造复合损失函数,训练所提模型,提取建筑物轮廓。实验结果显示,与其他建筑物轮廓提取算法相比,所提算法不仅对建筑物轮廓的提取精度较高,而且对不同尺度的建筑物轮廓提取也具有较好的效果,说明所提算法能够有效提升建筑物轮廓提取精度,提高光伏可利用潜力评估效率。在分布式光伏整县推进背景下,该方法对于推动GIS及人工智能技术在光伏资源评估中的应用具有重要的参考价值。 展开更多
关键词 屋顶光伏 建筑物轮廓提取 多尺度增强卷积模块 注意力机制
在线阅读 下载PDF
基于YOLOv8n改进的PCB缺陷检测算法
5
作者 喻聪 《实验室研究与探索》 北大核心 2025年第6期117-124,共8页
针对PCB生产中的漏孔、鼠咬等微小缺陷检测问题,提出一种基于YOLOv8n改进的YOLOv8n-CSOW算法。通过在Backbone中增加空间深度转换卷积模块以增强特征捕获能力;在Neck部分,采用C2f-ODconv模块替换原始C2f模块强化特征精确匹配。同时,引... 针对PCB生产中的漏孔、鼠咬等微小缺陷检测问题,提出一种基于YOLOv8n改进的YOLOv8n-CSOW算法。通过在Backbone中增加空间深度转换卷积模块以增强特征捕获能力;在Neck部分,采用C2f-ODconv模块替换原始C2f模块强化特征精确匹配。同时,引入上下文增强模块强化特征表征。将边界框(BBox)损失函数优化为动态聚焦的WIoUv2函数,增强模型对微小缺陷的敏感度。实验结果表明,改进算法在某大学公开数据集上平均检测精度较原始YOLOv8n提升1.4个百分点,且优于主流目标检测算法,具备显著的工业检测应用价值。 展开更多
关键词 印刷电路板检测 上下文增强模块 空间深度转换卷积 全维动态卷积
在线阅读 下载PDF
基于卷积调制与空间协作的水下图像增强 被引量:2
6
作者 郭伟 王欣哲 +1 位作者 王江达 王春艳 《计算机工程》 CAS CSCD 北大核心 2024年第8期310-318,共9页
针对光线在水中的散射和吸收效应造成水下图像纹理和结构不清晰的问题,提出一种基于卷积调制(CM)与空间协作(SC)的水下图像增强算法。以编码器-解码器作为基础网络,使用RepVGG的浅层和深层网络分别提取水下图像的纹理和结构特征。首先,... 针对光线在水中的散射和吸收效应造成水下图像纹理和结构不清晰的问题,提出一种基于卷积调制(CM)与空间协作(SC)的水下图像增强算法。以编码器-解码器作为基础网络,使用RepVGG的浅层和深层网络分别提取水下图像的纹理和结构特征。首先,特征主导网络将RepVGG中提取到的水下图像特征转化成具有不同尺度的纹理和结构特征,使其与解码器中的特征图进行拼接融合。其次,在编码器中使用卷积调制模块,采用深度可分离卷积(DSConv)模拟自注意力机制的方式减少图像细节信息的丢失,提高编码器特征提取的能力。最后,在解码器中使用空间协作卷积(SCConv),在空间维度上处理水下特征保留更多的位置信息,以提高解码器对融合后特征的增强能力。实验结果表明,该算法在视觉感知与性能指标上优于对比算法,峰值信噪比(PSNR)和结构相似性(SSIM)指标最高达到23.4465 dB和0.8946,水下彩色图像质量评价(UCIQE)和水下图像质量测量(UIQM)指标最高达到0.5826和3.0689,进一步证明了该算法能够有效增强水下图像的纹理和结构特征,具有较好的视觉感知效果。 展开更多
关键词 图像处理 水下图像增强 卷积调制 空间协作 编解码结构
在线阅读 下载PDF
面向超分辨率重建的层次间局部特征增强网络
7
作者 王晓峰 黄煜婷 +2 位作者 张文尉 张轩 陈东方 《计算机工程与设计》 北大核心 2024年第8期2407-2414,共8页
基于卷积神经网络的超分辨率重建模型以单项传播为主,层次越靠后感知信息的能力越微弱,导致层次间局部特征部分丢失,难以实质提升网络的特征表达能力。针对此问题,提出层次间局部特征增强网络。该方法由级联残差模块、层次间特征增强块... 基于卷积神经网络的超分辨率重建模型以单项传播为主,层次越靠后感知信息的能力越微弱,导致层次间局部特征部分丢失,难以实质提升网络的特征表达能力。针对此问题,提出层次间局部特征增强网络。该方法由级联残差模块、层次间特征增强块和特征感知注意力机制组成。级联残差模块通过有效残差连接增加对残差分支信息的利用;层次间特征增强块提取不同深度特征的依赖关系,自适应调整中间层特征权值增强捕获关键信息的能力;特征感知注意力机制采用方向感知和位置判断的方式准确定位和识别感兴趣对象。多项标准数据集的实验结果表明,该方法能改善超分辨率的视觉重建效果,整体性能优于现有方法。 展开更多
关键词 卷积神经网络 超分辨率 局部特征增强 级联残差模块 注意力机制 方向感知 位置判断
在线阅读 下载PDF
基于时序特征灰度图与多任务学习的综合能源负荷短期预测 被引量:4
8
作者 倪建辉 张菁 +2 位作者 张昊立 陈龙 高典 《电气工程学报》 CSCD 北大核心 2024年第2期186-199,共14页
准确预测综合能源系统(Integrated energy system,IES)中的电、冷、热多元负荷是提高各类能源综合效率、获得更大经济效益的关键。因此,提出一种基于时序特征灰度图与多任务学习的综合能源负荷短期预测方法。首先将初始特征集通过最大... 准确预测综合能源系统(Integrated energy system,IES)中的电、冷、热多元负荷是提高各类能源综合效率、获得更大经济效益的关键。因此,提出一种基于时序特征灰度图与多任务学习的综合能源负荷短期预测方法。首先将初始特征集通过最大互信息系数(Maximum information coefficient,MIC)改进的快速相关滤波算法(Fast correlation-based filter,FCBF)对IES时序特征数据集进行相关性分析和冗余性分析;然后将特征选择结果利用因数重构法与MIC-gamma图像增强的方法重构为时序特征灰度图,能够直观有效地反映实际数据的特征相关性;其次采用基于多任务学习框架的(Convolutional block attention module-convolutional neural network-deep bidirectional gated recurrent unit,CBAM-CNN-DBiGRU)网络进行训练,嵌入的卷积注意力机制模块(Convolutional block attention module,CBAM)与(Deep bidirectional gated recurrent unit,DBiGRU)结构能有效加强共享层的关键信息提取和时序信息处理能力;最后以美国亚利桑那州立大学的IES数据为例对提出的方法进行测试。选取典型工作日和典型休息日并对比多种深度网络模型,测试结果表明,该模型在典型工作日的加权平均绝对百分比误差与加权均方根误差分别最大降低了0.8813%与229.2593 kW,在典型休息日则分别最大降低了0.9942%与360.8007 kW,能够有效提升IES多元负荷预测精度。 展开更多
关键词 多元负荷预测 最大互信息系数 快速相关滤波算法 特征冗余性 MIC-gamma图像增强 卷积注意力机制模块 深度双向门控循环单元
在线阅读 下载PDF
Transformer与CNN并行引导的水下图像增强 被引量:2
9
作者 常戬 陈洪福 王冰冰 《计算机工程与应用》 CSCD 北大核心 2024年第4期280-288,共9页
为克服水下图像对比度低和色偏的问题,提出了基于Transformer与CNN并行引导的水下图像增强算法。利用3D位置嵌入模型为Transformer提供相对位置信息、色偏信息和特征图的全局特征,利用CNN编码器提取图像局部特征,将Transformer提取的全... 为克服水下图像对比度低和色偏的问题,提出了基于Transformer与CNN并行引导的水下图像增强算法。利用3D位置嵌入模型为Transformer提供相对位置信息、色偏信息和特征图的全局特征,利用CNN编码器提取图像局部特征,将Transformer提取的全局特征和CNN提取的局部特征通过特征调制矩阵整合在一起,通过CNN解码器提高图像的分辨率,将解码器输出的特征图输入到特征加强网络中,由特征加强网络输出最终结果。采用现有的EUVP配对数据集进行训练,为验证该算法的优越性,选取具有不同程度色偏的水下图像进行定性比较和定量实验,结果显示,该算法增强后的水下图像峰值信噪比指标(peak signal-to-noise ratio,PSNR)和结构相似性指标(structural similarity index measure,SSIM)均高于其他对比算法,主观质量也得到显著提高,能够产生颜色丰富且清晰度较高的增强图像。 展开更多
关键词 水下图像增强 TRANSFORMER 卷积神经网络(CNN) 3D位置嵌入模型 特征调制矩阵
在线阅读 下载PDF
基于改进YOLOv5的镍板表面缺陷检测方法 被引量:4
10
作者 谭沁源 唐勇 +2 位作者 金岩 覃美满 吴伟 《矿冶工程》 CAS 北大核心 2024年第2期160-166,共7页
针对镍板表面缺陷检测智能化程度低的问题,提出了一种基于改进YOLOv5的镍板表面缺陷检测方法。首先,对图像增强后的镍板数据集通过K-means++重新聚类锚框,提高锚框对本文数据集的适应度。其次,在主干网络Backbone中加入CBAM注意力机制,... 针对镍板表面缺陷检测智能化程度低的问题,提出了一种基于改进YOLOv5的镍板表面缺陷检测方法。首先,对图像增强后的镍板数据集通过K-means++重新聚类锚框,提高锚框对本文数据集的适应度。其次,在主干网络Backbone中加入CBAM注意力机制,通过空间与通道信息融合来加强对感兴趣区域以及不清晰目标的特征识别。最后,在边界框回归时引入EIoU损失函数代替原CIoU损失函数,有效提高回归收敛速度,从而提高模型检测速度。实验结果表明,在自建的镍板缺陷数据集上,改进后的模型检测准确率高于Faster R-CNN、SSD、YOLOv3、YOLOv5等模型,其平均精度均值达81.4%,检测速度达61帧/s,模型在提高检测精度的同时也很好地满足了对检测速度的要求。 展开更多
关键词 表面缺陷 镍板 缺陷检测 图像处理 图像增强算法 YOLOv5 注意力机制 EIoU损失函数 准确率 平均精度 检测速度
在线阅读 下载PDF
矿用无人驾驶车辆行人检测技术研究 被引量:1
11
作者 周李兵 于政乾 +4 位作者 卫健健 蒋雪利 叶柏松 赵叶鑫 杨斯亮 《工矿自动化》 CSCD 北大核心 2024年第10期29-37,共9页
矿用无人驾驶车辆的工作环境光照条件复杂,行人检测经常出现漏检现象,导致矿用无人驾驶车辆可靠性及安全性不足。针对巷道光照条件复杂的问题,提出了一种弱光图像增强算法:将弱光图像由RGB图像空间分解为HSV图像空间,通过Logarithm函数... 矿用无人驾驶车辆的工作环境光照条件复杂,行人检测经常出现漏检现象,导致矿用无人驾驶车辆可靠性及安全性不足。针对巷道光照条件复杂的问题,提出了一种弱光图像增强算法:将弱光图像由RGB图像空间分解为HSV图像空间,通过Logarithm函数对亮度分量先进行光照,再通过双边滤波器去除噪声;采用形态学对饱和度分量进行闭操作,再通过高斯滤波器滤除噪声;将图像转换回RGB图像空间,通过半隐式ROF去噪模型对图像再次进行去噪,得到增强图像。针对行人检测存在漏检、精度低的问题,提出了一种基于改进YOLOv3的矿用无人驾驶车辆行人检测算法:采用密集连接块取代YOLOv3中的Residual连接,提高特征图利用率;采用Slim-neck结构优化YOLOv3的特征融合结构,使得特征图之间能够进行高效的信息融合,进一步提高对小目标行人的检测精度,并利用其内部特殊的轻量化卷积结构,提高检测速度;加入轻量级的卷积注意力模块(CBAM)增强算法对目标类别和位置的注意程度,提高行人检测精度。实验结果表明:(1)提出的弱光图像增强算法能够有效提高图像可见度,图像中行人的纹理更加清晰,并具有更好的噪声抑制效果。(2)基于增强后图像的矿用无人驾驶车辆行人检测算法的平均精度达95.68%,相较于基于改进YOLOv7和ByteTrack的煤矿关键岗位人员不安全行为识别算法、YOLOv5、YOLOv3算法分别提高了2.53%,6.42%,11.77%,且运行时间为29.31 ms。(3)基于增强后图像,YOLOv3和基于改进YOLOv7和ByteTrack的煤矿关键岗位人员不安全行为识别算法出现了漏检和误检的问题,而矿用无人驾驶车辆行人检测算法有效改善了该问题。 展开更多
关键词 矿用无人驾驶车辆 井下行人检测 YOLOv3 弱光图像增强 半隐式ROF去噪 密集连接模块 Slim-neck 卷积注意力模块
在线阅读 下载PDF
MIRNet-Plus:基于丰富特征学习的低光图像增强改进方法
12
作者 罗林 余联想 郑明魁 《小型微型计算机系统》 CSCD 北大核心 2024年第3期664-669,共6页
图像增强是一种基础的计算机视觉任务,从低光图像中恢复出高质量的明亮图像是业界正在攻克的问题.近年来,以卷积神经网络(CNN)为主导的图像恢复技术取得了重大进展.对于低光图像增强,本方法使用双重选择核融合(Double SKFF)方法,通过增... 图像增强是一种基础的计算机视觉任务,从低光图像中恢复出高质量的明亮图像是业界正在攻克的问题.近年来,以卷积神经网络(CNN)为主导的图像恢复技术取得了重大进展.对于低光图像增强,本方法使用双重选择核融合(Double SKFF)方法,通过增强中间层不同分辨率信息的交流能力以获得更多上下文信息以及空间信息;同时设计了一个深度注意模块(Depthwise Attention Module,DWM),用来共享张量中的特征信息,对原有特征进行补充,获取更加丰富的特征信息.同时本方法还引入了多颜色空间神经修饰块,用来在3种不同的颜色空间(Lab,RGB,HSV)中联合训练,以期望获得更好的图像增强结果.本文提出的MIRNet-Plus在原有的基础方法上PSNR获得了5.3%的提高,由23.73dB提升到24.98dB. 展开更多
关键词 图像增强 低光图像 卷积神经网络 深度注意模块 多颜色空间神经修饰块
在线阅读 下载PDF
基于LS-DCGAN的GCSE-DenseNet光伏组件缺陷识别方法 被引量:1
13
作者 王艳 申宗旺 +1 位作者 赵洪山 李伟 《太阳能学报》 EI CAS CSCD 北大核心 2023年第10期165-172,共8页
针对光伏组件样本不均衡及缺陷识别精度低问题,提出一种基于LS-DCGAN的GCSE-DenseNet光伏组件缺陷识别方法。首先,针对光伏组件样本的不均衡问题,构建最小二乘深度卷积生成对抗网络(LS-DCGAN),进行样本数据增强,以扩充数据集。其次,在传... 针对光伏组件样本不均衡及缺陷识别精度低问题,提出一种基于LS-DCGAN的GCSE-DenseNet光伏组件缺陷识别方法。首先,针对光伏组件样本的不均衡问题,构建最小二乘深度卷积生成对抗网络(LS-DCGAN),进行样本数据增强,以扩充数据集。其次,在传统DenseNet网络基础上引入分组卷积和注意力机制,提出一种基于分组卷积和注意力机制的改进GCSE-DenseNet网络模型。改进模型仍采用密集连接机制,实现特征重用防止梯度消失;同时,采用分组卷积优化模型密集模块结构,以降低模型参数量;引入注意力机制加强有效特征、削弱无效特征,以增强模型特征学习能力。最后,对所提模型的有效性进行实验验证。实验表明,改进的GCSE-DenseNet网络模型能有效提高光伏组件缺陷识别精度。 展开更多
关键词 光伏组件 深度学习 图像分类 数据增强 分组卷积
在线阅读 下载PDF
基于卷积神经网络的新型爆珠缺陷检测算法 被引量:4
14
作者 胡怀中 李龙飞 李梦迪 《浙江工业大学学报》 CAS 北大核心 2022年第6期609-614,共6页
香烟爆珠包装前的缺陷检测对确保香烟生产品质具有重要意义。基于卷积神经网络的新型爆珠缺陷检测算法,可检测爆珠中的气泡、凹陷、划痕和微小拖尾这4种典型缺陷。为满足工业检测的要求,在利用Faster RCNN对小目标检测精度高优势的同时... 香烟爆珠包装前的缺陷检测对确保香烟生产品质具有重要意义。基于卷积神经网络的新型爆珠缺陷检测算法,可检测爆珠中的气泡、凹陷、划痕和微小拖尾这4种典型缺陷。为满足工业检测的要求,在利用Faster RCNN对小目标检测精度高优势的同时,对其进行轻量化改进。首先,利用深度可分离卷积网络实现特征提取,相较于标准卷积,参数量与计算量可减少约90%;然后,为降低网络参数的减少对精度的影响,利用上下文增强模块整合多尺度特征,提高检测精度;最后,选择加入二阶矩估计的Adam算法替代传统Momentum算法实现网络参数学习,网络收敛速度更快,误差更小。检测结果表明:笔者算法对4种缺陷检测的平均精度均值可达98.16%,检测速度可达36.10 pcs/s,检测精度和检测速度均能满足实时检测的要求。 展开更多
关键词 缺陷检测 Faster RCNN 深度可分离卷积 上下文增强模块 ADAM
在线阅读 下载PDF
基于自适应三元组网络的细粒度图像检索算法 被引量:2
15
作者 潘丽丽 陈蓉玉 +2 位作者 雷前慧 邵伟志 黄诗祺 《郑州大学学报(理学版)》 北大核心 2021年第4期36-43,共8页
立足于深度学习,提出面向细粒度图像的自适应三元组网络的鲁棒图像检索算法。首先,提出的视觉显著性检测方法被用来去除图像噪音,以便提取图像中目标主体辨识度更高的深度特征;然后,添加特征增强模块来提高深度特征的表征能力和鲁棒性;... 立足于深度学习,提出面向细粒度图像的自适应三元组网络的鲁棒图像检索算法。首先,提出的视觉显著性检测方法被用来去除图像噪音,以便提取图像中目标主体辨识度更高的深度特征;然后,添加特征增强模块来提高深度特征的表征能力和鲁棒性;最后设计三元组网络,弥补传统分类模型特征判别能力不足的缺陷,获取更适用于细粒度图像检索的网络模型。经实验验证,采用视觉显著性检测、特征增强模块和自适应三元组损失函数方法构建的网络模型提取的深度特征不仅加快检索效率,同时也提高了检索精度。 展开更多
关键词 细粒度图像检索 视觉显著性检测 卷积神经网络 特征增强模块 自适应三元组损失
在线阅读 下载PDF
基于特征增强YOLOv4的无人机检测算法研究 被引量:12
16
作者 史雨馨 朱继杰 凌志刚 《电子测量与仪器学报》 CSCD 北大核心 2022年第7期16-23,共8页
现有基于深度学习的目标检测方法在面对空中消费级无人机时,存在鲁棒性差、准确率不足等问题。对此,提出一种基于特征增强的YOLOv4目标检测方法—FEM-YOLOv4。首先,针对无人机低、小、慢等特点,改进骨干网络,降低下采样倍数,充分利用包... 现有基于深度学习的目标检测方法在面对空中消费级无人机时,存在鲁棒性差、准确率不足等问题。对此,提出一种基于特征增强的YOLOv4目标检测方法—FEM-YOLOv4。首先,针对无人机低、小、慢等特点,改进骨干网络,降低下采样倍数,充分利用包含细粒度信息的浅层特征;其次,加入特征增强模块(feature enhancement module),通过使用不同空洞率的多分支卷积层结构,综合不同深度的语义信息和空间信息,增强小尺度无人机的细节语义特征;另外,利用多尺度融合的特征金字塔结构,突出特征图包含的细节信息和语义信息,提升模型对无人机目标的预测能力;最后,采用K-means++算法对无人机目标候选框的尺寸进行聚类分析。与6种目标检算法进行对比,实验结果表明,FEM-YOLOv4算法的mAP和Recall分别达到89.48%、97.4%,优于其他算法,且平均检测速度为0.042 s。 展开更多
关键词 卷积神经网络 深度学习 YOLOv4 无人机检测 特征增强模块
在线阅读 下载PDF
基于含噪Retinex模型的煤矿低光照图像增强方法 被引量:7
17
作者 李正龙 王宏伟 +2 位作者 曹文艳 张夫净 王宇衡 《工矿自动化》 CSCD 北大核心 2023年第4期70-77,共8页
低光照图像会导致许多计算机视觉任务达不到预期效果,影响后续图像分析与智能决策。针对现有煤矿井下低光照图像增强方法未考虑图像现实噪声的问题,提出一种基于含噪Retinex模型的煤矿低光照图像增强方法。建立了含噪Retienx模型,利用... 低光照图像会导致许多计算机视觉任务达不到预期效果,影响后续图像分析与智能决策。针对现有煤矿井下低光照图像增强方法未考虑图像现实噪声的问题,提出一种基于含噪Retinex模型的煤矿低光照图像增强方法。建立了含噪Retienx模型,利用噪声估计模块(NEM)估计现实噪声,将原图像和估计噪声作为光照分量估计模块(IEM)和反射分量估计模块(REM)的输入,生成光照分量与反射分量并对二者进行耦合,同时对光照分量进行伽马校正等调整,对耦合后的图像及调整后的光照分量进行除法运算,得到最终的增强图像。NEM通过3层CNN对含噪图像进行拜耳采样,然后重构生成与原图像大小一致的三通道特征图。IEM与REM均以ResNet-34作为图像特征提取网络,引入多尺度非对称卷积与注意力模块(MACAM),以增强网络的细节过滤能力及重要特征筛选能力。定性和定量评估结果表明,该方法能够平衡光源与黑暗环境之间的关系,降低现实噪声的影响,在图像自然度、真实度、对比度、结构等方面均具有良好性能,图像增强效果优于Retinex-Net,Zero-DCE,DRBN,DSLR,TBEFN,RUAS等模型。通过消融实验验证了NEM与MACAM的有效性。 展开更多
关键词 煤矿低光照图像 图像增强 含噪Retinex模型 噪声估计 拜耳采样 多尺度非对称卷积 注意力模块
在线阅读 下载PDF
结合感受野增强和全卷积网络的场景文字检测方法 被引量:6
18
作者 李晓玉 宋永红 余涛 《自动化学报》 EI CAS CSCD 北大核心 2022年第3期797-807,共11页
自然场景图像质量易受光照及采集设备的影响,且其背景复杂,图像中文字颜色、尺度、排列方向多变,因此,自然场景文字检测具有很大的挑战性.本文提出一种基于全卷积网络的端对端文字检测器,集中精力在网络结构和损失函数的设计,通过设计... 自然场景图像质量易受光照及采集设备的影响,且其背景复杂,图像中文字颜色、尺度、排列方向多变,因此,自然场景文字检测具有很大的挑战性.本文提出一种基于全卷积网络的端对端文字检测器,集中精力在网络结构和损失函数的设计,通过设计感受野模块并引入Focalloss、GIoUloss进行像素点分类和文字包围框回归,从而获得更加稳定且准确的多方向文字检测器.实验结果表明本文方法与现有先进方法相比,无论是在多方向场景文字数据集还是水平场景文字数据集均取得了具有可比性的成绩. 展开更多
关键词 感受野增强 Focalloss GIo Uloss 全卷积网络
在线阅读 下载PDF
基于递进式特征增强聚合的伪装目标检测 被引量:6
19
作者 谭湘粤 胡晓 +1 位作者 杨佳信 向俊将 《计算机应用》 CSCD 北大核心 2022年第7期2192-2200,共9页
伪装目标检测(COD)旨在检测隐藏在复杂环境中的目标。现有COD算法在结合多层次特征时,忽略了特征的表达和融合方式对检测性能的影响。为此,提出一种基于递进式特征增强聚合的COD算法。首先,通过主干网络提取多级特征;然后,为了提高特征... 伪装目标检测(COD)旨在检测隐藏在复杂环境中的目标。现有COD算法在结合多层次特征时,忽略了特征的表达和融合方式对检测性能的影响。为此,提出一种基于递进式特征增强聚合的COD算法。首先,通过主干网络提取多级特征;然后,为了提高特征的表达能力,使用由特征增强模块(FEM)构成的增强网络对多层次特征进行增强;最后,在聚合网络中设计邻近聚合模块(AAM)实现相邻特征之间的信息融合,以突显伪装目标区域的特征,并提出新的递进式聚合策略(PAS)通过渐进的方式聚合邻近特征,从而在实现多层特征有效融合的同时抑制噪声。在3个公开数据集上的实验表明,所提算法相较于12种最先进的算法在4个客观评价指标上均取得最优表现,尤其是在COD10K数据集上所提算法的加权的F测评法和平均绝对误差(MAE)分别达到了0.809和0.037。由此可见,所提算法在COD任务上拥有较优的性能。 展开更多
关键词 卷积神经网络 伪装目标检测 特征增强 邻近聚合模块 递进式聚合策略
在线阅读 下载PDF
注意力机制与复合卷积在手写识别中的应用 被引量:10
20
作者 卓天天 桑庆兵 《计算机科学与探索》 CSCD 北大核心 2022年第4期888-897,共10页
将图片切分成单“字”识别再连接成“串”是脱机手写图像识别的一种方法,但由于手写字符间易存在粘连,切分方法不易实现。卷积循环神经网络(CRNN)虽解决了整张文本图片输入,标签却不易对齐的问题,但由于不同人脱机手写风格的严重差异,... 将图片切分成单“字”识别再连接成“串”是脱机手写图像识别的一种方法,但由于手写字符间易存在粘连,切分方法不易实现。卷积循环神经网络(CRNN)虽解决了整张文本图片输入,标签却不易对齐的问题,但由于不同人脱机手写风格的严重差异,网络提取出的特征表示力不够。对此提出了加强型卷积块注意力模块和复合卷积,并将其加入处理脱机文本识别的CRNN+CTC主流框架中。加强型卷积块注意力模块增大输入特征图的贡献权重且并联地使用通道注意力、空间注意力,丰富了细化特征图语义信息的同时避免了通道注意力模块对空间注意力模块的权重干扰,使得网络更聚焦图片中的有用特征而非无用的拖拽字迹特征。而嵌入在网络深层的复合卷积采用的多卷积核卷积意味着不同尺度的特征融合,增强了网络的泛化性。基于加强型卷积块注意力模块和复合卷积的CRNN+CTC框架在具有语义信息的IAM数据集上准确率达到85.7748%,字符错误率为8.6%;在RIMES数据集上准确率达到92.8728%,字符错误率为3.9%,比起当前主流的脱机文本识别算法,性能进一步提升。 展开更多
关键词 脱机英文手写单词识别 加强型卷积块注意力模块 复合卷积 卷积循环神经网络(CRNN)
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部