期刊文献+
共找到41,243篇文章
< 1 2 250 >
每页显示 20 50 100
基于UMS-YOLO v7的面向样本不均衡的水下生物多尺度目标检测方法 被引量:3
1
作者 张明华 黄基萍 +2 位作者 宋巍 肖启华 赵丹枫 《农业机械学报》 北大核心 2025年第1期388-396,409,共10页
针对水下目标检测面临着生物尺度变化大以及样本不均衡的问题,本文提出一种水下生物多尺度目标检测方法(Underwater multi-scale-YOLO v7,UMS-YOLO v7)。首先,设计一种由可切换空洞卷积组成的特征提取模块,该模块可在不同大小的感受野... 针对水下目标检测面临着生物尺度变化大以及样本不均衡的问题,本文提出一种水下生物多尺度目标检测方法(Underwater multi-scale-YOLO v7,UMS-YOLO v7)。首先,设计一种由可切换空洞卷积组成的特征提取模块,该模块可在不同大小的感受野上捕获多尺度目标特征,使得提取的特征信息更加全面;其次,使用轻量级的上采样算子融合上下文信息,提高模型对目标的特征学习能力;最后,通过结合Wise-IoU和归一化Wasserstein距离两种相似性度量,提高了不同尺度目标的定位精度,同时降低了多尺度样本分布不均衡对模型的影响。实验结果表明,该模型相较于当前其他模型在检测精度方面表现出明显的提升,在RUOD和DUO数据集上平均精度均值分别达到64.5%和68.9%。与YOLO v7模型相比,UMS-YOLO v7提高了多种尺度目标检测精度,在DUO数据集上,针对大、中、小3种尺度目标平均精度均值分别提升8.3、4.8、12.5个百分点,其中小目标提升效果最为显著。与现有的其他模型相比,改进的模型具有更高的检测精度,更适用于水下生物多尺度目标检测任务,并且针对不同数据分布的样本具有泛化性和鲁棒性。 展开更多
关键词 水下生物 多尺度目标检测 YOLO v7 空洞卷积 上采样算子 相似性度量
在线阅读 下载PDF
基于特征增强的双重注意力去雾网络 被引量:2
2
作者 陈海秀 黄仔洁 +5 位作者 陆康 陆成 何珊珊 房威志 卢海涛 陈子昂 《电光与控制》 北大核心 2025年第1期15-20,67,共7页
针对现有去雾方法处理的图像细节模糊和色彩偏差等问题,提出了一种基于特征增强的双重注意力去雾网络。该网络采用编码器-解码器结构,设计了一个双重注意力特征增强模块,其中,利用Ghost模块替代非线性卷积,实现模型轻量化处理,通过RFB... 针对现有去雾方法处理的图像细节模糊和色彩偏差等问题,提出了一种基于特征增强的双重注意力去雾网络。该网络采用编码器-解码器结构,设计了一个双重注意力特征增强模块,其中,利用Ghost模块替代非线性卷积,实现模型轻量化处理,通过RFB充分融合不同尺度的特征,实现均匀去雾,引入双重注意力实现信息跨通道与空间交互,保证模型性能和抑制噪声特征。使用RESIDE数据集对网络进行训练和测试。实验结果表明,所提算法在主观视觉和客观评价指标上均有优异表现,能有效地提升网络的特征提取能力,实现对不同场景雾图的色彩恢复,增强图像的对比度和清晰度。 展开更多
关键词 图像去雾 特征增强 并行分支结构 多尺度映射 注意力机制
在线阅读 下载PDF
基于改进YOLOv8的无人机航拍火灾检测算法 被引量:3
3
作者 郭纪良 刘莉 何建 《林业工程学报》 北大核心 2025年第2期111-122,共12页
在林业管理中,及时发现火灾并识别其规模对于安全防护和治理火灾至关重要。针对现有火灾检测算法存在的精度低、漏检误检和实时性不足等问题,提出一种无人机航拍图像下火灾实时检测算法——MDSYOLOv8。以YOLOv8为基线算法,将骨干网络第... 在林业管理中,及时发现火灾并识别其规模对于安全防护和治理火灾至关重要。针对现有火灾检测算法存在的精度低、漏检误检和实时性不足等问题,提出一种无人机航拍图像下火灾实时检测算法——MDSYOLOv8。以YOLOv8为基线算法,将骨干网络第7层卷积模块和颈部网络卷积模块替换成动态蛇形卷积(DSConv),提高算法的特征提取性能,并强化算法对微小特征的学习能力;然后在颈部与检测头之间添加多维协作注意力机制(MCA),加强颈部特征融合,增强算法对小目标的检测能力,并抑制无关背景信息;最后使用SIoU损失函数替换原YOLOv8中的CIoU损失函数,加快算法的收敛速度和回归精度。实验结果表明,MDSYOLOv8在公开数据集KMU上对烟雾目标的检测精度mAP达到95.89%,相较于基线YOLOv8提高了3.33个百分点,具有卓越的检测性能。此外,本研究采集互联网上的无人机航拍火灾图像制作UFF(UAV field fire)数据集,主要对象为火焰和烟雾,包含森林和城市等火灾隐患可能发生场景。在自制数据集UFF上进行深度实验分析,MDSYOLOv8的检测精度达到93.98%,检测速度为54帧/s,并且能同时识别烟雾和火焰两种火灾场景中的主要目标,与主流目标检测方法相比,在检测精度和效率方面均展现出明显优势,更加契合航拍场景下的火灾检测应用。 展开更多
关键词 火灾检测 YOLOv8 无人机(UAV) 动态蛇形卷积 注意力机制 SIoU
在线阅读 下载PDF
暗态势计算:概念、方法与应用 被引量:1
4
作者 李超超 程兰惠 +4 位作者 杨赛赛 吕培 葛昭阳 王华 徐明亮 《计算机辅助设计与图形学学报》 北大核心 2025年第4期568-582,共15页
态势感知指对环境元素的感知、理解和预测,为高层决策提供支撑.态势信息的全面获取能够有效地提高态势感知的准确性.针对态势信息不直观、态势获取不全面的问题,提出“暗态势计算”概念,辅助人类挖掘、感知全面态势信息.首先,介绍暗态... 态势感知指对环境元素的感知、理解和预测,为高层决策提供支撑.态势信息的全面获取能够有效地提高态势感知的准确性.针对态势信息不直观、态势获取不全面的问题,提出“暗态势计算”概念,辅助人类挖掘、感知全面态势信息.首先,介绍暗态势计算的内涵和优势,并给出理论支撑;然后,充分地利用增强现实技术,以生动直观的呈现方式、沉浸式智能交互、虚实叠加等诸多优势,设计基于增强现实的人机物虚实融合暗态势计算框架,基于增强现实技术将机器的计算能力和人的认知能力结合,通过“虚实融合观察—沉浸式交互—全面分析预测”循环迭代过程实现暗态势计算;最后,以基于航母航空保障作业的半实物电子沙盘推演系统为例,阐述暗态势计算的应用.实验结果表明,所提方法的决策结果优于基于传统态势感知的决策结果,验证了该方法的合理性及优势. 展开更多
关键词 暗态势 态势感知 增强现实 态势预测 人机协同
在线阅读 下载PDF
深度学习的多视角三维重建技术综述 被引量:3
5
作者 王文举 唐邦 +1 位作者 顾泽骅 王森 《计算机工程与应用》 北大核心 2025年第6期22-35,共14页
为解决经典的多视角三维重建方法难以重建复杂物体、重建效果不佳以及在高分辨率上的扩展等问题,深度学习方法被引入用以重建具有更高精度的三维模型。系统地总结归纳、分析和比较了使用深度学习方法的多视角三维重建算法,并按照显式几... 为解决经典的多视角三维重建方法难以重建复杂物体、重建效果不佳以及在高分辨率上的扩展等问题,深度学习方法被引入用以重建具有更高精度的三维模型。系统地总结归纳、分析和比较了使用深度学习方法的多视角三维重建算法,并按照显式几何和隐式几何两种几何表示方式对近几年的多视角三维重建算法进行了分类与梳理。重点介绍了目前具有较高重建精度的将隐式函数以及体渲染相结合的神经隐式三维重建算法,并分别定量、定性分析了该类部分算法在数据集上的结果;另外列举了常用数据集和评价指标,并对未来的研究趋势和发展方向进行了展望。 展开更多
关键词 深度学习 三维重建 神经隐式表示 体渲染
在线阅读 下载PDF
基于自适应特征增强和融合的舰载机着舰拉制状态识别 被引量:1
6
作者 王可 刘奕阳 +3 位作者 杨杰 鲁爱国 李哲 徐明亮 《上海交通大学学报》 北大核心 2025年第2期274-282,共9页
拉制状态识别能辅助着舰信号官及时准确地形成后续指挥决策,是舰载机着舰引导的重要环节.提出一种基于自适应特征增强和融合的拉制状态识别方法,包含基于注意力机制的特征增强模块,通过分割特征图、串联空间域和通道域增强视觉表征能力... 拉制状态识别能辅助着舰信号官及时准确地形成后续指挥决策,是舰载机着舰引导的重要环节.提出一种基于自适应特征增强和融合的拉制状态识别方法,包含基于注意力机制的特征增强模块,通过分割特征图、串联空间域和通道域增强视觉表征能力;利用多尺度特征融合模块,将高分辨率浅层特征与语义信息丰富的深层特征进行融合,充分利用上下文语义信息.基于所提方法,设计基于可穿戴增强现实设备的着舰拉制状态识别原型系统;构建着舰作业虚实融合数据集以评估方法性能.结果表明,所提算法综合性能优于基线算法,能满足拉制状态识别的应用需求. 展开更多
关键词 舰载机 阻拦着舰 特征融合 注意力机制 状态识别
在线阅读 下载PDF
基于特征分块与域间融合的跨域足迹图像检索方法 被引量:2
7
作者 张艳 申多 +2 位作者 李增辉 朱明 粟娇娇 《计算机辅助设计与图形学学报》 北大核心 2025年第2期303-312,共10页
为了解决现有图像检索方法难以提取跨域足迹图像的高区分性域共享特征等问题,提出了一种基于特征分块与域间融合的跨域足迹图像检索方法.首先,以ResNet50为主干网络提取足迹图像全局特征;然后通过水平分块特征提取方法获取更具鉴别性的... 为了解决现有图像检索方法难以提取跨域足迹图像的高区分性域共享特征等问题,提出了一种基于特征分块与域间融合的跨域足迹图像检索方法.首先,以ResNet50为主干网络提取足迹图像全局特征;然后通过水平分块特征提取方法获取更具鉴别性的特征;最后,采用跨域特征融合方法提取域共享信息,并设计均衡损失以优化融合特征.在自行采集的200人跨域足迹图像数据集上进行实验,在光学检索压力及压力检索光学2种模式下Rank-1分别达到91.38%和84.50%,验证了所提方法的有效性. 展开更多
关键词 图像检索 跨域足迹 特征分块 特征融合 均衡损失
在线阅读 下载PDF
改进YOLOv11n的无人机小目标检测算法 被引量:11
8
作者 李彬 李生林 《计算机工程与应用》 北大核心 2025年第7期96-104,共9页
为了有效应对无人机航拍中小目标检测面临的复杂背景、目标密集、目标微小化和移动端部署等挑战,对YOLOv11n模型进行了改进。使用RFCBAMConv模块改进C3k2,增强了特征提取能力。设计了膨胀特征金字塔卷积(dilated featurepyramidconvolut... 为了有效应对无人机航拍中小目标检测面临的复杂背景、目标密集、目标微小化和移动端部署等挑战,对YOLOv11n模型进行了改进。使用RFCBAMConv模块改进C3k2,增强了特征提取能力。设计了膨胀特征金字塔卷积(dilated featurepyramidconvolution,DFPC)模块,替代了原有的SPPF层。通过多尺度膨胀卷积,加强了对无人机小目标细节特征的提取。提出了一种新的特征金字塔结构,在P2层增加160×160尺寸的特征图输出,以提取小目标特征信息。该方法替代了传统通过添加P2小目标检测头的做法。引入了CSPOK模块和ContextGuidedBlock_Down(CGBD)卷积,显著提升了全局特征的提取能力和多尺度特征的融合能力。采用动态检测头(DyHead)替代了原有的检测头,提升了模型的目标检测精度。实验结果表明,改进模型在VisDrone数据集上的mAP@0.5和mAP@0.5:0.95指标分别提高了0.071和0.049。此外,在AI-TOD和SODA-A等数据集上的泛化实验也显示,改进模型在mAP@0.5上分别获得0.055和0.048的提升,充分验证了模型的有效性和泛用性。 展开更多
关键词 小目标检测 YOLOv11 特征提取 感受野注意力
在线阅读 下载PDF
基于改进SSD的螺栓缺陷检测算法 被引量:1
9
作者 宿景芳 杜金梦 +3 位作者 王震洲 于平平 王建超 张佳佳 《传感器与微系统》 北大核心 2025年第5期129-132,137,共5页
螺栓是输电线重要组件,针对航拍输电线巡检图像中螺栓尺寸小、背景复杂的问题,提出了一种基于改进SSD的螺栓缺陷检测算法。首先,将SSD骨干网络VGG-16替换为DenseNet并在其基础上,将GAM注意力机制融入DenseNet卷积层使模型更好地捕捉全... 螺栓是输电线重要组件,针对航拍输电线巡检图像中螺栓尺寸小、背景复杂的问题,提出了一种基于改进SSD的螺栓缺陷检测算法。首先,将SSD骨干网络VGG-16替换为DenseNet并在其基础上,将GAM注意力机制融入DenseNet卷积层使模型更好地捕捉全局信息;其次,将DenseNet过渡层的平均池化操作进行替换来加深网络层数,从而增强网络特征提取能力。此外,设计了一种多尺度特征层融合模块(IPANet),结合主干网络改进后的SSD网络模型,将网络结构中的底层视觉特征和高层语义特征有机结合,从而获得更多位置信息以解决螺栓尺度小的问题。最后,自主构建了航拍输电线螺栓数据集,并进行数据增强。实验结果表明:改进算法在自主构建数据集上mAP相比原SSD算法提升了2.79%,与其他主流算法比较,改进算法检测精度和检测速度均优于其他主流算法。 展开更多
关键词 缺陷检测 DenseNet 注意力机制
在线阅读 下载PDF
基于双关键点的拥挤行人检测方法 被引量:1
10
作者 沈继锋 盛常宝 +1 位作者 陈逸飞 左欣 《江苏大学学报(自然科学版)》 北大核心 2025年第2期140-148,共9页
针对行人检测中远距离目标像素稀少和遮挡产生人体模式信息缺失导致的严重漏检问题,提出一种基于双关键点组合的行人检测方法.该方法利用人体头部与中心区域的关键点,有效提取和融合行人的判别语义特征,从而显著降低行人的漏检率.首先,... 针对行人检测中远距离目标像素稀少和遮挡产生人体模式信息缺失导致的严重漏检问题,提出一种基于双关键点组合的行人检测方法.该方法利用人体头部与中心区域的关键点,有效提取和融合行人的判别语义特征,从而显著降低行人的漏检率.首先,在深层聚合主干特征网络上引入可变形卷积来扩大感受野,增强人体模式的语义信息;其次,设计了一种基于关键点组合的双分支联合检测模块,通过重新定义不同分支的正样本,强化小尺度与遮挡目标的语义信息;最后,借助非极大值抑制算法融合双分支检测结果.结果表明:在CityPerson验证数据集的普通、小尺度与严重遮挡子集上,文中方法的平均漏检率分别达到8.24%、11.81%和30.59%,特别是对于严重遮挡子集,漏检率相比传统方法ACSP降低15.71%;文中方法检测速度也达到16帧/s;在CrowdHuman上文中方法的平均精度和平均漏检率分别达到86.30%和45.52%.与其他先进方法相比,文中方法在平均精度、漏检率和检测速度方面都呈现出更优异的性能,在密集行人的复杂场景中具有较好的应用价值. 展开更多
关键词 行人检测 拥挤场景 遮挡目标 小尺度目标 双关键点 可变形卷积 双分支融合 非极大值抑制
在线阅读 下载PDF
基于改进YOLOv5s的矿井下安全帽佩戴检测算法 被引量:5
11
作者 王媛彬 韦思雄 +2 位作者 吴华英 段誉 刘萌 《煤炭科学技术》 北大核心 2025年第S1期366-377,共12页
针对矿井下复杂环境所导致的人员安全帽检测算法精确度低、漏检率高等问题,提出一种基于YOLOv5s改进的矿井下安全帽检测算法。卷积神经网络在提取特征时由于计算机制容易导致图像全局上下文信息丢失,造成井下小目标安全帽的检测效果欠... 针对矿井下复杂环境所导致的人员安全帽检测算法精确度低、漏检率高等问题,提出一种基于YOLOv5s改进的矿井下安全帽检测算法。卷积神经网络在提取特征时由于计算机制容易导致图像全局上下文信息丢失,造成井下小目标安全帽的检测效果欠佳。为此,采用注意力机制CBAM与YOLOv5s进行融合,增强目标区域的特征图,弱化背景信息,从而帮助算法更好地定位小目标安全帽。同时,在YOLOv5s原有3个输出层的基础上新增了1个P2小目标检测层,增加了模型的多尺度感受野,可以同时捕获全局和局部上下文信息,提升了算法在复杂场景中针对小目标的检测能力。此外,采用EIoU损失替换原有的CIoU损失函数,解决预测框宽高比模糊的问题,保证回归框的精度,同时加快网络的收敛速度。通过将YOLOv5s主干网络中的普通卷积Conv替换为ShuffleNetV2,大幅减少模型参数量,提高了模型的识别速度。最后,将改进后的算法与YOLOv5s、SSD、FasterRCNN以及YOLOv7算法进行对比分析,实验结果表明:将改进后的算法应用于矿井下人员安全帽检测中,相比于原YOLOv5s,准确率提升了2.9%,召回率提升了2.42%,参数量减少了7.6%,最终在矿井下安全帽检测的平均精度mAP@.5达到了87.5%。 展开更多
关键词 安全帽检测 YOLOv5s 矿井 CBAM ShuffleNetV2
在线阅读 下载PDF
基于单视角RGBD图像的柑橘果实三维重建与表型检测方法 被引量:1
12
作者 徐胜勇 易同舟 +3 位作者 秦子轶 樊清涛 杨宏磊 李善军 《农业机械学报》 北大核心 2025年第3期80-90,共11页
水果表型的测量和分析是植物育种和遗传学研究的一个重要领域。单视角RGBD图像的表型检测方法通量高、成本低,但受限于传感器分辨率和视角,通常无法获取果实的表面积和体积等数据。本文提出了一种基于PFNET的点云补全网络改进方法,可使... 水果表型的测量和分析是植物育种和遗传学研究的一个重要领域。单视角RGBD图像的表型检测方法通量高、成本低,但受限于传感器分辨率和视角,通常无法获取果实的表面积和体积等数据。本文提出了一种基于PFNET的点云补全网络改进方法,可使用深度相机获取的类球形果实单视角点云进行高精度三维重建并进行表型无损测量。为解决补全网络输入比例不固定的问题,提出了一种自适应几何补全策略将单视角点云补全为近似的半球。在PFNET网络框架上增加了第4尺度,以充分利用KINECT相机获取的稠密点云,有利于复杂形状和细节丰富的结构补全。通过引入四头自注意力模块,能更好地捕捉点云中各点间的相互依赖和空间关系,提升网络特征提取能力。增添了果实点云优化模块,解决原网络生成点云存在局部扩散的问题并提升点云质量,模拟人工测量方式设计了针对性的表型检测方法。实验结果表明,该方法与结构光三维扫描仪获取的柑橘果实点云质量接近,三维重建还原度高。对于横径、纵径、表面积和体积4种表型检测的R^(2)均大于0.96,平均测量精度均超过93.24%。与RGBD图像法相比,单果检测时间增加17.97 s,但横纵径检测精度大幅提高,且能一次测量4项表型参数。与三维扫描仪方法相比,检测精度差值在4个百分点以内,但速度超过48倍,硬件成本只有后者的1/10,且易于实现自动化。本文方法在检测精度、运行速度、硬件成本和自动化程度上具有较好的平衡,是一种低成本、综合性能高的三维重建技术,有广泛应用于类球形果实表型无损测量的潜力。 展开更多
关键词 球形果实 表型检测 点云补全 深度学习 PFNET RGBD图像
在线阅读 下载PDF
基于深度学习的矿井智能目标检测技术研究综述 被引量:4
13
作者 张帆 张嘉荣 程海星 《煤炭科学技术》 北大核心 2025年第S1期284-296,共13页
随着深度学习理论的研究与发展,基于深度学习的目标检测技术在智能化矿山领域取得了显著进展,目标检测已成为人工智能技术在煤矿应用场景的典型范式和研究热点。然而深度学习目标检测对标注数据集依赖性强,存在模型可解释性差、计算复... 随着深度学习理论的研究与发展,基于深度学习的目标检测技术在智能化矿山领域取得了显著进展,目标检测已成为人工智能技术在煤矿应用场景的典型范式和研究热点。然而深度学习目标检测对标注数据集依赖性强,存在模型可解释性差、计算复杂等问题,如何提高矿井目标检测精度、模型自适应性和计算效率,是矿山人工智能领域亟待解决的研究课题。对煤矿井下智能目标检测技术及其研究进展进行综述。首先,简要概述了目标检测技术,介绍了基于深度学习的目标检测技术演进过程和算法分类,并分析比较了基于CNN和Transformer的目标检测网络。然后,重点研究了矿井智能目标检测的数据增强、超分辨率重建、特征提取等关键技术,并围绕煤矿“人-机-环”应用需求,详细阐述了基于深度学习的目标检测在井下人员安全监测、矿井设备智能检测、工况环境感知等方面的研究进展。最后,指出了煤矿应用场景下智能目标检测技术在数据集构建、模型优化、多源异构数据融合等方面仍存在挑战,讨论了煤矿智能目标检测技术的发展趋势。并提出未来应致力于将目标检测技术与小样本学习和多模态融合、模型轻量化和边缘计算、数字孪生和具身智能等新兴技术相结合,以此促进智能检测技术与煤矿安全生产的深度融合与应用,为矿井智能目标检测技术体系构建提供理论参考。 展开更多
关键词 煤矿智能化 目标检测 深度学习 数字孪生 具身智能
在线阅读 下载PDF
多尺度特征交互的伪标签无监督域自适应行人重识别 被引量:1
14
作者 刘仲民 杨富君 胡文瑾 《光电工程》 北大核心 2025年第1期53-66,共14页
针对无监督域自适应行人重识别中存在的感受野不足、全局特征与局部特征联系不紧密等问题,提出了一种多尺度特征交互的无监督域自适应行人重识别方法。首先利用特征压缩注意力机制对图像特征进行压缩并输入到网络以增强丰富的局部信息... 针对无监督域自适应行人重识别中存在的感受野不足、全局特征与局部特征联系不紧密等问题,提出了一种多尺度特征交互的无监督域自适应行人重识别方法。首先利用特征压缩注意力机制对图像特征进行压缩并输入到网络以增强丰富的局部信息。其次,设计了残差特征交互模块,通过特征交互的方式将全局信息编码到特征中,同时增大模型感受野,强化网络对行人特征信息的提取能力。最后,采用基于部分卷积的瓶颈层模块在部分输入通道上进行卷积运算以减少冗余计算,提高空间特征提取效率。实验结果显示,该方法在三个适应性数据集上mAP分别达到了82.9%、68.7%、26.6%,Rank-1分别达到了93.7%、82.7%、54.7%,Rank-5分别达到了97.4%、89.9%、67.5%。表明所提方法能够使行人特征得到更好的表达,识别精度得到提高。 展开更多
关键词 行人重识别 无监督域自适应 特征压缩 多尺度特征交互 部分卷积
在线阅读 下载PDF
动态场景下火灾烟雾多特征融合识别定位研究 被引量:1
15
作者 陈贵亮 金天宇 杨冬 《传感器与微系统》 北大核心 2025年第6期33-37,共5页
提出了一种动态场景下火灾烟雾多特征融合识别定位算法。为解决动态场景下烟雾准确识别与定位问题,将ORB特征提取结合改进的K—最近邻(KNN)算法,实现了更准确的特征点匹配,通过特征点对灰度阈值划分,实现特征点的分离,达到精确的背景补... 提出了一种动态场景下火灾烟雾多特征融合识别定位算法。为解决动态场景下烟雾准确识别与定位问题,将ORB特征提取结合改进的K—最近邻(KNN)算法,实现了更准确的特征点匹配,通过特征点对灰度阈值划分,实现特征点的分离,达到精确的背景补偿;从烟雾静态特征出发,经过烟雾增强的颜色分割后,引入暗通道帧差法,结合亮度视觉注意机制模型,突出烟雾显著区域,实现了轮廓区域精准分割;最后将烟雾纹理信息与轮廓不规则性两类特征进行融合,对融合后的特征向量进行支持向量机(SVM)训练,实现烟雾区域的最终判定。定位实验表明:所提算法具有能够满足动态场景下的火灾烟雾准确识别与定位。 展开更多
关键词 图像处理 火灾烟雾识别 背景补偿 特征融合 支持向量机
在线阅读 下载PDF
融合注意力机制与改进ResNet50的服装图像属性预测方法 被引量:1
16
作者 游小荣 李淑芳 邵红燕 《现代纺织技术》 北大核心 2025年第1期58-64,共7页
为了解决人工标注服装图像属性效率低下的问题,提出了一种融合注意力机制与改进ResNet50的服装图像属性预测方法。首先对传统多标签分类方法中的模型进行了改进,改进后的方法能更充分利用任务之间的相关性,并减少数据稀缺问题带来的影响... 为了解决人工标注服装图像属性效率低下的问题,提出了一种融合注意力机制与改进ResNet50的服装图像属性预测方法。首先对传统多标签分类方法中的模型进行了改进,改进后的方法能更充分利用任务之间的相关性,并减少数据稀缺问题带来的影响;接着引入CBAM注意力机制,用于捕捉服装属性上的细节特征。结果表明:在未引入注意力机制的情况下,基于改进ResNet50的方法在多项评价指标上均优于传统多标签分类方法,准确率提高了25.96%;与ResNet34、EfficientNet_V2、VGG16模型相比,ResNet50模型在服装图像属性预测方面整体表现更佳;引入CBAM注意力机制后,基于改进ResNet50的方法的准确率再提高了1.72%。所提的融合注意力机制与改进ResNet50的服装图像属性预测方法,能够有效预测服装图像属性,为实现服装图像属性的自动化标注提供了新的思路。 展开更多
关键词 服装图像 属性预测 注意力机制 ResNet50 深度学习
在线阅读 下载PDF
基于改进SSD的无人机航拍小目标检测 被引量:4
17
作者 刘卿卿 吴南 +2 位作者 刘明江 武恒飞 盛玉欣 《电光与控制》 北大核心 2025年第5期86-90,96,共6页
针对无人机航拍视角下目标尺寸小且密集、检测场景复杂、目标被遮挡导致检测精度不高的问题,提出了一种基于改进SSD的小目标检测算法。首先,用SE-ResNet50代替VGG16作为主干网络,通过学习自适应的通道权重,使模型更加关注有用的通道信息... 针对无人机航拍视角下目标尺寸小且密集、检测场景复杂、目标被遮挡导致检测精度不高的问题,提出了一种基于改进SSD的小目标检测算法。首先,用SE-ResNet50代替VGG16作为主干网络,通过学习自适应的通道权重,使模型更加关注有用的通道信息;而后,修改了浅层网络的锚框参数,提高小目标的检测性能;在浅层网络中使用SE+SAM和CBAM两种组合,从通道和空间两个维度对图像进行关注;最后,使用EIoU代替传统IoU来计算交并比,选择FocalL1损失函数,整合EIoU和FocalL1损失函数,得到最终的Focal-EIoU。实验采用VisDrone2019数据集进行验证,相较于传统SSD算法,精确率、召回率和mAP分别提升了11.7、11.2和9.8个百分点,FPS提升5帧/s,验证了该算法对小目标检测的有效性。 展开更多
关键词 无人机 航拍图像 小目标检测 注意力机制 损失函数
在线阅读 下载PDF
基于BP二分类网络的复杂加工特征的识别算法 被引量:1
18
作者 王洪申 贾苏洋 强会英 《计算机辅助设计与图形学学报》 北大核心 2025年第7期1192-1204,共13页
加工特征识别能够从实体模型的几何和拓扑关系中提取出有价值的制造语义信息,是实现从设计到数字化加工无缝连接的重要方法.针对现有的加工特征识别方法对复杂特征的处理不能满足工程需要的问题,为了提高对复杂制造特征的识别性能,提出... 加工特征识别能够从实体模型的几何和拓扑关系中提取出有价值的制造语义信息,是实现从设计到数字化加工无缝连接的重要方法.针对现有的加工特征识别方法对复杂特征的处理不能满足工程需要的问题,为了提高对复杂制造特征的识别性能,提出一种基于反向传播(BP)二分类网络的复杂加工特征识别算法.首先根据构成特征的特征面的边的属性自定义特征编码规则,并将特征表示为12维特征向量;然后针对铣削零件中常见的6种加工特征设计了6种多重BP二分类网络,并运用自主设计的特征数据集对网络进行训练,获得了良好的特征识别效果;为了构建用于训练的较大规模的加工特征数据集,提出特征数据集自动生成方法,运用广义几何欧拉公式对自动生成特征数据集的模型进行有效性验证;最后针对相交加工特征,运用基面的概念将相交特征分解为多个孤立特征,再运用所设计的神经网络进行特征识别.自建模型实例并抽取ESB模型库中部分模型进行测试,测试结果表明该算法可有效地实现铣削零件上加工特征的识别. 展开更多
关键词 加工特征 特征识别 反向传播二分类网络 相交特征
在线阅读 下载PDF
基于复合域多尺度分解的红外偏振图像融合方法 被引量:1
19
作者 陈广秋 魏洲 +1 位作者 段锦 黄丹丹 《吉林大学学报(理学版)》 北大核心 2025年第2期479-491,共13页
针对目前红外偏振融合图像质量差、偏振信息缺失、目标纹理细节不够等问题,提出一种基于复合域多尺度分解的红外偏振图像融合方法.首先,在空间域内利用引导滤波器对源图像进行二尺度分解,得到细节层和基础层,在频域内利用非下采样剪切... 针对目前红外偏振融合图像质量差、偏振信息缺失、目标纹理细节不够等问题,提出一种基于复合域多尺度分解的红外偏振图像融合方法.首先,在空间域内利用引导滤波器对源图像进行二尺度分解,得到细节层和基础层,在频域内利用非下采样剪切波变换对基础层图像进行多尺度多方向分解,得到低频子带图像和高频子带图像;其次,对高频子带采用主成分分析-自适应脉冲耦合神经网络融合规则,对低频子带采用改进的卷积稀疏表示进行系数合并,细节层融合采用基于像素相似度的局部能量加权和选择性融合规则;最后,在复合域内利用逆变换重构出融合图像.实验结果表明,该方法在主观视觉性能和8个客观评价指标上均优于其他对比融合方法,说明该方法在红外偏振图像融合中具有较多优势,能有效提高融合图像的质量. 展开更多
关键词 红外偏振图像融合 非下采样剪切波变换 自适应脉冲耦合神经网络 卷积稀疏表示
在线阅读 下载PDF
机器视觉技术在航空装配中的应用现状与展望 被引量:3
20
作者 茅健 廖茂成 +1 位作者 周海军 赖磊捷 《航空制造技术》 北大核心 2025年第5期26-46,共21页
机器视觉技术凭借其非接触、高精度和自动化的特点,在航空装配中得到了广泛应用。本文从视觉测量、视觉引导和视觉检测3个方面综述了机器视觉技术在航空装配中的应用现状。视觉测量通过捕捉部件的图像信息实现位姿测量、外形尺寸检测及... 机器视觉技术凭借其非接触、高精度和自动化的特点,在航空装配中得到了广泛应用。本文从视觉测量、视觉引导和视觉检测3个方面综述了机器视觉技术在航空装配中的应用现状。视觉测量通过捕捉部件的图像信息实现位姿测量、外形尺寸检测及孔位精度控制,可以提高装配精度、减少装配错误。视觉引导通过图像分析准确判断装配机器人或其他设备的相对位姿,提高自动化程度。视觉检测用于识别装配过程中的错漏装、多余物以及装配损伤等问题,以确保最终产品的质量。在未来的航空装配领域中,视觉技术将结合其他传感器与人工智能技术构建数字化测量系统,进一步提升装配的效率和精度。 展开更多
关键词 机器视觉 航空装配 视觉测量 视觉引导 视觉检测
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部