-
题名具备红外感知的低光场景目标检测
- 1
-
-
作者
张志佳
那惺奇
肖宇航
房建
赵怀慈
-
机构
沈阳工业大学人工智能学院
沈阳市信息感知与边缘计算重点实验室
辽宁省光信息与仿真重点实验室
中国科学院沈阳自动化研究所光电信息处理重点实验室
-
出处
《沈阳工业大学学报》
北大核心
2025年第4期417-424,共8页
-
基金
辽宁省自然科学基金项目(2023010411)。
-
文摘
【目的】随着人工智能领域的快速发展,基于可见光图像的目标检测技术日益成熟,并在自动驾驶、安防监控、智能交通等领域得到了广泛应用。然而,在低光场景(如黑夜或昏暗灯光环境)下,基于可见光图像的目标检测算法性能显著下降。主要原因在于可见光图像在低光条件下信息丢失严重,导致目标特征难以提取。为解决这一问题,提出了基于可见光图像和红外图像的多模态目标检测技术,该技术能够有效改善低光场景下的目标检测性能。然而,多模态检测技术的成本较高,需要对不同模态的图像进行精确配准,计算量较大,从而增加了实现难度和处理负担。基于此,提出了一种具备红外感知的目标检测网络(InSCnet),旨在通过一个可见光相机来预测红外热辐射特征,在不增加模态的情况下提升网络在低光场景下的目标检测能力。【方法】InSCnet以可见光图像为输入,通过红外预测分支(IPB)生成红外图像来预测热辐射特征,从而增强网络对低光场景的感知能力。为了有效融合多尺度视觉和热辐射特征,设计了互补融合滤波(COFF)模块。COFF通过互补融合这两种特征,增强特征间的互补性,避免了网络对单一模态特征的过度依赖。此外,采用混合特征金字塔(HyFP)模块,通过特征金字塔和注意力机制,进一步提升多尺度全局与局部特征的融合与提取能力,确保网络在不同程度的低光条件下均能保持较高的检测准确率。【结果】实验结果表明,InSCnet在LLVIP行人检测数据集上表现优异。具体而言,S mAP50达到了0.830,S mAP50-95达到了0.426。同时在DroneVehicle数据集上进行了实验,S mAP50达到了0.702,证明了InSCnet具备多类别低光检测能力。【结论】InSCnet通过引入红外热辐射特征和特征融合机制,提升了低光场景下的目标检测性能;在低光场景下能够有效检测可见光图像中难以识别的目标,为低光场景下的目标检测提供了一种有效的解决方案。未来的研究可以进一步探索如何优化网络结构。
-
关键词
目标检测
低光场景
红外预测
特征融合
特征金字塔
全局特征
局部特征
人工智能
-
Keywords
object detection
low light scene
infrared prediction
feature fusion
feature pyramid
global feature
local feature
artificial intelligence
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度学习的鱼类识别相关技术研究现状及展望
被引量:9
- 2
-
-
作者
汤永华
张志鹏
林森
刘兴通
张志佳
-
机构
沈阳工业大学
沈阳理工大学自动化与电气工程学院
沈阳工业大学
-
出处
《海洋渔业》
CSCD
北大核心
2024年第2期246-256,共11页
-
基金
辽宁省机器人联合基金(20180520022)。
-
文摘
为促进渔业生产智能化、现代化发展,综述了基于深度学习的鱼类识别相关技术。首先,从数据集构建、数据预处理、神经网络模型设计以及模型训练等4个方面阐述了基于深度学习的鱼类识别工作流程。然后,从图像分类、目标检测、图像分割3个角度总结了近几年鱼类识别相关技术的研究进展及应用成果。其中,图像分类主要用于识别个体鱼的色泽与种类,目标检测侧重于估计鱼群的数量和体型,而图像分割则在推断鱼类的状态和行为方面发挥着重要作用。同时,分析了不同方法所具备的优势,比较了各方法在数据集中的性能指标。最后,对深度学习在鱼类识别领域的下一步发展方向和研究重点进行了展望。综上,深度学习方法效率普遍较高、泛化能力普遍较强,深度学习技术在鱼类识别中的广泛应用能够为渔业科研人员提供有效的技术支撑。
-
关键词
鱼类识别
深度学习
卷积神经网络
目标检测
图像分割
研究进展
-
Keywords
fish recognition
deep learning
convolutional neural networks
object detection
image segmentation
research progress
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进YOLO v3模型的多类交通标识检测
被引量:6
- 3
-
-
作者
张志佳
范莹莹
邵一鸣
赵永茂
-
机构
沈阳工业大学人工智能学院
沈阳市信息感知与边缘计算重点实验室
沈阳美行科技有限公司
-
出处
《沈阳工业大学学报》
CAS
北大核心
2023年第1期66-70,共5页
-
基金
国家自然科学基金项目(61540069)
辽宁省应用基础研究计划项目。
-
文摘
为了提高城市真实交通场景中的交通标志、交通信号灯及停止线检测精度,提出一种基于YOLO v3的多类交通标识检测模型——T-YOLO.该模型在YOLO v3目标检测模型的基础上,采用了四种尺度特征进行检测,设计了更贴合待测交通标识的先验框,提升了模型对多类交通标识等小目标检测性能.采集13000张城市交通场景图像并进行标注,制作成多类交通标志数据集.实验结果表明,该模型在TT100K交通标志数据集、在LaRA交通信号灯数据集均取得较好结果.同时,在自制SUTDB数据集上交通标志、交通信号灯、停止线检测精度分别为0.90、0.99、0.80.文中提出的T-YOLO模型检测实现了多类交通标识,并且检测精度高,具有一定工程实用价值.
-
关键词
交通标识
YOLO
v3模型
多尺度
先验框
特征融合
多目标检测
深度学习
-
Keywords
traffic sign
YOLO v3 model
multi-scale
anchor box
feature fusion
multi-object detection
deep learning
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语义分割的多类别地面交通标志识别
被引量:2
- 4
-
-
作者
邵一鸣
张志佳
徐佳锋
贺继昌
王士显
-
机构
沈阳工业大学信息科学与工程学院
沈阳工业大学人工智能学院
沈阳市信息感知与边缘计算重点实验室
-
出处
《实验室研究与探索》
CAS
北大核心
2023年第5期46-52,61,共8页
-
基金
2023年度辽宁省应用基础研究计划(2023JH2/101300237)。
-
文摘
无人驾驶汽车的外界环境感知系统中对地面交通标志的识别模型少,地面交通标志误分割和分割不完整,对此提出了轻量级的多类别地面交通标志分割模型。主干网络由多分支结构的重参数Vgg模块(RepVGG Block)组成,增加模型的特征表达能力,避免模型训练时的梯度消失。设计了具有倒残差结构的条形特征提取单元(IDAB Module)用于条形特征的提取,并将模块进行了串联组合,对每个单元中的卷积设置不同的空洞率,以此扩大模块中特征图的感受野,充分利用上下文信息;同时利用非对称卷积更好地提取交通标志的长条形状特征。采用地面交通标志数据集训练和测试地面交通标志分割模型,利用具有多分支结构的主干网络进行训练,测试时通过结构重参数化方法,将多分支结构融合为单路结构,以加快模型的推理速度。实验结果表明,以2 300×600大小的图像为输入,模型的测试精度mIoU最高可达到79.7%,并且有效改善了地面交通标志分割不完整和误分割的问题。
-
关键词
地面交通标志识别
语义分割
结构重参数化
非对称卷积
-
Keywords
ground traffic sign recognition
semantic segmentation
structure re-parameterization
asymmetric convolution
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-