-
题名融合红外与可见光的双流架构矿井下目标检测算法
- 1
-
-
作者
井晶
刘营
赵作鹏
胡建峰
-
机构
中国矿业大学计算机科学与技术学院
江苏联合职业技术学院徐州财经分院
-
出处
《红外技术》
北大核心
2025年第9期1152-1159,共8页
-
基金
国家自然科学基金项目资助(61976217)。
-
文摘
强光扰、低光照等恶劣条件是矿井下目标检测的一大困扰,单一可见光的检测时常出现漏检或误检的情况,现有的可见光与红外图像融合算法往往无法更好地同时提取两种图像的特征。针对上述问题,提出了一种可见光与红外图像多尺度融合目标检测算法DF-YOLOv8。通过构建双流特征提取器架构,分别对低分辨率红外图像和可见光图像进行特征提取;采用双线性插值法对特征图进行上采样,通过通道注意力机制进行特征图的融合处理;引入融合加权特征损失函数和一致性损失策略,优化模型的适应性和鲁棒性。消融实验与对比实验的结果表明,采用上述方法,模型在自建数据集Coal-Mine Video上的平均精度均值(mAP)达到87.9%,相较于YOLOv7、YOLOv8分别提升6.0%、5.7%,检测速度达到67FPS,确保实时监测的需求。
-
关键词
YOLOv8
双流架构
红外图像
多尺度融合
特征提取
-
Keywords
YOLOv8
dual-stream architecture
infrared image
multi-scale fusion
feature extraction
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名耦合NDVI与纹理时序特征的地块作物遥感分类
- 2
-
-
作者
史洁宁
吴田军
黄启厅
骆剑承
任应超
徐欣雨
-
机构
长安大学理学院
长安大学土地工程学院
广西农业科学院农业科技信息研究所
中国科学院空天信息创新研究院遥感科学国家重点实验室
中国科学院大学资源与环境学院
中国科学院空天信息创新研究院国家遥感应用工程技术研究中心
-
出处
《南方农业学报》
北大核心
2025年第1期29-40,共12页
-
基金
国家重点研发计划项目(2021YFB3900905)
河北省中央引导地方科技发展资金项目(236Z0104G)。
-
文摘
【目的】充分挖掘遥感影像的时间和空间信息,准确识别地块作物类型,为作物类型空间分布制图、产量估计及农业生产决策等提供可靠的数据支持。【方法】以Google Earth影像为参考,获得美国加利福尼亚州金斯县完整的地块边界,利用多时相Sentinel-2影像构建地块归一化植被指数(NDVI)时间序列和时间—纹理二维表征图作为分类特征,NDVI时间序列捕捉作物生长的物候变化,时间—纹理二维表征图捕捉空间特征随时间的动态变化,进而使用卷积神经网络(CNN)+长短时记忆网络(LSTM)双流架构来联合时间和空间特征实现农田作物的准确识别。【结果】与仅使用NDVI时序的传统方法相比,纳入纹理时序后的方法明显提高分类精度,随机森林的分类精度由0.89提升至0.93,支持向量机的分类精度由0.88提升至0.93,表明加入空间特征的纹理时序能有效提升作物分类能力;而使用CNN+LSTM双流架构分类模型进行地块作物分类的总体精度达0.95,特别是葡萄和冬小麦的分类精度提升效果明显,F_(1)分别提升至0.90和0.92,表明相较于传统的分类器,使用CNN+LSTM双流架构可实现更精准的地块作物识别。【建议】在种植结构复杂、农作物生长习性相近的地区进行地块作物遥感分类时,考虑将纹理时序特征纳入分类体系,并使用CNN+LSTM双流架构分别捕捉作物生长的时间和空间特征。这种综合应用时间和空间信息的方法,能提升地块作物分类的准确度。
-
关键词
作物分布
地块尺度
归一化植被指数(NDVI)
时间序列
空间纹理特征
CNN+LSTM双流架构
-
Keywords
crop distribution
land parcel scale
normalized difference vegetation index(NDVI)
time series
spatial texture features
CNN+LSTM dual-stream architecture
-
分类号
S127
[农业科学—农业基础科学]
-
-
题名基于运动区域差分与卷积神经网络的动作识别
被引量:9
- 3
-
-
作者
陈晓春
林博溢
孙乾
张坤华
-
机构
深圳清华大学研究院电子设计自动化实验室
鹏城实验室
深圳大学电子与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第12期274-280,293,共8页
-
基金
广东省科技计划项目(2016B010126003)
深圳市基础研究项目(JCYJ20170816151958999)
-
文摘
针对视频动作识别中数据处理效率不高的问题,建立一种基于视频帧间差分序列的动作识别模型。利用帧间差分检测视频帧中的运动区域,以该区域为中心进行相应的图像剪切和增强处理。整个识别模型采用双流架构,在数据样本制作时通过适当的隔帧差分来扩大样本的时间跨度。采用分阶段逐步增加训练样本量的方法,以提升模型识别性能并解决训练过程中易出现的过拟合问题。实验结果表明,该模型可以在CPU级配置的电脑中完成快速动作识别,且在UCF11和UCF25数据集中的识别准确率均高于85%。
-
关键词
帧间差分
动作识别
双流架构
卷积神经网络
运动区域
-
Keywords
inter frame difference
action recognition
dual-stream architecture
Convolutional Neural Network(CNN)
motion region
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-