期刊文献+
共找到62,669篇文章
< 1 2 250 >
每页显示 20 50 100
基于多尺度特征增强的航拍小目标检测算法
1
作者 肖剑 何昕泽 +2 位作者 程鸿亮 杨小苑 胡欣 《浙江大学学报(工学版)》 北大核心 2026年第1期19-31,共13页
针对航拍图像小目标检测中存在的检测精度低和模型参数量大的问题,提出兼顾性能与资源消耗的航拍小目标检测算法.以YOLOv8s为基准网络,通过降低通道维数和加强对高频特征的关注,提出自适应细节增强模块(ADEM),在减少冗余信息的同时加强... 针对航拍图像小目标检测中存在的检测精度低和模型参数量大的问题,提出兼顾性能与资源消耗的航拍小目标检测算法.以YOLOv8s为基准网络,通过降低通道维数和加强对高频特征的关注,提出自适应细节增强模块(ADEM),在减少冗余信息的同时加强对小目标细粒度特征的捕获;基于PAN-FPN架构调整特征融合网络,增加对浅层特征的关注,同时引入多尺度卷积核增强对目标上下文信息的关注,以适应小目标检测场景;针对传统IoU灵活性、泛化性不强的问题,构建参数可调的Nin-IoU,通过引入可调参数,实现对IoU的针对性调整,以适应不同检测任务的需求;提出轻量化检测头,在增强多尺度特征信息交融的同时减少冗余信息的传递.结果表明,在VisDrone2019数据集上,所提算法以8.08×106的参数量实现了mAP0.5=50.3%的检测精度;相较于基准算法YOLOv8s,参数量降低了27.4%,精度提升了11.5个百分点.在DOTA与DIOR数据集上的实验结果表明,所提算法具有较强的泛化能力. 展开更多
关键词 目标检测 YOLOv8 无人机图像 特征融合 损失函数
在线阅读 下载PDF
重构YOLOv11的无人机小目标检测算法
2
作者 孟昱煜 孔垂乐 +1 位作者 火久元 武泽宇 《浙江大学学报(工学版)》 北大核心 2026年第2期303-312,331,共11页
无人机视角下目标偏小、背景复杂、场景包含多尺度信息,现有算法在小目标检测中特征提取不充分、检测效果不佳,为此提出面向多尺度复杂场景、无人机视角下基于重构YOLOv11的小目标检测算法DLSRF-Net.提出自适应深度可分离感受野注意力... 无人机视角下目标偏小、背景复杂、场景包含多尺度信息,现有算法在小目标检测中特征提取不充分、检测效果不佳,为此提出面向多尺度复杂场景、无人机视角下基于重构YOLOv11的小目标检测算法DLSRF-Net.提出自适应深度可分离感受野注意力卷积模块(DSRFAConv),提升模型对小目标感受野特征的提取能力并降低模型负载;设计多分支轻量化多尺度线性注意力机制,提升模型对小目标的关注度;设计RSCDI模块作为模型的上采样层和全连接层,解决特征信息丢失问题并抑制无用信息,提升模型的检测精度.按照参数量和计算量将模型尺寸分为2类,并在VisDrone2021数据集上进行实验验证,结果表明,所提算法在2类模型尺寸下均取得了最优性能.在DOTA和SSDD数据集上验证了所提算法的泛化能力. 展开更多
关键词 小目标检测 复杂场景 YOLOv11 多尺度线性注意力 RSCDI
在线阅读 下载PDF
多模态特征交互与语义引导融合的RGB-T人群计数
3
作者 陈永 张娇娇 董珂 《北京航空航天大学学报》 北大核心 2026年第1期28-37,共10页
RGB-T模态人群计数旨在利用可见光RGB和热红外图像的互补性实现人群计数。针对RGB-T多模态人群计数方法在特征提取时,存在模态间信息交互不足、特征融合不充分,导致人群计数结果不准确的问题,提出了一种多模态特征交互与语义引导融合的R... RGB-T模态人群计数旨在利用可见光RGB和热红外图像的互补性实现人群计数。针对RGB-T多模态人群计数方法在特征提取时,存在模态间信息交互不足、特征融合不充分,导致人群计数结果不准确的问题,提出了一种多模态特征交互与语义引导融合的RGB-T人群计数方法。设计堆叠小尺度卷积核作为主干网络分支,提取各单模态的粗特征;提出多模态特征交互模块,对RGB和热红外各模态进行特征精细提取,实现模态间信息交互,克服信息交互不足的缺点;设计语义引导融合模块,通过全局与局部特征引导融合,增强多模态人群特征语义相关性,以充分融合多元上下文信息,提高人群目标的识别能力;利用回归头生成人群密度图,并输出计数结果。实验结果表明:所提方法在公开RGBT-CC数据集上各评价指标均优于对比方法,相较于CMCRL方法,所提方法的均方根误差降低了31.12%,对不同场景下人群计数具有更高的准确率。 展开更多
关键词 深度学习 RGB-T 人群计数 多模态特征交互 语义引导融合
在线阅读 下载PDF
基于跨模态多头注意力的交通量音视融合检测方法
4
作者 马庆禄 吴斐斐 +2 位作者 吴跃川 张丽 张埂 《重庆交通大学学报(自然科学版)》 北大核心 2026年第1期95-105,共11页
针对传统视觉或音频信号在交通量检测中均无法充分捕捉时域和频域细节信息的问题,提出了基于跨模态多头注意力的交通量音视融合检测方法。该方法通过构建一种跨音视频模态的交通量检测模型,获取高质量的交通视觉模态表征和声音模态表征... 针对传统视觉或音频信号在交通量检测中均无法充分捕捉时域和频域细节信息的问题,提出了基于跨模态多头注意力的交通量音视融合检测方法。该方法通过构建一种跨音视频模态的交通量检测模型,获取高质量的交通视觉模态表征和声音模态表征并进行高效融合。首先,采用Res2Net网络与DCNv3网络对音视频数据进行特征提取,通过双向长短期记忆网络对时间序列特征处理,分别分析了音视频中复杂行为序列,获取丰富性和连贯性的交通信息描述;其次,在跨模态融合中将交叉注意力与多头注意力结合,利用多个子空间进行合并输出,进行多头注意力跨模态融合;最后,将交叉熵损失和一致性损失联合应用,加强对不同模态信息的协调解析,确保多模态数据在分类和识别任务中的一致性表现。实验结果表明在交通量检测场景下笔者方法分别比单一音频、视频与AVSS(audio-visual speech separation,AVSS)中的融合方法的平均车辆检测准确率提高了2.57%、1.70%、0.95%,车辆平均分类准确率分别提高了4.72%、1.78%、1.62%,总体交通量平均检测准确率分别提高了4.41%、2.96%、1.46%,且在4种不同场景下表现稳定。 展开更多
关键词 交通工程 交通量检测 音视融合 跨模态 注意力机制
在线阅读 下载PDF
基于图像匹配的高空大斜视无源目标定位
5
作者 贾平 李昌灏 +3 位作者 孙辉 宋悦铭 祃卓荦 徐芳 《光学精密工程》 北大核心 2026年第1期124-138,共15页
提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似... 提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似正射变换,并截取对应区域的卫星图像。采用RepVGG提取图像粗特征,通过互最近邻实现初步匹配,并结合MiHo与归一化互相关(Normalized Cross Correlation,NCC)筛选匹配点对。最后,借助Transformer模块完成精细化匹配,再根据精匹配结果构建角度误差修正矩阵,多次迭代修正系统误差。实验结果表明,所提方法的定位精度较传统方法有较大幅度提升,在典型应用场景下提升约70%,在斜距90 km的情况下,定位精度可维持在120 m左右。该方法突破了传统无源定位对角度精度的高度依赖,验证了基于图像匹配的无源定位路径的可行性与有效性。 展开更多
关键词 图像匹配 目标定位 航空光电系统 无源定位 大斜视 TRANSFORMER
在线阅读 下载PDF
基于YOLOv8s多阶段算法的幼猪吮乳行为识别研究
6
作者 陈创业 刘兹豪 +4 位作者 胡天让 谢晓丽 李洋 陈立涛 刘根新 《农机化研究》 北大核心 2026年第3期185-193,共9页
针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助De... 针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助DeepSORT算法来实行跨帧目标追踪并分配唯一标识;然后,把多张连续检测图片输入到LSTM模型里进行时序建模,从而判定出该段时间范围内的幼猪是否正在吮乳。于养殖场的母猪产房拍摄了26 320张照片、采集了4 930组行为序列数据集进行试验,结果表明,在mAP@0.5评价标准下,以YOLOv8s模型为基准的目标检测准确率为91.7%,召回率为92.3%,系统整体追踪准确值(MOTA)达到85.6%,且系统可在复杂的养殖环境下做到稳定运行。将该系统布置到云端平台上,可进行云端处理、数据可视化和远程监控等功能,即时展示每头幼猪的吮乳次数和时长,快速找出进食异常的幼猪个体,优化管理效率。 展开更多
关键词 幼猪行为识别 目标检测 多目标跟踪 时序模型 吮乳监测 智能养殖
在线阅读 下载PDF
基于深度霍夫投票的建筑点云轻量级表面重建
7
作者 陈佳舟 朱肖航 +5 位作者 徐阳辉 高崟 鲁一慧 毛真 李胜龙 章超权 《浙江大学学报(工学版)》 北大核心 2026年第2期341-350,共10页
针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难... 针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难的问题,使用深度霍夫投票预测建筑平面,采用基于面的非极大值抑制算法(F-NMS)有效去除预测的重复面以及错误面.设计建筑平面相邻关系预测模块,对经过非极大值抑制后的建筑平面进行相邻关系的预测.定量实验结果表明,与如PolyFit的传统方法相比,所提方法在拟合精度与场景适应性方面均具有显著优势.使用所提方法重建的建筑多边形网格模型保留了输入建筑点云的主要结构特征,存储量不到原始点云的1%. 展开更多
关键词 三维点云 建筑简化 三维重建 霍夫投票 网格模型
在线阅读 下载PDF
通道注意力指导全局-局部语义协同的表情识别
8
作者 吕景刚 高硕 +1 位作者 李玉芝 周金 《计算机科学》 北大核心 2026年第1期195-205,共11页
情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通... 情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通道注意力策略,并结合全局和局部特征的协同机制来提升识别性能。首先,提出了一种抗噪数据增强策略,通过随机高斯模糊、透视变换和色彩扰动等抗噪预处理技术,结合图像拼接、随机翻转和旋转,在保留原始表情的细微特征的同时,提升图像清晰度并丰富数据集多样性和模型在细微情感识别中的鲁棒性。然后,设计了自适应分组排序的通道注意力模块(Channel Attention Module with Adaptive Channel Reordering,CAM-ACR),根据通道注意力函数对通道特征进行重排序,再经分组卷积和拼接获取包含多维度语义信息的局部特征。其次,在局部-全局特征增强机制中,利用局部特征指导优化全局特征的提取,增强全局特征对复杂情感模式和上下文信息的表征能力。最后,将局部特征与全局特征输入改进的交叉注意力融合模块,实现全局与局部特征之间的双向引导与协同增强。实验结果表明,所提方法在RAF-DB,CK+,FER2013和FER2013PLUS数据集上准确率分别达到91.21%,98.31%,74.54%和86.74%,在RAF-DB上学习效率和收敛稳定性均有优势^(1)。 展开更多
关键词 表情识别 局部特征 全局特征 注意力机制 噪声对抗
在线阅读 下载PDF
用于鱼眼图像自适应矫正的注意力金字塔网络
9
作者 张博 李雪 +4 位作者 王白阳 李光健 王国平 潘杨 朱磊 《电光与控制》 北大核心 2026年第1期106-111,共6页
针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增... 针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增强空间金字塔(AASP)模块以加强特征提取;其次,考虑到不同区域的畸变程度差异,在失真矫正阶段引入可变形卷积,以自适应处理不同程度的畸变;最后,为解决失真矫正过程中信息细节丢失导致的图像模糊问题,在编码阶段嵌入SimAM注意力机制,以专注图像关键区域。仿真结果表明:APFC-Net在Place 2数据集上优于MLC和SimFIR等方法;相较于PCN方法,其PSNR和SSIM分别提升9.11%和27.14%,验证了模型在图像矫正中的有效性。 展开更多
关键词 鱼眼图像 畸变矫正 机器视觉 深度学习
在线阅读 下载PDF
基于深度学习的大规模光纤激光相干合成相位控制的异常检测
10
作者 李国豪 顾静良 +3 位作者 唐乾轲 李正东 颜宏 王锋 《强激光与粒子束》 北大核心 2026年第1期131-139,共9页
光纤激光相干合成技术通过精确控制各路光纤激光的相位,实现高功率的激光输出。然而,系统运行中存在多种影响因素,如相位控制精度、光强稳定性、通信链路可靠性以及环境干扰等,这些因素可能导致系统性能下降。针对大规模光纤激光相干合... 光纤激光相干合成技术通过精确控制各路光纤激光的相位,实现高功率的激光输出。然而,系统运行中存在多种影响因素,如相位控制精度、光强稳定性、通信链路可靠性以及环境干扰等,这些因素可能导致系统性能下降。针对大规模光纤激光相干合成相位控制中的异常检测问题,提出一种基于深度学习的多探测器串行共孔径相干合成检测新方法。首先,采集十路光纤激光相干合成数据,分析系统控制过程及其合束原理,归类系统中可能出现的异常情况,并仿真得到数据集。其次,设计一种结合轻量化高效多头注意力机制(EMA)的EMA-Transformer网络模型。在对比实验中,本算法相较于ResNet50,在验证集上的精度提升了约50%,在测试集上的精度提升了约2.20%。在算法的实际应用中,搭建八束光纤激光相干合成实验装置,使用TensorRT部署算法进行测试。实验结果表明,本算法推理耗时达2.153 ms,达到了相位控制异常检测的实时性要求。 展开更多
关键词 深度学习 相干合成 异常检测 多头注意力机制
在线阅读 下载PDF
基于Swin-PIDNet的纸质工程制图线型识别方法
11
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet Swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
基于深度学习的双域信息CT金属伪影抑制方法
12
作者 海潮 田鑫 +4 位作者 张宏 谭大龙 何一新 孟凡勇 杨民 《北京航空航天大学学报》 北大核心 2026年第1期232-243,共12页
当CT扫描视野中出现金属时,重建图像不可避免地会产生金属伪影,严重影响图像质量。为了抑制金属伪影,提出一种新的深度学习CT金属伪影抑制(MAR)方法,结合正弦图域和图像域的双域信息,采用自适应最优阈值分割方法分割CT图像中的金属,并... 当CT扫描视野中出现金属时,重建图像不可避免地会产生金属伪影,严重影响图像质量。为了抑制金属伪影,提出一种新的深度学习CT金属伪影抑制(MAR)方法,结合正弦图域和图像域的双域信息,采用自适应最优阈值分割方法分割CT图像中的金属,并在正弦图中去除金属污染区域,使用线性插值(LI)初步修复缺失的金属区域,采用正弦图修补网络修复受金属污染的正弦图,利用编码器-解码器网络结构恢复缺失的图像信息。网络输出的正弦图经过滤波反投影(FBP)算法生成CT重建图像。对于初步校正后存在的正弦图信息不一致性问题,使用非局部细化网络在图像域进行修复,减少二次伪影产生。模拟和真实数据实验结果表明:所提方法能有效减少金属伪影,同时保留图像细节信息,显著提高重建图像质量。 展开更多
关键词 图像处理 深度学习 金属伪影抑制 双域信息 Pix2Pix 非局部细化网络
在线阅读 下载PDF
基于轻量化SuperPoint网络的水下光学图像特征提取
13
作者 刘艳 朱昌盛 +1 位作者 余彬 霍冠英 《河海大学学报(自然科学版)》 北大核心 2026年第1期167-176,共10页
针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意... 针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意力融合模块,融合频域与空间域的特征信息,提升网络在水下退化图像中的特征提取能力;构建残差特征增强深度可分离卷积模块,以降低模型复杂度并增强网络的特征提取能力。验证结果表明:该网络较SuperPoint网络参数量减少了13.8%,计算量降低了8.0%,帧率提升31.7%,光照变化和视角变化下的重复率分别提高了2.3%和2.1%,在SQUID和FLSea数据集上的特征点检测与匹配性能评估中具有较好的特征提取鲁棒性。 展开更多
关键词 水下光学图像 SuperPoint网络 轻量化网络 特征提取 特征融合
在线阅读 下载PDF
基于多模态改进残差网络的输电线路绝缘子覆冰类型识别方法
14
作者 谢静 肖韩 +4 位作者 刘志坚 龙志宏 张德龙 韩一瑞 张帅龙 《电力系统保护与控制》 北大核心 2026年第1期130-142,共13页
电力输电设备覆冰不仅会增加绝缘子表面的负荷,还会导致电弧击穿和绝缘失效等严重问题,威胁电力输送的可靠性与安全性。传统的人工观察、图像处理的边缘检测和基于支持向量机(support vector machine,SVM)的方法受限于复杂的环境和不稳... 电力输电设备覆冰不仅会增加绝缘子表面的负荷,还会导致电弧击穿和绝缘失效等严重问题,威胁电力输送的可靠性与安全性。传统的人工观察、图像处理的边缘检测和基于支持向量机(support vector machine,SVM)的方法受限于复杂的环境和不稳定的气象条件,难以满足实时监测和精确分类的需求。为此,提出了一种基于多模态改进残差网络的深度学习模型。该模型结合图像特征、覆冰图像的纹理特征以及气象数据3种模态,通过特征层融合提升覆冰类型分类的准确性。首先对覆冰图像进行去雾处理,利用基于暗通道先验的改进型去雾算法去除雾霾干扰,显著提升图像的清晰度和对比度。然后,通过灰度共生矩阵(gray-level co-occurrence matrix,GLCM)提取去雾后图像的纹理特征,并结合改进的残差网络(residual network,ResNet)对纹理特征和图像特征进行处理,以全面捕捉覆冰图像中的细微结构和表面特性。接着,构建包含温度、湿度、风速的气象信息数据集。最后,将图像特征、纹理特征与气象特征相结合,形成融合多模态特征的深度学习模型。通过现场实际工况下的绝缘子覆冰样本的训练和测试,算法对覆冰类型识别的准确率达到92.9%,验证了去雾技术与融合多模态特征的深度学习模型在提升覆冰类型识别精度方面的有效性。 展开更多
关键词 绝缘子覆冰 类型识别 纹理特征 微气象 动态赋权
在线阅读 下载PDF
基于改进YOLOv8的马铃薯种薯芽眼检测
15
作者 郝敏 汤宇翔 +3 位作者 孙建英 曹星泰 王显赫 宋硕 《中国农机化学报》 北大核心 2026年第2期63-70,共8页
马铃薯芽眼检测是种薯智能化切块过程中的关键技术环节,准确快速的芽眼检测是种薯切块的前提。针对种薯芽眼目标小、表面背景干扰大等问题,融合Shuffle Attention注意力、双向加权特征金字塔网络(BiFPN)、InnerIoU和WiseIoU,提出一种基... 马铃薯芽眼检测是种薯智能化切块过程中的关键技术环节,准确快速的芽眼检测是种薯切块的前提。针对种薯芽眼目标小、表面背景干扰大等问题,融合Shuffle Attention注意力、双向加权特征金字塔网络(BiFPN)、InnerIoU和WiseIoU,提出一种基于YOLOv8n的芽眼检测模型。首先将原模型的颈部网络替换为双向特征金字塔网络BiFPN,增强模型多尺度特征融合能力;之后,在主干网络SPPF的前一层增加Shuffle Attention注意力机制,提升模型的特征提取能力;最后,在损失函数部分,融合InnerIoU和WiseIoU,替换CIoU,加快模型的收敛,提升检测精度。试验表明改进后的YOLOv8网络模型,平均精度均值、精确率和召回率分别为94.1%、92.4%和91.6%,检测速度为151.5帧/s,较原模型提升显著,相比于其他模型精度高、速度快,能够满足实时检测需求,可为马铃薯种薯智能化检测提供参考。 展开更多
关键词 马铃薯种薯 芽眼检测 深度学习 注意力机制 损失函数
在线阅读 下载PDF
频域空间信息驱动的特征聚合跨模态行人重识别方法
16
作者 金静 朱传斌 翟凤文 《计算机应用研究》 北大核心 2026年第1期298-304,共7页
跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信... 跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信息且忽略了不同尺度特征语义关联性,提出一种基于频域空间信息的特征聚合(FDSIFA)网络。首先,通过设计的多分支频域空间感知模块(MFSPM),对不同模态的增强图像和原始图像充分提取模态特定信息,同时在频域和空间维度上挖掘跨模态特征的一致性,有效减小了模态间的差异;其次,设计了多阶段特征聚合模块(MFAM),自适应聚合不同尺度的特征,挖掘低层次特征与高层次特征之间的语义关联,提升特征的语义表达能力和判别力。该网络在SYSU-MM01数据集的全搜索模式下,rank-1和mAP分别达到了75.09%和71.35%,优于对比方法,实验结果验证了所提方法的有效性。 展开更多
关键词 跨模态 行人重识别 数据增强 频域空间信息 特征聚合
在线阅读 下载PDF
基于环绕式无人车表型平台和同源传感阵列的田间原位表型数据融合解析方法
17
作者 李英伦 蔡诗辰 +4 位作者 张延宇 朱永基 马锐涛 樊江川 郭新宇 《农业机械学报》 北大核心 2026年第1期19-29,共11页
作物表型信息的高通量、精准采集与解析是现代农业育种与精准栽培技术体系的基础。然而,田间复杂环境下传统人工测量方式存在效率低、劳动强度大、主观误差高等局限,难以满足大规模、多性状、连续时序的表型获取需求。为此提出了一种基... 作物表型信息的高通量、精准采集与解析是现代农业育种与精准栽培技术体系的基础。然而,田间复杂环境下传统人工测量方式存在效率低、劳动强度大、主观误差高等局限,难以满足大规模、多性状、连续时序的表型获取需求。为此提出了一种基于环绕式无人车表型平台与多模态同源传感阵列的田间原位表型数据融合解析方法。该平台集成了RGB相机、深度相机、近红外和同源传感器,能够实现对作物目标的多角度、立体化原位观测。围绕田间复杂环境下的多源异构数据处理难题,设计了系统的表型信息融合流程,包括图像预处理、深度信息提取、三维重建、时序跟踪与特征解析等关键技术模块,实现了对株高、冠层结构、空间分布等核心表型特征的高精度提取与动态重构。以田间玉米为对象的实地试验表明,该平台可在不同生育时期稳定、连续地获取高质量的多模态表型数据,重建模型的株高测量结果与人工测量高度相关,平均误差控制在5 cm以内,验证了方法的准确性与鲁棒性。与传统单点或机械旋转式观测方式相比,该平台具备更高的田间适应性与作业灵活性,可实现快速部署和高效作业,为大规模田间表型数据的采集和解析提供了有效技术支撑。本研究提出的环绕式无人车表型观测与多模态数据融合方法,为农作物育种和精准农业提供了一种高通量、低扰动、可扩展的田间原位表型组学技术解决方案。 展开更多
关键词 玉米 作物表型 无人车平台 多模态传感 数据融合 三维重建
在线阅读 下载PDF
基于自适应频率感知网络的遥感图像分割方法
18
作者 梁书绮 王雷 +3 位作者 孙燕青 刘世龙 杨善良 李彬 《电子科技大学学报》 北大核心 2026年第1期149-160,共12页
现有遥感图像分割方法在跨尺度特征融合时缺乏对低频结构与高频细节的协同处理,且无法对图像内容自适应响应,导致难以有效解决因自然变化、光照和阴影干扰引起的高分辨率遥感图像中类内差异大、类间差异小的问题。为此提出了一种自适应... 现有遥感图像分割方法在跨尺度特征融合时缺乏对低频结构与高频细节的协同处理,且无法对图像内容自适应响应,导致难以有效解决因自然变化、光照和阴影干扰引起的高分辨率遥感图像中类内差异大、类间差异小的问题。为此提出了一种自适应频率感知网络(AFANet)。首先,提出一种频率动态融合模块,通过自适应低通和高通滤波在保留低频结构的同时抑制高频噪音分量,并增强高频细节边界信息。其次,构建双域学习模块集成空间和频率信息,实现空间域局部细节与频域全局结构的联合建模。最后,引入一个细节增强模块,利用不同的差分卷积以增强模型的特征提取和泛化能力。在Vaihingen和Potsdam两个经典公开数据集上通过对比和消融实验的定量及可视化分析表明,AFANet在F1分数、总体精度和平均交并比等指标中优于7种先进的分割方法,验证了AFANet的优越性能。 展开更多
关键词 遥感图像 语义分割 特征融合 自适应频率滤波 空间域—频域Transformer
在线阅读 下载PDF
生猪背膘厚度无接触检测方法研究
19
作者 介邓飞 李家俊 +3 位作者 王杨 姜朋辉 沈美雄 何金成 《中国农机化学报》 北大核心 2026年第2期283-291,305,共10页
针对单模态生猪背膘厚度检测方法忽略生猪体尺信息,以及背部三维信息与生猪背膘厚度的联系,导致模型泛化能力不足与检测精度不能进一步提升等问题,提出一种基于多模态融合的生猪背膘厚度无接触检测方法。通过图像配准与坐标转换方法获... 针对单模态生猪背膘厚度检测方法忽略生猪体尺信息,以及背部三维信息与生猪背膘厚度的联系,导致模型泛化能力不足与检测精度不能进一步提升等问题,提出一种基于多模态融合的生猪背膘厚度无接触检测方法。通过图像配准与坐标转换方法获取生猪的体尺信息,利用体尺信息、生猪背部深度图像以及RGB图像数据,建立3种模态的7种数据集,并对比单模态、双模态以及多模态模型的检测精度。通过引入大型选择性核模型(LSK)与全维动态卷积(ODConv),提升模型感受野与提取全维特征的能力。最终,提出自注意深度平衡多模态融合算法(SDE)解决现有多模态融合算法存在的跨模态数据难以交互与特征丢失的问题。试验结果显示:增加数据模态可以有效提升模型的检测精度,与原始模型相比,引入LSK、ODConv、SDE模型后平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE分别降低30.94%、28.73%、29.82%,达到0.36 mm、0.57 mm、2.27%,决定系数R^(2)提升6.07%,为0.94。基于多模态融合的生猪背膘厚度无接触检测方法满足实际生产中对生猪背膘厚度检测精度的需求,可推动生猪背膘厚度检测技术进一步高质量发展。 展开更多
关键词 生猪 背膘厚度 多模态融合 深度学习 特征提取
在线阅读 下载PDF
基于深度学习的无人机单目标跟踪综述
20
作者 陈泷 石磊 +2 位作者 黎智辉 丁锰 潘亦伦 《计算机科学与探索》 北大核心 2026年第1期40-65,共26页
基于深度学习的无人机(UAV)单目标跟踪算法旨在从航拍视频序列中准确跟踪指定目标,已成为计算机视觉领域的研究热点。与传统地面视觉跟踪相比,无人机单目标跟踪面临着视角变化剧烈、目标尺度复杂多变、计算资源受限等独特挑战。基于网... 基于深度学习的无人机(UAV)单目标跟踪算法旨在从航拍视频序列中准确跟踪指定目标,已成为计算机视觉领域的研究热点。与传统地面视觉跟踪相比,无人机单目标跟踪面临着视角变化剧烈、目标尺度复杂多变、计算资源受限等独特挑战。基于网络架构特点,将基于深度学习的无人机单目标跟踪方法系统梳理为传统Siamese网络、CNN-Transformer混合架构和全Transformer三大技术路线,重点关注2022—2025年间的最新研究进展。创新性地提出了两个细化分类框架:针对CNN-Transformer混合架构提出模块替代、特征后融合和协同建模三分类;针对Transformer单流方法提出静态计算、混合机制和动态计算三分类。系统揭示了无人机单目标跟踪算法从追求性能最大化向性能与效率协同优化的演进趋势。通过在UAV123、DTB70、UAVDT、VisDrone2018等主流数据集上的性能对比分析,验证了不同技术路线的优势与局限性。识别当前技术面临的关键挑战并提出未来发展方向和工程部署指导。 展开更多
关键词 无人机 单目标跟踪 深度学习 Siamese网络 TRANSFORMER
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部