期刊文献+
共找到41,658篇文章
< 1 2 250 >
每页显示 20 50 100
基于图像匹配的高空大斜视无源目标定位
1
作者 贾平 李昌灏 +3 位作者 孙辉 宋悦铭 祃卓荦 徐芳 《光学精密工程》 北大核心 2026年第1期124-138,共15页
提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似... 提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似正射变换,并截取对应区域的卫星图像。采用RepVGG提取图像粗特征,通过互最近邻实现初步匹配,并结合MiHo与归一化互相关(Normalized Cross Correlation,NCC)筛选匹配点对。最后,借助Transformer模块完成精细化匹配,再根据精匹配结果构建角度误差修正矩阵,多次迭代修正系统误差。实验结果表明,所提方法的定位精度较传统方法有较大幅度提升,在典型应用场景下提升约70%,在斜距90 km的情况下,定位精度可维持在120 m左右。该方法突破了传统无源定位对角度精度的高度依赖,验证了基于图像匹配的无源定位路径的可行性与有效性。 展开更多
关键词 图像匹配 目标定位 航空光电系统 无源定位 大斜视 TRANSFORMER
在线阅读 下载PDF
WTNet-YOLO:结合离散小波变换与Transformer的棉田害虫检测算法
2
作者 刘江涛 周刚 +2 位作者 刘浩南 王佳佳 贾振红 《计算机工程与应用》 北大核心 2026年第3期226-240,共15页
棉花生长过程中受到害虫严重危害,因此精准的害虫检测已成为智慧农业体系中的关键环节。其中大量棉田害虫属于小目标,特征提取困难,而且害虫个体之间存在显著的尺寸差异,这限制了现有目标检测算法的性能。提出了一种结合离散小波变换与T... 棉花生长过程中受到害虫严重危害,因此精准的害虫检测已成为智慧农业体系中的关键环节。其中大量棉田害虫属于小目标,特征提取困难,而且害虫个体之间存在显著的尺寸差异,这限制了现有目标检测算法的性能。提出了一种结合离散小波变换与Transformer的YOLO11目标检测算法——WTNet-YOLO(wavelet and Transformer network-YOLO)。融合部分卷积与多尺度深度卷积构建C3K2-MKPF模块,增强对多尺寸目标的特征提取能力。在颈部结合小波域融合模块(wavelet domain fusion module,WDFM)和跨阶段部分局部和全局模块(cross stage partial local and global block,CSP-LGB),提升各尺寸害虫的频域信息表达与全局信息定位。引入多尺度自适应空间注意门(multi-scale adaptive spatial attention gate,MASAG),动态融合主干与颈部的跨层特征,强化空间与语义信息表达。为验证相关方法,构建了一个棉田害虫数据集YST-PestCotton(yellow sticky trap pest dataset in cotton),涵盖多个尺寸范围的害虫,具有显著的尺度多样性,害虫像素面积最大可相差1200多倍。实验表明,在YST-PestCotton上mAP50提升了3.1个百分点,同时将害虫按目标框面积划分为0~256、256~512、512~1024和大于1024四个子集,mAP50分别提升2.4、1.3、1.5、3个百分点。在公开数据集Yellow sticky traps上mAP50达到了最高的95.3%。综合来看,WTNet-YOLO能够有效应对小目标内部的尺寸差异,同时兼顾不同尺寸害虫的检测需求。 展开更多
关键词 智慧农业 害虫检测 小目标 多尺寸
在线阅读 下载PDF
基于YOLOv8s多阶段算法的幼猪吮乳行为识别研究
3
作者 陈创业 刘兹豪 +4 位作者 胡天让 谢晓丽 李洋 陈立涛 刘根新 《农机化研究》 北大核心 2026年第3期185-193,共9页
针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助De... 针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助DeepSORT算法来实行跨帧目标追踪并分配唯一标识;然后,把多张连续检测图片输入到LSTM模型里进行时序建模,从而判定出该段时间范围内的幼猪是否正在吮乳。于养殖场的母猪产房拍摄了26 320张照片、采集了4 930组行为序列数据集进行试验,结果表明,在mAP@0.5评价标准下,以YOLOv8s模型为基准的目标检测准确率为91.7%,召回率为92.3%,系统整体追踪准确值(MOTA)达到85.6%,且系统可在复杂的养殖环境下做到稳定运行。将该系统布置到云端平台上,可进行云端处理、数据可视化和远程监控等功能,即时展示每头幼猪的吮乳次数和时长,快速找出进食异常的幼猪个体,优化管理效率。 展开更多
关键词 幼猪行为识别 目标检测 多目标跟踪 时序模型 吮乳监测 智能养殖
在线阅读 下载PDF
基于深度霍夫投票的建筑点云轻量级表面重建
4
作者 陈佳舟 朱肖航 +5 位作者 徐阳辉 高崟 鲁一慧 毛真 李胜龙 章超权 《浙江大学学报(工学版)》 北大核心 2026年第2期341-350,共10页
针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难... 针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难的问题,使用深度霍夫投票预测建筑平面,采用基于面的非极大值抑制算法(F-NMS)有效去除预测的重复面以及错误面.设计建筑平面相邻关系预测模块,对经过非极大值抑制后的建筑平面进行相邻关系的预测.定量实验结果表明,与如PolyFit的传统方法相比,所提方法在拟合精度与场景适应性方面均具有显著优势.使用所提方法重建的建筑多边形网格模型保留了输入建筑点云的主要结构特征,存储量不到原始点云的1%. 展开更多
关键词 三维点云 建筑简化 三维重建 霍夫投票 网格模型
在线阅读 下载PDF
通道注意力指导全局-局部语义协同的表情识别
5
作者 吕景刚 高硕 +1 位作者 李玉芝 周金 《计算机科学》 北大核心 2026年第1期195-205,共11页
情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通... 情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通道注意力策略,并结合全局和局部特征的协同机制来提升识别性能。首先,提出了一种抗噪数据增强策略,通过随机高斯模糊、透视变换和色彩扰动等抗噪预处理技术,结合图像拼接、随机翻转和旋转,在保留原始表情的细微特征的同时,提升图像清晰度并丰富数据集多样性和模型在细微情感识别中的鲁棒性。然后,设计了自适应分组排序的通道注意力模块(Channel Attention Module with Adaptive Channel Reordering,CAM-ACR),根据通道注意力函数对通道特征进行重排序,再经分组卷积和拼接获取包含多维度语义信息的局部特征。其次,在局部-全局特征增强机制中,利用局部特征指导优化全局特征的提取,增强全局特征对复杂情感模式和上下文信息的表征能力。最后,将局部特征与全局特征输入改进的交叉注意力融合模块,实现全局与局部特征之间的双向引导与协同增强。实验结果表明,所提方法在RAF-DB,CK+,FER2013和FER2013PLUS数据集上准确率分别达到91.21%,98.31%,74.54%和86.74%,在RAF-DB上学习效率和收敛稳定性均有优势^(1)。 展开更多
关键词 表情识别 局部特征 全局特征 注意力机制 噪声对抗
在线阅读 下载PDF
用于鱼眼图像自适应矫正的注意力金字塔网络
6
作者 张博 李雪 +4 位作者 王白阳 李光健 王国平 潘杨 朱磊 《电光与控制》 北大核心 2026年第1期106-111,共6页
针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增... 针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增强空间金字塔(AASP)模块以加强特征提取;其次,考虑到不同区域的畸变程度差异,在失真矫正阶段引入可变形卷积,以自适应处理不同程度的畸变;最后,为解决失真矫正过程中信息细节丢失导致的图像模糊问题,在编码阶段嵌入SimAM注意力机制,以专注图像关键区域。仿真结果表明:APFC-Net在Place 2数据集上优于MLC和SimFIR等方法;相较于PCN方法,其PSNR和SSIM分别提升9.11%和27.14%,验证了模型在图像矫正中的有效性。 展开更多
关键词 鱼眼图像 畸变矫正 机器视觉 深度学习
在线阅读 下载PDF
基于视图学习和通道特征拓扑融合的骨架行为识别
7
作者 谭台哲 张泽翰 +3 位作者 胡平川 朱辉果 战荫伟 杨卓 《计算机工程与设计》 北大核心 2026年第1期217-225,共9页
在人体骨架行为识别中,图卷积网络可提取人体骨架拓扑结构来聚合特征信息。但现有方法既未有效关联骨架特征与拓扑关系,也忽略了不同视图下拓扑关系的变化性。为此,提出基于视图学习和通道特征拓扑融合的行为识别方法(VLCTF-GCN)。依据... 在人体骨架行为识别中,图卷积网络可提取人体骨架拓扑结构来聚合特征信息。但现有方法既未有效关联骨架特征与拓扑关系,也忽略了不同视图下拓扑关系的变化性。为此,提出基于视图学习和通道特征拓扑融合的行为识别方法(VLCTF-GCN)。依据骨架的视图特征学习拓扑关系,为每个视图构建具有区分性的共享视图拓扑关系。在不同聚合程度上,结合视图与自适应拓扑关系,融合骨架通道特征与拓扑关系,使得拓扑结构能够自适应关联骨架特征,通过多尺度时间卷积提取不同时间长度的关节变化。在两个大型数据集的实验结果表明,所提方法性能优于现有方法。 展开更多
关键词 行为识别 人体骨架 图卷积 通道特征拓扑融合 视图学习 多尺度时间卷积 共享拓扑
在线阅读 下载PDF
基于Swin-PIDNet的纸质工程制图线型识别方法
8
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet Swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
基于轻量化SuperPoint网络的水下光学图像特征提取
9
作者 刘艳 朱昌盛 +1 位作者 余彬 霍冠英 《河海大学学报(自然科学版)》 北大核心 2026年第1期167-176,共10页
针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意... 针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意力融合模块,融合频域与空间域的特征信息,提升网络在水下退化图像中的特征提取能力;构建残差特征增强深度可分离卷积模块,以降低模型复杂度并增强网络的特征提取能力。验证结果表明:该网络较SuperPoint网络参数量减少了13.8%,计算量降低了8.0%,帧率提升31.7%,光照变化和视角变化下的重复率分别提高了2.3%和2.1%,在SQUID和FLSea数据集上的特征点检测与匹配性能评估中具有较好的特征提取鲁棒性。 展开更多
关键词 水下光学图像 SuperPoint网络 轻量化网络 特征提取 特征融合
在线阅读 下载PDF
频域空间信息驱动的特征聚合跨模态行人重识别方法
10
作者 金静 朱传斌 翟凤文 《计算机应用研究》 北大核心 2026年第1期298-304,共7页
跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信... 跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信息且忽略了不同尺度特征语义关联性,提出一种基于频域空间信息的特征聚合(FDSIFA)网络。首先,通过设计的多分支频域空间感知模块(MFSPM),对不同模态的增强图像和原始图像充分提取模态特定信息,同时在频域和空间维度上挖掘跨模态特征的一致性,有效减小了模态间的差异;其次,设计了多阶段特征聚合模块(MFAM),自适应聚合不同尺度的特征,挖掘低层次特征与高层次特征之间的语义关联,提升特征的语义表达能力和判别力。该网络在SYSU-MM01数据集的全搜索模式下,rank-1和mAP分别达到了75.09%和71.35%,优于对比方法,实验结果验证了所提方法的有效性。 展开更多
关键词 跨模态 行人重识别 数据增强 频域空间信息 特征聚合
在线阅读 下载PDF
结合增强空间感知的远距离车道线检测方法
11
作者 王耀琦 卢亚琦 王小鹏 《华南理工大学学报(自然科学版)》 北大核心 2026年第2期62-76,共15页
车道线检测作为智能汽车视觉导航系统的核心技术,其性能直接影响到车辆的路径引导与转向控制,对提升交通安全性和导航效率具有重要意义。车道线图像中背景信息往往占据主导地位,特别是远距离车道线存在特征小、标记缺失或被遮挡等问题,... 车道线检测作为智能汽车视觉导航系统的核心技术,其性能直接影响到车辆的路径引导与转向控制,对提升交通安全性和导航效率具有重要意义。车道线图像中背景信息往往占据主导地位,特别是远距离车道线存在特征小、标记缺失或被遮挡等问题,同时伴随视觉上的宽度变化,导致远距离车道线比正常车道线更加难以识别。为解决这一问题,该文提出了结合增强空间感知的车道线检测方法。该方法首先针对车道线在图像中呈细长结构的特点,在主干网络中引入条形池化,以细化车道线信息的表示;然后将增强空间感知优化器(ESAO)和车道线多尺度聚合器(LMSA)相结合,以抑制无关背景和增强远距离车道线特征,进而提高车道线检测的准确性和稳定性;最后,通过全局和局部斜率一致性损失函数自适应调整车道线形状与位置,以保持预测车道线与地面真实情况之间的形状一致性。在2个车道线检测数据集TuSimple和CULane上的实验结果表明,该方法优于对比实验中最优秀的方法,在数据集TuSimple上的F1分数和准确率分别提高0.58和0.19个百分点,在数据集CULane上的F1@50提高1.14个百分点,特别是在远距离道路场景中表现的性能更加稳定。 展开更多
关键词 车道线检测 远距离 条形池化 增强空间感知优化器 车道线多尺度聚合器
在线阅读 下载PDF
基于可变形卷积和注意力机制的路面裂缝检测
12
作者 谢永华 方育才 彭银佳 《计算机工程与设计》 北大核心 2026年第1期279-285,共7页
为解决路面裂缝检测中图像边缘特征难以学习和背景噪声干扰的问题,提出一个基于可变形卷积和注意力机制的可端到端训练的路面裂缝检测网络。该网络基于U-Net结构设计,在特征融合部分添加边缘感知模块来增强裂缝边缘的检测能力;在编码器... 为解决路面裂缝检测中图像边缘特征难以学习和背景噪声干扰的问题,提出一个基于可变形卷积和注意力机制的可端到端训练的路面裂缝检测网络。该网络基于U-Net结构设计,在特征融合部分添加边缘感知模块来增强裂缝边缘的检测能力;在编码器部分使用空洞残差模块扩大感受野并保留更多细节信息;在解码器部分添加注意力机制提高对裂缝特征的关注度,抑制背景噪声。实验结果表明,该网络在MPA、mIoU和F1值这3项指标上均优于其它对比网络,验证了该网络的有效性。 展开更多
关键词 裂缝检测 语义分割 编码解码 可变形卷积 空洞卷积 残差连接 注意力机制
在线阅读 下载PDF
基于多维预测的多目标跟踪算法
13
作者 钟志峰 严诗玛 +2 位作者 易晓婕 孙玉坤 张智浩 《计算机工程与设计》 北大核心 2026年第1期46-54,共9页
针对多目标跟踪领域的经典算法DeepSORT跟踪效率低以及目标ID产生错误切换的问题,提出一种基于多维预测的多目标跟踪算法MP-DeepSORT。在该算法中,加权融合了卡尔曼滤波、LSTM、GM和ARIMA这4种预测模型,以获取更准确的目标位置预测数据... 针对多目标跟踪领域的经典算法DeepSORT跟踪效率低以及目标ID产生错误切换的问题,提出一种基于多维预测的多目标跟踪算法MP-DeepSORT。在该算法中,加权融合了卡尔曼滤波、LSTM、GM和ARIMA这4种预测模型,以获取更准确的目标位置预测数据进行关联匹配。同时,引入卷积块注意力模块(CBAM)对重识别网络OSnet进行改进,形成OS_Cnet用于替换DeepSORT算法内置的外观特征提取网络。实验结果表明,该算法相较于原始算法,MOTA指标提高2.7%,IDsw指标降低13.3%。通过数据和可视化展示,在视频流跟踪的准确性上有明显提升,目标ID产生错误切换问题上有明显改善。 展开更多
关键词 多目标跟踪 特征提取 重识别 卡尔纳曼滤波 长短期记忆模型 灰色模型 自回归差分滑动平均模型
在线阅读 下载PDF
基于结构特征引导的图像超分辨率重建方法
14
作者 王晓峰 沈紫璇 +1 位作者 谭文雅 黄俊俊 《计算机工程与设计》 北大核心 2026年第1期195-202,共8页
现有图像超分辨率模型结构特征利用不足且全局信息捕获效率低,致使重建图像扭曲且边缘模糊。针对此问题,提出结合Transformer和U-net的生成对抗网络图像超分辨率重建方法。在生成器嵌入交叉卷积注意力块(CCAB)和频谱变换块(STB),以增强... 现有图像超分辨率模型结构特征利用不足且全局信息捕获效率低,致使重建图像扭曲且边缘模糊。针对此问题,提出结合Transformer和U-net的生成对抗网络图像超分辨率重建方法。在生成器嵌入交叉卷积注意力块(CCAB)和频谱变换块(STB),以增强边缘特征的检测并扩大感受野,同时利用空间注意力单元(SAU)对特征细化处理。采用基于门控机制的U-net鉴别器逐像素反馈,助生成器早期捕获结构信息并挖掘高频细节,此外还采用谱归一化技术稳定训练。实验结果表明,该方法重建的图像清晰度和结构完整性较好,量化指标PSNR和SSIM均有所提高。 展开更多
关键词 生成对抗网络 图像超分辨率 结构保持 高频细节 注意力机制 感受野 边缘特征
在线阅读 下载PDF
融合轻量化和注意力机制的口罩人脸检测算法
15
作者 兰红 王恪 陈子怡 《计算机工程与应用》 北大核心 2026年第1期274-284,共11页
口罩人脸检测是智能监控系统中的关键部分,在城市管理和公共卫生安全方面有重要意义。针对口罩人脸检测在处理小目标(远处目标所显示的图像很小)、光照条件、佩戴口罩人脸展示不同方向等问题在复杂场景图像时出现的漏检和检测不准确问题... 口罩人脸检测是智能监控系统中的关键部分,在城市管理和公共卫生安全方面有重要意义。针对口罩人脸检测在处理小目标(远处目标所显示的图像很小)、光照条件、佩戴口罩人脸展示不同方向等问题在复杂场景图像时出现的漏检和检测不准确问题,提出IM-YOLO口罩人脸检测算法,并调整模型深度,设计并构建了轻量化IM-YOLO模型来满足口罩人脸检测的各类复杂场景下的实时性需求。针对参数量过高的问题,构建了融合多头注意力和空间注意力的MC注意力模块和轻量化模块MCB。设计了CGFPN结构来充分融合低层与高层之间的多尺度特征信息。构建RHM模块来提高特征语义信息的利用率和减少特征冗余。引入Inner-IoU损失函数来提升模型整体性能。在同等情况下,IM-YOLO优于YOLOv8以及其他主流算法。并且该模型在AIZOO数据集上的mAP值达到了96.2%,在自制数据集上的mAP值达到了89.0%,且模型参数量相比于YOLOv8降低了40%,适用于当前智能监控系统中的口罩人脸检测。 展开更多
关键词 口罩人脸检测 注意力机制 轻量化 特征融合模块 YOLOv8n
在线阅读 下载PDF
DEHPR:基于扩散模型的端到端手部姿态重建网络
16
作者 廖国琼 黄龙杰 +2 位作者 李清新 张家俊 陈柯帆 《系统仿真学报》 北大核心 2026年第1期174-188,共15页
针对传统方法如卷积神经网络(CNN)和Transformer在处理复杂场景的手部姿态重建任务时存在对大规模标注数据依赖性强、泛化能力不足等问题,提出了基于扩散模型的端到端手部姿态重建网络(diffusion-based end-to-end hand pose reconstruc... 针对传统方法如卷积神经网络(CNN)和Transformer在处理复杂场景的手部姿态重建任务时存在对大规模标注数据依赖性强、泛化能力不足等问题,提出了基于扩散模型的端到端手部姿态重建网络(diffusion-based end-to-end hand pose reconstruction network,DEHPR)。DEHPR通过引入扩散模型直接生成3D姿态假设并进行细化的策略,降低2D-to-3D建模方式导致的空间不确定性,引入端到端模型对多个3D姿态假设进行重投影选取最优关节点,最终生成预测的手部姿态。分别在HO3D V2数据集、DexYCB数据集以及FreiHand数据集上对所提出网络进行性能评估实验,结果表明,DEHPR性能效果优于现有方法,有效降低了对大规模标注数据的依赖性和单RGB图像2D-to-3D间接模型的不确定性,提升了手部姿态重建的准确性和鲁棒性。 展开更多
关键词 扩散模型 端到端 手部姿态 手部遮挡 姿态重建
在线阅读 下载PDF
基于改进YOLO11n模型的自动驾驶道路交通检测算法研究
17
作者 田晟 赵凯龙 苗佳霖 《广西师范大学学报(自然科学版)》 北大核心 2026年第1期1-9,共9页
随着自动驾驶技术的快速发展,道路交通检测作为感知模块的核心任务,直接影响自动驾驶系统的安全性与可靠性,当前基于深度学习方法作为研究的热点,却仍存在检测精度低、模型泛化性差等问题。为解决这些问题,本文提出一种改进YOLO11n模型... 随着自动驾驶技术的快速发展,道路交通检测作为感知模块的核心任务,直接影响自动驾驶系统的安全性与可靠性,当前基于深度学习方法作为研究的热点,却仍存在检测精度低、模型泛化性差等问题。为解决这些问题,本文提出一种改进YOLO11n模型的道路交通检测方法。该方法通过增加小目标检测层提高对小目标的检测精度,引入GhostConv+DWConv检测头结构,组合优化现有的双DWConv结构,并设计更适合小目标的Inner-CIoU损失函数,增强模型的泛化性,提高边界框回归的准确性。实验结果显示,与现有YOLO11n算法相比,该模型在KITTI和BDD100K数据集上的检测精度分别提升1.1个百分点和1.9个百分点,并达到125帧/s和124帧/s的检测速度,提升了低分辨率小目标检测的有效性,在不同交通场景下具有良好的泛化性。 展开更多
关键词 自动驾驶 小目标检测 YOLO11 多尺度检测 损失函数
在线阅读 下载PDF
基于改进ByteTrack与YOLOv10的无人机多目标跟踪算法
18
作者 张忠民 叶聪 《兵工学报》 北大核心 2026年第1期261-271,共11页
无人机多目标跟踪技术是无人机领域的一个重要研究方向,目前大多数多目标跟踪技术难以平衡跟踪任务的精度和实时性。针对此问题,设计小目标检测算法MT-YOLOv10,采用轻量化特征融合模块MSKFF(Multi-Selective Kernel Feature Fusion)增... 无人机多目标跟踪技术是无人机领域的一个重要研究方向,目前大多数多目标跟踪技术难以平衡跟踪任务的精度和实时性。针对此问题,设计小目标检测算法MT-YOLOv10,采用轻量化特征融合模块MSKFF(Multi-Selective Kernel Feature Fusion)增强特征融合效果,提升无人机空中检测能力。在跟踪算法中,通过向卡尔曼滤波引入自适应因数增强对噪声的自适应能力,同时改变卡尔曼滤波输入的状态向量以及引入轨迹置信度信息,提升对目标位置的预测能力,改进后的跟踪算法命名为PAC-ByteTrack。MT-YOLOv10在VisDrone2019-DET数据集上的检测实验结果显示其精度和mAP 50较基线算法提升4.3%和6.5%。将MT-YOLOv10和PAC-ByteTrack相结合,在VisDrone2019-MOT(Multi-Object Tracking)和UAVDT两大无人机数据集上展开测评,其HOTA(Harmonized Overlap and Tracking Aumulator)分别提升4.467%和1.831%,性能优于大多数现有跟踪算法。新算法实现了稳定连续的跟踪,为无人机跟踪任务提供了新的解决方案。 展开更多
关键词 无人机 YOLOv10 ByteTrack 卡尔曼滤波 多目标跟踪
在线阅读 下载PDF
基于逐通道空间自适应选择核卷积与双向边界感知机制的乳腺超声图像病变分割网络
19
作者 王洁 李璐瑶 《华南理工大学学报(自然科学版)》 北大核心 2026年第2期77-90,共14页
乳腺癌是全球女性最常见的恶性肿瘤之一,准确的病变分割对于乳腺癌的早期诊断与治疗具有重要意义。然而,由于病变形态的多样性以及超声成像机制的复杂性,现有基于深度学习的乳腺超声图像病变分割方法在分割准确性方面仍面临巨大挑战。... 乳腺癌是全球女性最常见的恶性肿瘤之一,准确的病变分割对于乳腺癌的早期诊断与治疗具有重要意义。然而,由于病变形态的多样性以及超声成像机制的复杂性,现有基于深度学习的乳腺超声图像病变分割方法在分割准确性方面仍面临巨大挑战。为进一步提升乳腺超声图像中病变区域的分割精度,该文基于经典U-Net架构,提出了一种新型乳腺超声图像病变分割网络(CWSASKM-BBAM-Net)。首先,在网络中引入逐通道空间自适应选择核卷积模块(CWSASKM),根据不同通道的语义特征为每个空间位置自适应选择感受野大小,以增强多尺度信息的建模能力;然后,引入双向边界感知机制(BBAM),通过融合正向与反向注意力,对目标显著区域及其边界进行协同建模,同时逐步提升对非显著区域与病变区域的区分能力,以进一步强化边界信息的表达;最后,在3组公开乳腺超声图像数据集(BUSI、UDIAT和STU)上开展分割实验。结果表明:该方法在数据集BUSI上的杰卡德指数、精确率、召回率和Dice相似系数分别为71.97%、82.85%、81.40%和80.44%,较次优方法分别提升1.69、1.05、1.28和1.84个百分点;在数据集UDIAT上,这4项指标分别达到78.14%、88.31%、86.73%和86.10%,较次优方法分别提升了2.75、2.04、0.56和2.01个百分点;在外部数据集STU上,该方法也取得了优于其他方法的整体表现。实验结果表明,CWSASKMBBAM-Net在乳腺超声图像分割任务中展现出更优的整体性能。 展开更多
关键词 乳腺超声图像 病变分割 自适应选择核卷积 双向边界感知机制
在线阅读 下载PDF
基于亚像素卷积的多尺度加权融合船舶检测方法
20
作者 李娜 刘娜 +1 位作者 张翼龙 冯伟昊 《计算机工程与应用》 北大核心 2026年第3期287-296,共10页
船舶检测作为海洋监控及安全管理的关键技术,广泛应用于航道监控、海上救援、非法捕捞等。针对船舶检测中存在的尺寸差异大、背景干扰和遮挡问题,提出基于亚像素卷积的多尺度加权融合船舶检测方法。针对船舶图像中的尺度差异,提出多尺... 船舶检测作为海洋监控及安全管理的关键技术,广泛应用于航道监控、海上救援、非法捕捞等。针对船舶检测中存在的尺寸差异大、背景干扰和遮挡问题,提出基于亚像素卷积的多尺度加权融合船舶检测方法。针对船舶图像中的尺度差异,提出多尺度特征加权融合机制,利用亚像素3D融合模块和三重特征编码模块,有效融合不同尺度特征,同时结合多尺度卷积注意力加权机制,使模型在不同空间范围内关注输入特征,从而提升检测精度。为了增强特征提取灵活性并保持网络性能,引入可变核卷积,根据输入动态选择采样点位置,提高特征表达能力。针对锚框在回归过程中膨胀导致模型收敛慢的问题,引入Powerful-IoU损失,利用自适应惩罚因子和梯度调节函数引导锚框回归,同时引入聚焦机制提高中等锚框的聚焦能力。在公共船舶数据集SeaShips上进行了实验,实验结果表明,提出的方法在多尺度船舶检测任务中表现优越,相比基准模型,精确率提升2.8个百分点,召回率提升4.8个百分点,mAP@0.5提升1.5个百分点,mAP@0.5:0.95提升6.6个百分点,且模型能够快速收敛并保持较好的稳定性,有效应对了复杂背景和船舶遮挡问题。 展开更多
关键词 目标检测 船舶检测 多尺度特征融合 注意力机制
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部