期刊文献+
共找到432篇文章
< 1 2 22 >
每页显示 20 50 100
TalentDepth:基于多尺度注意力机制的复杂天气场景单目深度估计模型
1
作者 张航 卫守林 殷继彬 《计算机科学》 北大核心 2025年第S1期442-448,共7页
对于复杂天气场景图像模糊、低对比度和颜色失真所导致的深度信息预测不准的问题,以往的研究均以标准场景的深度图作为先验信息来对该类场景进行深度估计。然而,这一方式存在先验信息精度较低等问题。对此,提出一个基于多尺度注意力机... 对于复杂天气场景图像模糊、低对比度和颜色失真所导致的深度信息预测不准的问题,以往的研究均以标准场景的深度图作为先验信息来对该类场景进行深度估计。然而,这一方式存在先验信息精度较低等问题。对此,提出一个基于多尺度注意力机制的单目深度估计模型TalentDepth,以实现对复杂天气场景的预测。首先,在编码器中融合多尺度注意力机制,在减少计算成本的同时,保留每个通道的信息,提高特征提取的效率和能力。其次,针对图像深度不清晰的问题,基于几何一致性,提出深度区域细化(Depth Region Refinement,DSR)模块,过滤不准确的像素点,以提高深度信息的可靠性。最后,输入图像翻译模型所生成的复杂样本,并计算相应原始图像上的标准损失来指导模型的自监督训练。在NuScence,KITTI和KITTI-C这3个数据集上,相比于基线模型,所提模型对误差和精度均有优化。 展开更多
关键词 单目深度估计 自监督学习 多尺度注意力 知识提炼 深度学习
在线阅读 下载PDF
轻量化的低成本海洋机器人深度估计方法EDepth
2
作者 陈东烁 柴春来 +1 位作者 叶航 张思赟 《计算机应用》 北大核心 2025年第S1期106-113,共8页
针对传统单目深度估计方法在海洋环境中存在的精度低、鲁棒性差、运行速度慢和难以部署等问题,提出一种轻量化的海洋机器人深度估计方法,命名为EDepth(EfficientDepth)。该方法旨在提升低成本海洋机器人的三维(3D)感知能力。首先,利用... 针对传统单目深度估计方法在海洋环境中存在的精度低、鲁棒性差、运行速度慢和难以部署等问题,提出一种轻量化的海洋机器人深度估计方法,命名为EDepth(EfficientDepth)。该方法旨在提升低成本海洋机器人的三维(3D)感知能力。首先,利用水下光衰减先验,通过空间转换将输入数据从原始RGB(Red-Green-Blue)图像空间映射到RBI(Red-BlueIntensity)输入域,从而提高深度估计的准确性;其次,采用高效的EfficientFormerV2作为特征提取模块,并结合视觉注意力机制MiniViT(Mini Vision Transformer)和光衰减模块实现深度信息的有效提取和处理;此外,通过自适应分区的设计,MiniViT模块能够动态调整深度区间,从而提高深度估计的精度;最后,优化网络结构,从而在不牺牲性能的前提下,实现高效的计算。实验结果表明,EDepth在RGB-D(Red-Green-Blue Depth)数据集USOD10K上的深度估计性能显著优于传统方法。具体来说,EDepth在平均绝对相对误差(Abs Rel)上达到了0.587,而DenseDepth为0.519,尽管DenseDepth在某些指标上表现更佳,但相较于DenseDepth的4 461万参数和171.44 MB的内存占用,EDepth仅有461万参数,减少了89.67%的参数量,而内存占用减少至23.56 MB,且在单个CPU上EDepth的每秒帧数(FPS)达到了14.11,明显优于DenseDepth的2.45。可见,EDepth在深度估计性能和计算效率之间取得了良好的平衡。 展开更多
关键词 三维感知 自适应分区 计算效率 EfficientFormerV2 海洋机器人 单目深度估计
在线阅读 下载PDF
LpDepth:基于拉普拉斯金字塔的自监督单目深度估计
3
作者 曹明伟 邢景杰 +1 位作者 程宜风 赵海锋 《计算机科学》 北大核心 2025年第3期33-40,共8页
自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影... 自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影响深度图的精度。针对上述问题,提出一种基于拉普拉斯金字塔的自监督单目深度估计方法(Self-supervised Monocular Depth Estimation Based on the Laplace Pyramid,LpDepth)。此方法的核心思想是:首先,使用拉普拉斯残差图丰富编码特征,以弥补在下采样过程中丢失的特征信息;其次,在下采样过程中使用最大池化层突显和放大特征信息,使编码器在特征提取过程中更容易地提取到训练模型所需要的特征信息;最后,使用残差模块解决过拟合问题,提高解码器对特征的利用效率。在KITTI和Make3D等数据集上对所提方法进行了测试,同时将其与现有经典方法进行了比较。实验结果证明了所提方法的有效性。 展开更多
关键词 单目深度估计 拉普拉斯金字塔 残差网络 深度图
在线阅读 下载PDF
DepthMamba:多尺度VisionMamba架构的单目深度估计
4
作者 徐志斌 张孙杰 《计算机应用研究》 北大核心 2025年第3期944-948,共5页
在单目深度估计领域,虽然基于CNN和Transformer的模型已经得到了广泛的研究,但是CNN全局特征提取不足,Transformer则具有二次计算复杂性。为了克服这些限制,提出了一种用于单目深度估计的端到端模型,命名为DepthMamba。该模型能够高效... 在单目深度估计领域,虽然基于CNN和Transformer的模型已经得到了广泛的研究,但是CNN全局特征提取不足,Transformer则具有二次计算复杂性。为了克服这些限制,提出了一种用于单目深度估计的端到端模型,命名为DepthMamba。该模型能够高效地捕捉全局信息并减少计算负担。具体地,该方法引入了视觉状态空间(VSS)模块构建编码器-解码器架构,以提高模型提取多尺度信息和全局信息的能力。此外,还设计了MLPBins深度预测模块,旨在优化深度图的平滑性和整洁性。最后在室内场景NYU_Depth V2数据集和室外场景KITTI数据集上进行了综合实验,实验结果表明:与基于视觉Transformer架构的Depthformer相比,该方法网络参数量减少了27.75%,RMSE分别减少了6.09%和2.63%,验证了算法的高效性和优越性。 展开更多
关键词 单目深度估计 Vmamba Bins深度预测 状态空间模型
在线阅读 下载PDF
基于改进FeatDepth的足球运动场景无监督单目图像深度预测
5
作者 傅荟璇 徐权文 王宇超 《实验技术与管理》 CAS 北大核心 2024年第10期74-84,共11页
为了在降低成本的同时提高图像深度信息预测的精确度,并将深度估计应用于足球运动场景,提出一种基于改进FeatDepth的足球运动场景无监督单目图像深度预测方法。首先,对原FeatDepth引入注意力机制,使模型更加关注有效的特征信息;其次,将F... 为了在降低成本的同时提高图像深度信息预测的精确度,并将深度估计应用于足球运动场景,提出一种基于改进FeatDepth的足球运动场景无监督单目图像深度预测方法。首先,对原FeatDepth引入注意力机制,使模型更加关注有效的特征信息;其次,将FeatDepth中的PoseNet网络和DepthNet网络分别嵌入GAM全局注意力机制模块,为网络添加额外的上下文信息,在基本不增加计算成本的情况下提升FeatDepth模型深度预测性能;再次,为在低纹理区域和细节上获得更好的深度预测效果,由单视图重构损失与交叉视图重构损失组合而成最终的损失函数。选取KITTI数据集中Person场景较多的部分进行数据集制作并进行仿真实验,结果表明,改进后的FeatDepth模型不仅在精确度上有所提升,且在低纹理区域及细节处拥有更好的深度预测效果。最后,对比模型在足球场景下的推理效果后得出,改进后的模型在低纹理区域(足球、球门等)及细节处(肢体等)有更好的深度预测效果,实现了将基于无监督的单目深度估计模型应用于足球运动场景的目的。 展开更多
关键词 足球运动场景 无监督单目深度估计 Featdepth 注意力机制 GAM 图像重构
在线阅读 下载PDF
基于Shuffle-ZoeDepth单目深度估计的苗期玉米株高测量方法 被引量:4
6
作者 赵永杰 蒲六如 +2 位作者 宋磊 刘佳辉 宋怀波 《农业机械学报》 EI CAS CSCD 北大核心 2024年第5期235-243,253,共10页
株高是鉴别玉米种质性状及作物活力的重要表型指标,苗期玉米遗传特性表现明显,准确测量苗期玉米植株高度对玉米遗传特性鉴别与田间管理具有重要意义。针对传统植株高度获取方法依赖人工测量,费时费力且存在主观误差的问题,提出了一种融... 株高是鉴别玉米种质性状及作物活力的重要表型指标,苗期玉米遗传特性表现明显,准确测量苗期玉米植株高度对玉米遗传特性鉴别与田间管理具有重要意义。针对传统植株高度获取方法依赖人工测量,费时费力且存在主观误差的问题,提出了一种融合混合注意力信息的改进ZoeDepth单目深度估计模型。改进后的模型将Shuffle Attention模块加入Decoder模块的4个阶段,使Decoder模块在对低分辨率特征图信息提取过程中能更关注特征图中的有效信息,提升了模型关键信息的提取能力,可生成更精确的深度图。为验证本研究方法的有效性,在NYU-V2深度数据集上进行了验证。结果表明,改进的Shuffle-ZoeDepth模型在NYU-V2深度数据集上绝对相对差、均方根误差、对数均方根误差为0.083、0.301 mm、0.036,不同阈值下准确率分别为93.9%、99.1%、99.8%,均优于ZoeDepth模型。同时,利用Shuffle-ZoeDepth单目深度估计模型结合玉米植株高度测量模型实现了苗期玉米植株高度的测量,采集不同距离下苗期玉米图像进行植株高度测量试验。当玉米高度在15~25 cm、25~35 cm、35~45 cm 3个区间时,平均测量绝对误差分别为1.41、2.21、2.08 cm,平均测量百分比误差分别为8.41%、7.54%、4.98%。试验结果表明该方法可仅使用单个RGB相机完成复杂室外环境下苗期玉米植株高度的精确测量。 展开更多
关键词 苗期玉米 株高 单目深度估计 测量方法 混合注意力机制
在线阅读 下载PDF
基于改进Monodepth2的内窥镜图像深度估计方法
7
作者 王晓雨 孟晓亮 +1 位作者 张立晔 宋政 《科学技术与工程》 北大核心 2024年第36期15540-15547,共8页
内窥镜图像深度估计是微创手术中的重要技术难题。为提高内窥镜图像深度估计的准确性,提出一种基于改进Monodepth2的内窥镜图像深度估计方法。在深度估计网络中,编码器使用ResNet34模块,并引入SAB(sparse attentive backtracking)注意... 内窥镜图像深度估计是微创手术中的重要技术难题。为提高内窥镜图像深度估计的准确性,提出一种基于改进Monodepth2的内窥镜图像深度估计方法。在深度估计网络中,编码器使用ResNet34模块,并引入SAB(sparse attentive backtracking)注意力机制、改进的FPN(feature pyramid network)模块以及特征增强模块,以使所提网络更好地理解全局信息、灵活有效地处理多尺度特征,并进一步增强其稳定性和可靠性。解码器通过上采样获取图像的深度信息和位姿信息。采用光度重投影误差、结构相似性和边缘感知平滑误差作为损失函数,以进一步提高所提方法的准确性。评估采用Hamlyn公共数据集,实验结果表明:所提方法可更加准确地估计内窥镜图像的深度信息,进一步验证了所提方法的有效性和准确性。 展开更多
关键词 深度估计 内窥镜图像 特征增强 损失函数
在线阅读 下载PDF
基于RGB与深度图像融合的生菜表型特征估算方法 被引量:3
8
作者 陆声链 李沂杨 +3 位作者 李帼 贾小泽 鞠青青 钱婷婷 《农业机械学报》 北大核心 2025年第1期84-91,101,共9页
采用自动化手段对植物生长过程中的表型特征进行精准测量对于育种和栽培等应用具有重要意义。本文围绕工厂化生菜种植中的表型特征无损精准检测需求,通过融合深度相机采集的RGB图像和深度图像,利用改进的DeepLabv3+模型进行图像分割,并... 采用自动化手段对植物生长过程中的表型特征进行精准测量对于育种和栽培等应用具有重要意义。本文围绕工厂化生菜种植中的表型特征无损精准检测需求,通过融合深度相机采集的RGB图像和深度图像,利用改进的DeepLabv3+模型进行图像分割,并通过双模态回归网络对生菜表型特征进行估算。本文改进的分割模型的骨干网络由Xception替换为MobileViTv2,以增强其全局感知能力和性能;在回归网络中,提出了卷积双模态特征融合模块CMMCM,用于估算生菜的表型特征。在包含4个生菜品种的公开数据集上的实验结果表明,本文方法可对鲜质量、干质量、冠幅、叶面积和株高共5种生菜表型特征进行估算,决定系数分别达到0.9222、0.9314、0.8620、0.9359和0.8875。相较于未添加CMMCM和SE模块的RGB和深度图的表型参数估计基准ResNet-10(双模态),本文改进的模型决定系数分别提高2.54%、2.54%、1.48%、2.99%和4.88%,单幅图像检测耗时为44.8 ms,说明该方法对于双模态图像融合的生菜表型特征无损提取具有较高的准确性和实时性。 展开更多
关键词 生菜 表型估算 模态融合 分割模型 RGB图像 深度图像
在线阅读 下载PDF
一种基于AEKF的铆接件视觉伺服精确装配方法 被引量:3
9
作者 李宗刚 李彦博 +1 位作者 焦建军 杜亚江 《系统仿真学报》 北大核心 2025年第1期107-118,共12页
针对工业生产中存在多轴孔铆接件因铆钉数量多、铆钉与铆孔间隙小、铆钉分布不规则等特点,致使装配过程约束复杂,装配精度要求高,难以实现铆接工艺智能化以提升装配效率问题,提出一种基于自适应扩展卡尔曼滤波的铆接件视觉伺服精确装配... 针对工业生产中存在多轴孔铆接件因铆钉数量多、铆钉与铆孔间隙小、铆钉分布不规则等特点,致使装配过程约束复杂,装配精度要求高,难以实现铆接工艺智能化以提升装配效率问题,提出一种基于自适应扩展卡尔曼滤波的铆接件视觉伺服精确装配方法。为实现铆接件装配时的高精度定位,在传统扩展卡尔曼滤波的基础上,引入自适应噪声估计器,消除未知环境下的系统噪声对图像雅可比矩阵估计精度的影响,保证视觉伺服过程中图像雅可比矩阵的高精度估计;为保证铆接件装配时视觉伺服运动轨迹平滑稳定,设计滑模控制器,对铆接件进行轨迹跟踪,同时引入最小二乘法对铆接件图像特征深度信息进行实时在线估计,实现铆接件的高精度装配;以6自由度机器人建立仿真模型,结果表明在分布不规则的铆钉中选取4个铆钉的圆心点特征作为控制输入,通过设计的视觉伺服控制器能够完成铆接件的高精度多轴孔装配,提高了铆接工艺中关键工序的智能化水平。 展开更多
关键词 铆接 多轴孔装配 自适应扩展卡尔曼滤波 深度在线估计 滑模控制
在线阅读 下载PDF
基于自注意力机制和多尺度代价聚合的双目深度估计方法 被引量:1
10
作者 李恒宇 许晓俊 +2 位作者 杨小康 刘军 刘靖逸 《中国测试》 北大核心 2025年第8期122-130,共9页
针对无人系统在室外场景中细长、弱纹理等物体的深度估计困难问题,提出一种基于自注意力机制和多尺度代价聚合的双目深度估计方法。首先,利用可变形卷积和空洞金字塔卷积,改善特征提取模块的特征提取能力;其次,采用多尺度的匹配代价计算... 针对无人系统在室外场景中细长、弱纹理等物体的深度估计困难问题,提出一种基于自注意力机制和多尺度代价聚合的双目深度估计方法。首先,利用可变形卷积和空洞金字塔卷积,改善特征提取模块的特征提取能力;其次,采用多尺度的匹配代价计算,兼顾视差估计的全局连续性和细节信息;然后,匹配代价聚合模块引入自注意力机制,以解决代价体值分布不均的问题;之后,通过视差回归获得最终估计视差。最终,通过消融实验和对比实验对深度估计方法的性能进行验证。实验结果表明,在满足无人系统基本实时性的条件下,该方法使D1指标降低至1.28%,EPE指标降低至0.614像素,有效提升视差估计的精度。此外,定性评估显示,该方法在细长和低纹理物体的深度估计上取得不错的效果。 展开更多
关键词 深度估计 卷积网络 代价计算 自注意力
在线阅读 下载PDF
基于图像分割与双目立体视觉的透明液体液位测量研究
11
作者 王鹏 任勇峰 +3 位作者 陈建军 崔大鹏 孙超奇 任文杰 《传感器与微系统》 北大核心 2025年第11期42-46,共5页
提出了一种基于UNet图像分割与RAFT-Stereo立体匹配的双目视觉方法,用于高精度测量透明液体液位。针对传统双目立体匹配在透明液体场景中因纹理缺失导致的深度估计误差问题,该方法通过UNet网络对液面区域进行精确分割,生成像素级掩膜以... 提出了一种基于UNet图像分割与RAFT-Stereo立体匹配的双目视觉方法,用于高精度测量透明液体液位。针对传统双目立体匹配在透明液体场景中因纹理缺失导致的深度估计误差问题,该方法通过UNet网络对液面区域进行精确分割,生成像素级掩膜以突出液面特征;结合RAFT-Stereo算法计算视差并转换为深度信息,显著提升了液位测量的准确性与鲁棒性。实验结果表明,该方法显著优于传统半全局块匹配(SGBM)和RAFT-Stereo算法,平均绝对误差(MAE)和最大误差(MaxE)分别降低约85.2%和82.1%,有效改善了透明液体液面模糊和匹配失败问题。未来研究可进一步优化模型实时性,为航天燃料罐监测等实际应用提供可靠技术支持。 展开更多
关键词 UNet图像分割 RAFT-Stereo双目测距 透明液体 液位测量
在线阅读 下载PDF
基于邻域自适应无监督多视图深度估计
12
作者 魏东 孙赫 +1 位作者 张静恬 白宜凡 《现代电子技术》 北大核心 2025年第21期165-171,共7页
为了提升弱纹理区域无监督多视图深度估计性能,文中提出一种基于邻域自适应无监督多视图深度估计算法。算法采用双分支结构,深度估计分支首先采用邻域自适应深度分布方法改善弱纹理区域深度分布;其次采用深度变化概率引导的深度假设范... 为了提升弱纹理区域无监督多视图深度估计性能,文中提出一种基于邻域自适应无监督多视图深度估计算法。算法采用双分支结构,深度估计分支首先采用邻域自适应深度分布方法改善弱纹理区域深度分布;其次采用深度变化概率引导的深度假设范围细化后续阶段深度估计。为了提高对场景边缘的识别,采用基于标准差的深度平滑约束。神经渲染分支用于提高深度估计能力,为了增强与深度估计分支间的几何一致性,采用融合图像颜色与深度信息的采样方法。由实验结果可知,该算法在DTU数据集测试完整度误差和整体精度误差优于其他无监督算法,且完整度误差比DS⁃MVSNet减小16.71%。可视化结果表明,针对弱纹理区域深度估计性能提升明显。在Tanks and Temples数据集上进行泛化性验证,整体性能(Mean)为56.22,证明了所提算法的有效性。 展开更多
关键词 深度估计 邻域自适应 深度假设范围 无监督算法 深度平滑约束 弱纹理
在线阅读 下载PDF
基于增强特征融合的轻量级人体姿态估计网络
13
作者 施昕昕 张昊亮 《电子测量技术》 北大核心 2025年第2期189-198,共10页
为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征... 为了提高轻量化人体姿态估计网络对不同阶段特征图的信息提取和特征融合能力和关键点热力图与分类特征图的后处理能力,提出了一种基于多阶段多层级特征融合的人体姿态估计网络。首先设计了多层级特征融合模块,以提高神经网络模型对特征图的信息提取和归纳总结能力;接着设计了结合特征融合模块设计了特征融合分支,以达到保留模型不同阶段的信息不会随长期卷积运算而丢失的效果;最后对模型输出的关键点分类图进行后处理操作,对分类部分使用分类损失增强模块进行进一步增强,使其能够更好地专注于关键点分类任务,以提高模型输出的准确性。在CrowdPose数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为50.7%和48.4%;在S结构下,AP值分别为59.1%和58.3%。在MS COCO val2017数据集进行性能测试,本文算法和LitePose算法在XS结构下的AP值分别为41.9%和40.6%;在S结构下,AP值分别为57.0%和56.8%。实验结果表明,本文算法提出的多层级特征融合模块和高分辨率融合分支以及后处理操作对人体姿态估计网络检测性能提升具有正向作用。 展开更多
关键词 人体姿态估计 轻量级网络 多尺度特征融合 深度可分离卷积
在线阅读 下载PDF
基于多尺度时序采样的多任务感知网络
14
作者 吴绍斌 褚云峰 +2 位作者 李奕萱 姜皓舰 黄宇 《北京理工大学学报》 北大核心 2025年第8期789-797,共9页
针对时序特征融合不充分,遮挡及远距离目标难以可靠感知的问题,提出了一种联合时序多尺度鸟瞰视角特征的多任务感知网络.首先,通过对深度预测概率建模,设计具备遮挡适应性的显式深度估计模块,将图像特征映射为鸟瞰视角特征,并利用深度... 针对时序特征融合不充分,遮挡及远距离目标难以可靠感知的问题,提出了一种联合时序多尺度鸟瞰视角特征的多任务感知网络.首先,通过对深度预测概率建模,设计具备遮挡适应性的显式深度估计模块,将图像特征映射为鸟瞰视角特征,并利用深度图辅助监督;然后,为提升远距离障碍物检测效果,基于可变形注意力机制设计时序鸟瞰视角采样模块,实现时序上多尺度鸟瞰视角特征加权融合;最后,将数据增强策略拓展至多任务,并分别通过检测和分割任务头,实现三维目标检测和车道线分割. nuScenes数据集和实车实验结果证明了该方案在遮挡区域和远距离目标检测方面取得了精度提升,且推理速度可以满足实车应用要求. 展开更多
关键词 鸟瞰图 深度估计 多尺度时序采样 多任务网络
在线阅读 下载PDF
面向机械臂抓取的双目视觉目标定位算法
15
作者 蒋畅江 向杰 何旭颖 《计算机应用》 北大核心 2025年第11期3698-3706,共9页
通过机器视觉算法对目标进行识别并定位它的空间坐标是实现机械臂视觉抓取的关键。针对基于双目视觉的目标识别与定位中定位精度低、运行效率不高等问题,提出面向机械臂抓取的联合双目视觉目标检测与立体深度估计的网络结构BDS-YOLO(Bin... 通过机器视觉算法对目标进行识别并定位它的空间坐标是实现机械臂视觉抓取的关键。针对基于双目视觉的目标识别与定位中定位精度低、运行效率不高等问题,提出面向机械臂抓取的联合双目视觉目标检测与立体深度估计的网络结构BDS-YOLO(Binocular Detect and Stereo YOLO)及基于BDS-YOLO的目标定位算法。该算法联合目标检测与立体深度估计算法,利用注意力机制进行跨视图特征信息交互,从而提高特征表达能力,使网络可以通过深度特征匹配获得高质量视差图,再经过自注意力机制进一步提升后,由三角测量原理转换为深度信息。BDS-YOLO网络采用多任务学习,同时训练目标检测与立体深度估计网络,并使用合成与真实数据共同训练。针对真实数据不易标注密集深度的问题,采用自监督学习技术优化由视差重建图像的过程,以提高BDS-YOLO网络对现实世界的泛化能力。实验结果表明:BDS-YOLO网络在真实数据集上对目标检测的平均精度(AP)比YOLOv8l高6.5个百分点,预测的视差和转换后的深度优于专门的立体深度估计算法,推理速度可达20 frame/s以上,对目标对象的识别和定位均优于对比方法,能较好地满足目标实时检测与定位的需求。 展开更多
关键词 双目视觉 目标检测 立体匹配 立体深度估计 目标定位 深度学习 注意力机制
在线阅读 下载PDF
LightDiffu-DCE:基于光照强度扩散的低光照图像增强
16
作者 闫光辉 吴佰靖 马龙 《光学精密工程》 北大核心 2025年第7期1114-1129,共16页
针对低光照图像中不同光源的光照强度分布不均,在图像增强时造成轮廓特征丢失及效果不自然的问题,提出一种基于光照强度扩散的低光照图像增强方法(Light Diffusion based Zero-DCE Image Enhancement Algorithm,LightDiffu-DCE)。为增... 针对低光照图像中不同光源的光照强度分布不均,在图像增强时造成轮廓特征丢失及效果不自然的问题,提出一种基于光照强度扩散的低光照图像增强方法(Light Diffusion based Zero-DCE Image Enhancement Algorithm,LightDiffu-DCE)。为增强模型的泛化能力,提出了基于光源光照强度建模的扩散模型,以生成不同光照强度的训练数据集。设计了边缘特征融合的深度曲线估计网络,能够提取更丰富的低光照图像的多尺度轮廓和细节特征,提升对光照强度估计的准确性。为恢复出光照更加自然的图像,融合大气光估计来计算不同图像区域的光照强度,实现了对光增强曲线和光增强系数的动态微调。在无参考数据集ExDark和有参考数据集LOL上,使用6种评价指标进行实验分析。实验结果表明,相较于基准方法,LightDiffu-DCE在ExDark上的无参考评价指标NIQE,PIQE和RISQ上分别提升了约8.35%,6.20%和21.83%,在LOL数据集上的有参考评价指标PSNR,SSIM和RMSE提升了约12.12%,4.76%和49.89%。该方法可以有效增强低光照图像,且恢复出的低光照图像轮廓更加清晰,色彩鲜明且效果更自然。 展开更多
关键词 计算机视觉 扩散模型 低光照增强 边缘特征 深度曲线估计网络
在线阅读 下载PDF
基于多模态融合的三维目标检测方法研究
17
作者 陆军 赵颢然 鲁林超 《智能系统学报》 北大核心 2025年第5期1167-1177,共11页
在自动驾驶场景中,由于多模态的融合,三维目标检测效果易受传感器未充分校准的影响,同时,对于目标密集的复杂场景,检测过程中易对目标造成误检,从而降低模型的召回率和检测精度。针对以上问题,设计了多模态融合网络SoftFusion-QC(softfu... 在自动驾驶场景中,由于多模态的融合,三维目标检测效果易受传感器未充分校准的影响,同时,对于目标密集的复杂场景,检测过程中易对目标造成误检,从而降低模型的召回率和检测精度。针对以上问题,设计了多模态融合网络SoftFusion-QC(softfusion with query contrast)用以实现三维目标检测。为了自适应地融合来自激光雷达的点云数据和摄像头捕获的图像信息,提出可变形跨模态特征聚合模块(deformable cross-modality feature aggregate,DCFA),实现深层次的特征融合。为了有效应对传感器校准不足问题,引入查询对比机制(query contrast,QC),通过基于Transformer的查询交互策略和查询框对比学习策略,显著提升了检测的精度和鲁棒性,解决了密集目标检测的误检问题。在nuScenes自动驾驶数据集上,取得了69.8%的mAP(mean average precision)与72.8%的NDS(normalized detection score)。通过定量的性能分析和消融实验验证了算法的有效性。 展开更多
关键词 三维目标检测 多模态融合 深度学习 深度估计 特征聚合 注意力机制 激光雷达 自动驾驶
在线阅读 下载PDF
基于风格迁移的柔性输尿管内窥镜图像深度估计 被引量:1
18
作者 辛运帏 尹晶晶 +3 位作者 赵煜 代煜 崔亮 殷小涛 《天津大学学报(自然科学与工程技术版)》 EI CAS 北大核心 2025年第1期47-55,共9页
输尿管内窥镜手术是目前针对肾结石的主流治疗方案,其外形细长、镜体柔软,能够灵活穿越人体自然腔道的内径狭窄的尿道和输尿管,检查视野范围更广,使医生能够更好地观察到病变区域.但一般的输尿管内窥镜仅配备单目摄像头进行配合手术操作... 输尿管内窥镜手术是目前针对肾结石的主流治疗方案,其外形细长、镜体柔软,能够灵活穿越人体自然腔道的内径狭窄的尿道和输尿管,检查视野范围更广,使医生能够更好地观察到病变区域.但一般的输尿管内窥镜仅配备单目摄像头进行配合手术操作,无法借助额外设备获取数据导致了其图像信息的匮乏;同时,相比于胃肠、鼻镜等手术场景,本研究的肾内场景在不具备公开数据集的同时,图像质量参差不齐,表面纹理细节不足,孔洞区域褶皱少,受模糊反光等干扰大,都易使深度估计受到影响针对以上问题,提出了一种基于改进风格迁移模型的深度估计方法.该方法首先根据术前CT图像重建肾脏内部腔道模型并提取中心路径,将虚拟内窥镜的摄像头设置在插值后的路径点上,构建了虚拟内窥镜漫游图像与深度估计图像一一对应的数据集,并基于此数据集训练了一个深度估计模型;随后,使用添加高效通道注意力(ECA)模块的改进风格迁移模型,将真实内窥镜图像域迁移至虚拟内窥镜图像域;最后,再将经由风格迁移产生的虚拟内窥镜图像送入上述训练得来的深度估计模型中,最终实现真实内窥镜图像的深度估计.所提方法的可行性及有效性在输尿管钬激光碎石术的图像中得到验证. 展开更多
关键词 深度估计 风格迁移 注意力机制 深度学习
在线阅读 下载PDF
基于DOD-LN-GPR模型的锂离子电池SOH估计方法 被引量:1
19
作者 黄佳茵 白俊琦 贤燕华 《太阳能学报》 北大核心 2025年第2期60-69,共10页
针对锂离子电池健康状态(SOH)的估计中预测精度不高、健康特征输入冗余、数据预处理繁琐的问题,提出一种基于放电深度(DOD)的改进高斯过程回归SOH预测模型。在锂离子电池的放电曲线中,计算出锂离子电池的放电深度,并将其作为唯一的健康... 针对锂离子电池健康状态(SOH)的估计中预测精度不高、健康特征输入冗余、数据预处理繁琐的问题,提出一种基于放电深度(DOD)的改进高斯过程回归SOH预测模型。在锂离子电池的放电曲线中,计算出锂离子电池的放电深度,并将其作为唯一的健康特征。同时改进传统的高斯过程回归(GPR)算法,利用线性(LIN)和神经网络(NN)的组合核函数(LIN+NN)拟合锂离子电池容量全局衰退和局部波动的趋势,从而建立DOD-LN-GPR锂离子电池SOH估计模型。在NASA数据集中,首先进行不同核函数的实验比对,验证所提组合核函数预测精度的优势;其次,通过减小训练集与测试集比例,证明所提估计方法在少量训练样本上仍能有较好的预测效果;最后,将所提DOD-LN-GPR模型在不同训练集下与其他SOH估计模型进行对比,结果表明该模型具有较好的精度和鲁棒性。 展开更多
关键词 锂离子电池 状态估计 电池管理系统 高斯过程回归 放电深度
在线阅读 下载PDF
施工现场的人机距离检测方法综述
20
作者 郝旭 武文红 +4 位作者 牛恒茂 石宝 乌尼尔 王嘉敏 褚宏坤 《计算机科学》 北大核心 2025年第S1期359-368,共10页
随着建筑行业的发展,施工机械的使用日益频繁,由此带来的安全问题也愈发严峻。近年来,全国范围内发生的生产安全事故中,建筑起重机械类事故占比显著。因此,如何有效监测并预防施工现场工人与施工机械之间的潜在风险,成为当前研究的热点... 随着建筑行业的发展,施工机械的使用日益频繁,由此带来的安全问题也愈发严峻。近年来,全国范围内发生的生产安全事故中,建筑起重机械类事故占比显著。因此,如何有效监测并预防施工现场工人与施工机械之间的潜在风险,成为当前研究的热点。首先,系统归纳了基于定位技术和深度学习方法的工人与施工机械距离检测技术,重点介绍深度学习的方法并阐述其关键技术;其次,根据距离检测方法总结国内外的研究现状,并对各方法的优势及局限性进行对比分析;然后,通过目前研究面临的挑战,提出相应的改进策略;最后,给出未来发展趋势,为相关领域的研究者提供有价值的参考。 展开更多
关键词 深度学习 施工现场 距离检测 深度估计
在线阅读 下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部