期刊文献+
共找到304篇文章
< 1 2 16 >
每页显示 20 50 100
LpDepth:基于拉普拉斯金字塔的自监督单目深度估计
1
作者 曹明伟 邢景杰 +1 位作者 程宜风 赵海锋 《计算机科学》 北大核心 2025年第3期33-40,共8页
自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影... 自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影响深度图的精度。针对上述问题,提出一种基于拉普拉斯金字塔的自监督单目深度估计方法(Self-supervised Monocular Depth Estimation Based on the Laplace Pyramid,LpDepth)。此方法的核心思想是:首先,使用拉普拉斯残差图丰富编码特征,以弥补在下采样过程中丢失的特征信息;其次,在下采样过程中使用最大池化层突显和放大特征信息,使编码器在特征提取过程中更容易地提取到训练模型所需要的特征信息;最后,使用残差模块解决过拟合问题,提高解码器对特征的利用效率。在KITTI和Make3D等数据集上对所提方法进行了测试,同时将其与现有经典方法进行了比较。实验结果证明了所提方法的有效性。 展开更多
关键词 单目深度估计 拉普拉斯金字塔 残差网络 深度图
在线阅读 下载PDF
基于图像关键帧的Visual-Depth Map建立方法 被引量:1
2
作者 马琳 杨浩 +1 位作者 谭学治 冯冠元 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2018年第11期23-31,共9页
对于室内视觉定位系统,需要在离线阶段建立Visual Map数据库用来存储图像信息,在线阶段用户通过与Visual Map数据库进行比对来完成用户位置的估计.离线阶段建立的数据库可以采用逐点采样或视频流采样的方式.但是无论何种方式,考虑到数... 对于室内视觉定位系统,需要在离线阶段建立Visual Map数据库用来存储图像信息,在线阶段用户通过与Visual Map数据库进行比对来完成用户位置的估计.离线阶段建立的数据库可以采用逐点采样或视频流采样的方式.但是无论何种方式,考虑到数据库中图像信息的相似性,传统方式建立的数据库中存储图像有较多冗余,导致增加了在线阶段的定位时间开销.因此,本文根据Visual Map中的相邻图像间的相似性,提出了一种基于图像关键帧的Visual-Depth Map建立方法,有效地减少了离线数据库的规模.在离线阶段,本文使用Kinect传感器同时获得图像信息和深度信息;然后,通过基于图像相似度的图像关键帧算法对原始图像序列进行筛选,得到关键帧序列,从而实现Visual-Depth Map的建立.在线阶段,用户可以直接输入查询图像与Visual-Depth Map中的图像序列进行检索匹配,找到相似度较高的匹配图像,再通过EPnP算法进行2D-3D的位姿估计,完成用户位置的计算.实验证明,本文所提方法可以在保证较高定位精度的前提下,有效减少离线数据库规模,降低在线阶段的定位时间开销. 展开更多
关键词 室内定位系统 视觉定位 Visual-depth map 关键帧
在线阅读 下载PDF
Depth map软件在网师园空间分析中的应用 被引量:43
3
作者 郭佳希 《中国园林》 北大核心 2014年第8期120-124,共5页
空间句法是一种通过对包括建筑、聚落、城市以及景观在内的人居空间结构的量化描述来研究空间组织的理论和方法。作为空间句法的专用分析软件,近年来Depth map在空间结构分析领域得到了越来越广泛的应用。以江南园林网师园为例,利用Dept... 空间句法是一种通过对包括建筑、聚落、城市以及景观在内的人居空间结构的量化描述来研究空间组织的理论和方法。作为空间句法的专用分析软件,近年来Depth map在空间结构分析领域得到了越来越广泛的应用。以江南园林网师园为例,利用Depth map软件建立模型,对其空间的可视和可行2个层面分别进行连接度、整合度和深度值的空间结构分析,并得出相应结论:Depth map在定量分析园林空间特性,确定园林空间不同层面之间的联系方面起着重要作用。 展开更多
关键词 风景园林 空间句法 depth map 网师园 连接度 整合度 深度值
在线阅读 下载PDF
基于depth-map和分布式视频编码的多视点视频传输方法 被引量:1
4
作者 吴琳 金志刚 +1 位作者 赵安安 周圆 《计算机应用》 CSCD 北大核心 2012年第9期2441-2444,共4页
针对多视点视频传输系统数据量庞大的问题,提出一种基于深度图(depth-map)和分布式视频编码(DVC)的不等错误保护(UEP)传输方法。该方法首先基于多个视点提取深度图;然后,在传输过程中传输一个视点及其深度图;最后,经过网络传输,在解码... 针对多视点视频传输系统数据量庞大的问题,提出一种基于深度图(depth-map)和分布式视频编码(DVC)的不等错误保护(UEP)传输方法。该方法首先基于多个视点提取深度图;然后,在传输过程中传输一个视点及其深度图;最后,经过网络传输,在解码端由一个视点图及其深度图生成其他视点。由于视点图和深度图在解码端的重要程度不同,对需要传输的视点图和深度图采用不同的分布式视频编码方法,进行不平等的错误保护。仿真实验结果表明,所提传输方法比传统的分布式多视点视频编码传输系统具有更好的抗误码性能,提高了传输可靠性,图像的峰值信噪比(PSNR)约提高1.5 dB。 展开更多
关键词 分布式视频编码 WYNER-ZIV编码 深度图 不等错误保护
在线阅读 下载PDF
深度感知的息肉分割算法
5
作者 秦婧 张俊 +2 位作者 李嫣 任文琦 张金刚 《工程科学与技术》 北大核心 2025年第2期74-83,共10页
息肉分割在结直肠癌预防和肠道疾病诊断中起着关键作用。然而,现有的息肉分割算法普遍忽视了息肉的3维凸起特性,限制了其分割性能的提升。深度图能够提供关于息肉凸起和形状的额外信息,从而更准确地捕捉息肉的空间结构。因此,本文提出... 息肉分割在结直肠癌预防和肠道疾病诊断中起着关键作用。然而,现有的息肉分割算法普遍忽视了息肉的3维凸起特性,限制了其分割性能的提升。深度图能够提供关于息肉凸起和形状的额外信息,从而更准确地捕捉息肉的空间结构。因此,本文提出了一种深度感知的息肉分割网络(depth aware network for polyp segmentation,DANet),通过结合深度信息,改善分割模型对于息肉边界和形状的识别能力。该网络包括一个空域分支、一个深度分支及一个特征融合模块。空域分支采用基于Transformer的编码器,获得多尺度的特征表示。深度分支用于提取息肉的深度级别特征,并通过注意力机制关注息肉的3维结构。特征融合模块将息肉和周围组织的深度差异引入多尺度特征中,增强各尺度特征对息肉位置和形态的识别能力。在5个息肉数据集和6个评价指标上将本文算法DANet与多个先进息肉分割算法进行了对比实验,实验结果显示,DANet在Kvasir-SEG数据集上的Dice系数和交并比分别达到了0.911和0.855,而在CVC-ClinicDB数据集上则分别达到了0.934和0.884,显著优于现有方法。 展开更多
关键词 深度感知 息肉分割 深度学习 深度图
在线阅读 下载PDF
融合自适应采样与全局感知的图像深度估计算法
6
作者 王国相 李昌隆 +2 位作者 宋俊锋 叶振 金恒 《计算机工程与应用》 北大核心 2025年第5期261-268,共8页
深度估计旨在通过少量稀疏深度样本点预测场景的稠密深度图,现有方法通常直接从稀疏深度样本生成最终的深度预测图,没有充分挖掘稀疏深度图包含的几何信息,导致深度估计算法的预测精度不够高。针对上述问题,提出一种融合自适应采样与全... 深度估计旨在通过少量稀疏深度样本点预测场景的稠密深度图,现有方法通常直接从稀疏深度样本生成最终的深度预测图,没有充分挖掘稀疏深度图包含的几何信息,导致深度估计算法的预测精度不够高。针对上述问题,提出一种融合自适应采样与全局感知的图像深度估计算法,由粗粒度到细粒度逐步预测深度图。通过引入预训练的深度补全网络预测粗粒度的稠密深度图,获取丰富的场景结构信息和语义信息。设计自适应深度采样方法,引导算法模型对远处的区域施加更多关注,缓解深度数据的长尾分布问题。同时通过新设计的全局感知模块,捕获并融合多尺度特征,从而获取更多的场景上下文信息。在NYU-Depth-v2数据集上的实验结果表明,算法在整体性能上超越了其他方法;消融实验的结果验证了提出的各个模块的有效性;Zero-shot实验的结果表明算法有较好的泛化性能,其中在ScanNet数据集上的阈值精度指标δ<1.25相比P3D方法提升了42个百分点,相比S2D方法则提升了3.8个百分点。 展开更多
关键词 深度估计 深度补全 稠密深度图 多尺度特征融合 自适应采样
在线阅读 下载PDF
三维人脸深度图的流形学习-LOGMAP识别方法 被引量:11
7
作者 詹曙 张芝华 +2 位作者 叶长明 蒋建国 S.Ando 《电子测量与仪器学报》 CSCD 2012年第2期138-143,共6页
人脸识别是生物特征识别技术最友好的身份识别方式,而三维人脸识别由于可解决二维人脸识别中存在的光照、姿态等局限,成为人脸识别的研究热点,但其特征维数过高是该领域的瓶颈,而维数约减是解决这一问题的关键。流形学习是一类非线性维... 人脸识别是生物特征识别技术最友好的身份识别方式,而三维人脸识别由于可解决二维人脸识别中存在的光照、姿态等局限,成为人脸识别的研究热点,但其特征维数过高是该领域的瓶颈,而维数约减是解决这一问题的关键。流形学习是一类非线性维数约减算法,LOGMAP是一种基于黎曼法坐标的流形学习算法,该算法可以在保持度量信息不变的情况下,把高维空间的数据映射到低维空间。构建了基于流形学习的三维人脸识别框架,并结合LOGMAP进行三维人脸深度图的识别。实验结果表明,该方法在三维深度图上可以得到良好的识别效果。 展开更多
关键词 三维深度图 人脸识别框架 流形学习 黎曼法坐标 LOGmap
在线阅读 下载PDF
基于BSA-seq技术的块茎芽眼深度QTL定位分析
8
作者 邵顺伟 陈卓 +9 位作者 兰振东 蔡兴奎 邹华芬 李晨曦 唐景华 朱熙 张彧 董建科 金辉 宋波涛 《作物学报》 北大核心 2025年第7期1725-1735,共11页
芽眼深度是马铃薯块茎的重要性状之一,对马铃薯的外观品质及加工适宜性具有重要影响。为挖掘控制马铃薯芽眼深度的数量性状位点,本研究以四倍体深芽眼品种“华薯12”为母本、浅芽眼高代品系“天2002-4-5”为父本,杂交获得F_(1)代分离群... 芽眼深度是马铃薯块茎的重要性状之一,对马铃薯的外观品质及加工适宜性具有重要影响。为挖掘控制马铃薯芽眼深度的数量性状位点,本研究以四倍体深芽眼品种“华薯12”为母本、浅芽眼高代品系“天2002-4-5”为父本,杂交获得F_(1)代分离群体,共255份无性系。基于连续2年田间表型观测数据,分别选取20个深芽眼和20个浅芽眼个体构建混合池,利用BSA-seq技术进行芽眼深度相关性状的QTL定位,并结合传统QTL定位方法,采用完备区间作图法构建遗传连锁图谱,成功定位到2个与芽眼深度相关的QTL位点。2年表型相关性分析结果表明,马铃薯块茎芽眼深度主要受遗传因素的控制。10号染色体上qEyd10.1位点的LOD值为4.96,表型贡献率为14.49%;3号染色体上qEyd3.1位点的LOD值为3.29,表型贡献率为10.18%。其中, qEyd3.1与此前报道的芽眼深度调控位点一致,而qEyd10.1为新发现的QTL。2个位点的加性效应均为负值,表明降低芽眼深度的等位基因来源于浅芽眼亲本“天2002-4-5”。通过对定位区间内候选基因注释结合芽眼深浅材料基因结构变异分析,推测Soltu.DM.10G029390.1、Soltu.DM.03G036540.1、Soltu.DM.03G036140.1和Soltu.DM.03G036580.1可能为与芽眼深度相关的候选基因。本研究通过BSA-seq与传统QTL定位相结合的方式,快速完成了同源四倍体马铃薯中芽眼深度这一数量性状的调控位点定位工作,并初步确定了4个候选基因,为进一步完成芽眼深度调控基因的克隆及其遗传机制解析奠定了重要基础,也为培育具有浅芽眼块茎的四倍体马铃薯新品种提供了参考。 展开更多
关键词 马铃薯 芽眼深度 QTL定位 BSA-seq 遗传连锁图谱
在线阅读 下载PDF
基于多视角边缘检测融合的放射性物品运输容器特征提取
9
作者 张沛东 肖连博 +4 位作者 张煜航 焦力敏 孙洪超 庄大杰 李国强 《包装工程》 北大核心 2025年第11期294-302,共9页
目的针对放射性物品运输容器可靠性评估中存在的三维形变测量精度不足的瓶颈问题,提出一种融合多视角深度图投影与亚像素边缘检测的三维点云特征提取方法,以高精度几何特征数据支撑容器的结构优化设计与安全验证。方法首先,构建最小包... 目的针对放射性物品运输容器可靠性评估中存在的三维形变测量精度不足的瓶颈问题,提出一种融合多视角深度图投影与亚像素边缘检测的三维点云特征提取方法,以高精度几何特征数据支撑容器的结构优化设计与安全验证。方法首先,构建最小包围立方体,并设计六自由度多视角正交投影系统,将三维点云降维映射至二维深度图,实现容器全表面覆盖;其次,基于拟合边缘模型及局部灰度面积效应,检测亚像素边缘点;进一步结合投影参数化映射与动态曲率插值算法,引入法向量连续性约束及加权融合策略,重构高保真三维特征点;最后,搭建实验系统,获取容器三维点云数据,基于简化率、配准误差及计算时间指标,并与现有点云特征提取方法进行对比。结果采用所提方法获取特征点云,其配准最大平均误差为1.33 mm,最大均方根误差为1.39 mm,简化率为1.6%。与其他文献的结果相比,所提方法的简化率更小,计算时间更短,且误差更小。结论所提方法有效解决了大规模点云处理与几何特征保真之间的矛盾,显著提升了放射性容器三维特征提取的精度和效率,为核能工程安全评估提供了可靠的几何形变量化分析技术支撑。 展开更多
关键词 放射性物品运输容器 三维形变测量 多视角深度图融合 亚像素边缘检测
在线阅读 下载PDF
多传感器融合的无人车SLAM系统研究
10
作者 吴文昊 谷玉海 《重庆理工大学学报(自然科学)》 北大核心 2025年第1期229-235,共7页
为提高无人车的避障能力,使其能够在构建的地图环境中高效地进行自动定位和路径规划,提出一种多传感器融合的无人车SLAM系统。对于障碍物监测,采用激光雷达与深度相机信息融合的方法构建地图,以融合得到更精准的栅格图。搭建了履带式差... 为提高无人车的避障能力,使其能够在构建的地图环境中高效地进行自动定位和路径规划,提出一种多传感器融合的无人车SLAM系统。对于障碍物监测,采用激光雷达与深度相机信息融合的方法构建地图,以融合得到更精准的栅格图。搭建了履带式差速底盘运动学模型,通过融合IMU数据提高位姿估计精度;分析了贝叶斯推理方法,在决策层以该方法有效融合激光雷达与深度相机的数据;提出基于卡尔曼滤波算法动态调整权重将雷达与相机的后验概率融合,得到最终的地图栅格信息。最后,根据融合后的数据构建地图并实现自主导航的功能。通过对比实验发现,改进的多传感器融合建图算法定位精度综合提高了91.67%,实时的整体性能提升了54.46%,栅格建图完整性提升了6.59%。 展开更多
关键词 贝叶斯算法 融合建图 激光雷达 深度相机 ROS2
在线阅读 下载PDF
基于特征点云配准的SLAM重建深度优化方法
11
作者 曹学伟 袁杰 梁荣光 《计算机工程与设计》 北大核心 2025年第3期657-664,共8页
针对视觉SLAM特征法中深度估计准确性和可靠性偏低的问题,提出一种基于特征点云配准的SLAM重建深度优化方法。利用SHOT特征描述子对三维点云提取特征,使用特征点云配准替代传统视觉特征法进行相机位姿估计。通过设定节点误差函数,优化... 针对视觉SLAM特征法中深度估计准确性和可靠性偏低的问题,提出一种基于特征点云配准的SLAM重建深度优化方法。利用SHOT特征描述子对三维点云提取特征,使用特征点云配准替代传统视觉特征法进行相机位姿估计。通过设定节点误差函数,优化视觉特征法建立的点云及其二义性点,建立带有纹理效果的稠密点云模型。在TUM和ICL-NUIM数据集上进行仿真实验,其结果表明,该方法相对于传统SLAM方法的相机位姿轨迹精度提升了10%。采用Kinect v2型RGB-D相机验证了该方法的有效性,实现了室内场景具有一定纹理效果的模型建立。 展开更多
关键词 点云配准 相机位姿估计 深度优化 稠密建图 同时定位与地图构建 点云地图 点云特征
在线阅读 下载PDF
基于雾天模拟图像的能见度估计方法研究
12
作者 邱实卓 叶青 +1 位作者 黄佳恒 刘建平 《电光与控制》 北大核心 2025年第3期94-100,共7页
针对带有能见度标签的雾天图像数据集匮乏的问题,提出一种基于雾天模拟图像的能见度检测方法。通过无监督深度估计模型构建户外清晰图像的深度图,并且利用特征融合来细化深度图细节,采用暗通道法筛选天空区域估计大气光值,获得设定能见... 针对带有能见度标签的雾天图像数据集匮乏的问题,提出一种基于雾天模拟图像的能见度检测方法。通过无监督深度估计模型构建户外清晰图像的深度图,并且利用特征融合来细化深度图细节,采用暗通道法筛选天空区域估计大气光值,获得设定能见度下户外图像的透射率图,进一步获得带有不同能见度标签的雾天模拟图像数据集,基于此利用改进后的ShuffleNet V2网络训练能见度估计模型。对数据集和真实雾天图像进行了能见度等级估计的验证实验,实验结果表明,对能见度小于500 m的雾天图像具有良好的能见度估测结果,对小于200 m的检测准确率高于90%,总体准确率为87.8%,表明该方法具有可行性,可用于大雾条件下的道路能见度等级估测。 展开更多
关键词 雾天模拟 深度图 特征融合 ShuffleNet V2 能见度估计
在线阅读 下载PDF
一种适用视觉定位的暗光图像增强方法
13
作者 石秋婷 程玉 +2 位作者 陈帅 吴奕雯 陈垚杰 《导航定位学报》 北大核心 2025年第1期106-112,共7页
针对暗光环境下特征丢失影响视觉同步定位与地图构建(SLAM)精度的问题,提出一种深度可分离U型网络(DSCU-net)的图像增强方法:参考编码解码结构与跳跃连接机制,构建逐像素变换曲线估计网络,并引入深度可分离卷积以减少网络参数量;然后在... 针对暗光环境下特征丢失影响视觉同步定位与地图构建(SLAM)精度的问题,提出一种深度可分离U型网络(DSCU-net)的图像增强方法:参考编码解码结构与跳跃连接机制,构建逐像素变换曲线估计网络,并引入深度可分离卷积以减少网络参数量;然后在公开数据集上进行图像增强算法性能测试,并使用开源SLAM算法验证DSCU-net对定位精度的影响。结果表明,该方法能有效提升图像照明度,降低暗光条件下的定位误差,最小误差可降至4.9 cm;综合考虑增强图像质量和计算效率,提出的方法具有优越的暗光增强性能和网络轻量化特点,能有效提高暗光环境下视觉SLAM的定位精度。 展开更多
关键词 暗光 视觉定位 同步定位与地图构建(SLAM) 图像增强 深度可分离卷积 轻量化
在线阅读 下载PDF
改进几何约束的多特征视觉Manhattan-SLAM
14
作者 程鹏 王珂 +2 位作者 邓甘霖 李炎隆 李鹏 《导航定位学报》 北大核心 2025年第2期172-178,共7页
针对视觉跟踪过程中出现的低纹理场景,以及由于运动模糊等因素导致同时定位与建图(SLAM)系统对环境特征的识别和跟踪偏差较大,甚至失效的问题,设计一种点线面多特征融合跟踪方法:改进快速直线检测算法,显化隐藏参数并使其可调整;然后针... 针对视觉跟踪过程中出现的低纹理场景,以及由于运动模糊等因素导致同时定位与建图(SLAM)系统对环境特征的识别和跟踪偏差较大,甚至失效的问题,设计一种点线面多特征融合跟踪方法:改进快速直线检测算法,显化隐藏参数并使其可调整;然后针对短线特征进行筛选与合并,提高系统对环境信息的利用效率;最后在曼哈顿(Manhattan)世界假设中,提出一种结合几何与外观的线特征跟踪策略,利用线特征之间的几何关系建立约束优化匹配与跟踪,提高位姿估计的精度。实验结果表明,改进的特征跟踪方法相较于原算法在跟踪效率和整体定位精度方面都有明显提升,验证了该算法的有效性。 展开更多
关键词 多特征融合 视觉同时定位与建图(SLAM) 曼哈顿(Manhattan)假设 彩色-深度(RGB-D) 位姿估计
在线阅读 下载PDF
基于注意力-残差双特征流卷积神经网络的深度图帧内编码单元快速划分算法
15
作者 贾克斌 吴岳珩 《北京工业大学学报》 北大核心 2025年第5期539-551,共13页
针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。... 针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。首先,提出一种具有3个分支的注意力-残差双特征流卷积神经网络(attention-residual bi-feature stream convolutional neural networks,ARBS-CNN)模型,其中基于残差模块(residual module,RM)和特征蒸馏(feature distill,FD)模块的2个分支用于提取全局图像特征,基于动态模块(dynamic module,DM)和卷积-卷积块注意力模块(convolutional-convolutional block attention module,Conv-CBAM)的分支用于提取局部图像特征;然后,将提取到的特征进行整合并输出,得到对深度图CU划分结构的预测;最后,将ARBS-CNN嵌入到3D-HEVC测试平台中,利用预测结果加速深度图帧内编码。与原始算法相比,提出的算法能在维持率失真性能几乎不受影响的条件下,平均减少74.2%的编码时间。实验结果表明,该算法能够在保持率失真性能的条件下,有效降低3D-HEVC的编码复杂度。 展开更多
关键词 三维高效视频编码(three-dimensional high efficiency video coding 3D-HEVC) 深度图 卷积神经网络(convolutional neural networks CNN) 编码单元(coding unit CU)划分 帧内编码 双特征流
在线阅读 下载PDF
动态环境下基于深度图的无人车激光SLAM算法
16
作者 孙明晓 王鑫源 +2 位作者 栾添添 王潇 刘鹏飞 《仪器仪表学报》 北大核心 2025年第3期101-109,共9页
针对激光SLAM在动态环境下出现精度下降与系统鲁棒性差的问题,故提出一种动态环境下基于深度图的无人车激光SLAM算法。首先,针对激光入射光线贴近地面时,部分地面点云会被误判为动态障碍物的问题,通过角度阈值将激光点云分割为地面点云... 针对激光SLAM在动态环境下出现精度下降与系统鲁棒性差的问题,故提出一种动态环境下基于深度图的无人车激光SLAM算法。首先,针对激光入射光线贴近地面时,部分地面点云会被误判为动态障碍物的问题,通过角度阈值将激光点云分割为地面点云与非地面点云,排除地面点云的影响。其次,将非地面点云投影为深度图,把三维空间中的点云投影到二维图像上,采用图像领域的方法减少点云数据处理的复杂度。然后,针对稀疏的激光点云不能准确反映真实环境的问题,利用激光雷达的距离信息作为自适应调节深度图的权重设置深度图的分辨率,使得在不同距离区间的深度图具有不同的分辨率,在不同的距离区间都能够准确识别出动态障碍物,提高系统识别动态障碍物的效率。最后,将局部地图与激光雷达查询帧所形成的深度图进行像素相减,通过得到的视差图去除动态障碍物,并通过降低深度图的分辨率恢复被误删的静态点,得到高精度静态地图。通过实验验证,在仿真环境中,本算法的动态障碍物移除分数为94.13%。在KITTI数据集中,本算法的动态障碍物移除分数为95.22%。在小场景环境和大场景环境中,本算法的动态障碍物移除分数分别为96.43%和93.30%。算法能高效去除动态障碍物,提高地图精度与系统鲁棒性。 展开更多
关键词 SLAM 动态环境 点云分割 深度图 无人车
在线阅读 下载PDF
一种利用MAP估计的双目运动体视算法
17
作者 杨敬安 《电子学报》 EI CAS CSCD 北大核心 1997年第1期50-53,共4页
本文提出一种融合运动和体视信息的运动与结构参数的鲁棒估计算法.算法首先通过计算瞬时FOE,实现对每个像素处位移的MAP估计,并计算关联的置信度;然后利用位移估计,从两图像序列之一计算相对深度,导出能用于匹配两体视图像... 本文提出一种融合运动和体视信息的运动与结构参数的鲁棒估计算法.算法首先通过计算瞬时FOE,实现对每个像素处位移的MAP估计,并计算关联的置信度;然后利用位移估计,从两图像序列之一计算相对深度,导出能用于匹配两体视图像序列的视差先验概率分布,使体视对的两帧图像匹配,确定3D景物深度.算法可方便地估计每个像素处的视差,不需对表面作平滑假设. 展开更多
关键词 双目运动体视 map估计 鲁棒估计算法
在线阅读 下载PDF
基于DRF-MAP模型的单目图像深度估计的改进算法 被引量:3
18
作者 张蓓蕾 孙韶媛 +1 位作者 武江伟 谷小婧 《红外技术》 CSCD 北大核心 2009年第12期712-715,共4页
图像深度信息获取是机器视觉领域的活跃研究课题之一。将图像深度估计问题归结为模式识别问题,以单目图像深度为模式类,在多尺度下从图像块中提取绝对和相对深度特征,并选择表征上下文关系的DRF(Discriminative Random Field)方法来表... 图像深度信息获取是机器视觉领域的活跃研究课题之一。将图像深度估计问题归结为模式识别问题,以单目图像深度为模式类,在多尺度下从图像块中提取绝对和相对深度特征,并选择表征上下文关系的DRF(Discriminative Random Field)方法来表述某图像块的深度和其邻域深度之间的关系,从而构建起基于DRF-MAP(Maximum a posteriori)的单目图像深度估计模型。通过实验,得到了一类单目图像对应的深度图像,从而证明了单目图像深度估计模型对应的改进算法的有效性。 展开更多
关键词 模式识别 深度图像 DRF—map 多尺度 深度特征
在线阅读 下载PDF
基于OMAP3530的2D到3D视频自动转换系统 被引量:1
19
作者 黄转娣 农镇铭 +3 位作者 赖豪 刘佩雯 王卫卫 朱跃生 《数据采集与处理》 CSCD 北大核心 2012年第6期670-676,共7页
研究和实现了一个基于OMAP3530的2D到3D视频自动转换系统,重点研究深度图获取和深度信息渲染等主要核心技术及其实现。该系统利用OMAP3530其特有的双核结构,进行系统优化:由其ARM处理器完成系统界面的设置及控制、显示等功能,其DSP处理... 研究和实现了一个基于OMAP3530的2D到3D视频自动转换系统,重点研究深度图获取和深度信息渲染等主要核心技术及其实现。该系统利用OMAP3530其特有的双核结构,进行系统优化:由其ARM处理器完成系统界面的设置及控制、显示等功能,其DSP处理器实现图像分割和渲染等核心算法,实现了1个高效的2D到3D视频的视频转换系统。2D转3D技术可把现有的大量传统2D视频转换成3D视频,简化和节省了用摄像机直接捕捉3D场景的复杂性和高成本,可以极大解决3D片源不足的问题。 展开更多
关键词 深度图获取 深度信息渲染 平面视频转换立体视频
在线阅读 下载PDF
Hand segmentation from a single depth image based on histogram threshold selection and shallow CNN 被引量:1
20
作者 XU Zhengze ZHANG Wenjun 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第5期675-685,共11页
Real-time hand gesture recognition technology significantly improves the user's experience for virtual reality/augmented reality(VR/AR) applications, which relies on the identification of the orientation of the ha... Real-time hand gesture recognition technology significantly improves the user's experience for virtual reality/augmented reality(VR/AR) applications, which relies on the identification of the orientation of the hand in captured images or videos. A new three-stage pipeline approach for fast and accurate hand segmentation for the hand from a single depth image is proposed. Firstly, a depth frame is segmented into several regions by histogrambased threshold selection algorithm and by tracing the exterior boundaries of objects after thresholding. Secondly, each segmentation proposal is evaluated by a three-layers shallow convolutional neural network(CNN) to determine whether or not the boundary is associated with the hand. Finally, all hand components are merged as the hand segmentation result. Compared with algorithms based on random decision forest(RDF), the experimental results demonstrate that the approach achieves better performance with high-accuracy(88.34% mean intersection over union, mIoU) and a shorter processing time(≤8 ms). 展开更多
关键词 HAND SEGMENTATION HISTOGRAM THRESHOLD selection convolutional neural network(CNN) depth map
在线阅读 下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部