-
题名融合自适应采样与全局感知的图像深度估计算法
- 1
-
-
作者
王国相
李昌隆
宋俊锋
叶振
金恒
-
机构
丽水学院
浙江省特色文创产品数字化设计与智能制造重点实验室
北京邮电大学信息与通信工程学院
浙江大华技术股份有限公司
-
出处
《计算机工程与应用》
北大核心
2025年第5期261-268,共8页
-
基金
浙江省“尖兵”重点研发计划项目(2023C01004)
装发共用基金(61405180409)
+1 种基金
浙江省自然科学基金探索项目(LTGN23F020001)
丽水市公益性技术应用研究计划项目(2022GYX06)。
-
文摘
深度估计旨在通过少量稀疏深度样本点预测场景的稠密深度图,现有方法通常直接从稀疏深度样本生成最终的深度预测图,没有充分挖掘稀疏深度图包含的几何信息,导致深度估计算法的预测精度不够高。针对上述问题,提出一种融合自适应采样与全局感知的图像深度估计算法,由粗粒度到细粒度逐步预测深度图。通过引入预训练的深度补全网络预测粗粒度的稠密深度图,获取丰富的场景结构信息和语义信息。设计自适应深度采样方法,引导算法模型对远处的区域施加更多关注,缓解深度数据的长尾分布问题。同时通过新设计的全局感知模块,捕获并融合多尺度特征,从而获取更多的场景上下文信息。在NYU-Depth-v2数据集上的实验结果表明,算法在整体性能上超越了其他方法;消融实验的结果验证了提出的各个模块的有效性;Zero-shot实验的结果表明算法有较好的泛化性能,其中在ScanNet数据集上的阈值精度指标δ<1.25相比P3D方法提升了42个百分点,相比S2D方法则提升了3.8个百分点。
-
关键词
深度估计
深度补全
稠密深度图
多尺度特征融合
自适应采样
-
Keywords
depth estimation
depth completion
dense depth map
multi-scale feature fusion
adaptive sampling
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于最小割的稠密视差图恢复算法
被引量:7
- 2
-
-
作者
彭启民
贾云得
-
机构
北京理工大学计算机科学与技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2005年第6期1090-1095,共6页
-
基金
国家自然科学基金~~
-
文摘
针对经典最小割算法计算量大和适应性不足的问题,提出一种改进的基于网络最小割计算稠密深度图的全局优化方法.首先,根据视差变化与不连续区域之间的关系,定义了具有一定适应性的平滑约束和遮挡约束,然后使用网络最小割算法,求解遮挡情况下的稠密视差.其次,在分析最小割算法复杂性的基础上,给出了一种受限α-扩展(α-expansion)操作,该操作根据灰度连通性和特征点匹配的结果对每次网络构造的顶点进行控制,减少网络中顶点和边的数目,可有效提高计算效率.实验结果显示,该算法在保证视差恢复准确性的前提下,能以较快的速度计算出较理想的稠密视差图.
-
关键词
稠密深度图
优化
最小割
连通区域
受限α-扩展
-
Keywords
dense depth map
optimum
graph cut
connected region
restricted α-expansion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名微型实时多目立体视觉机设计与实现
被引量:7
- 3
-
-
作者
贾云得
徐一华
刘万春
杨聪
朱玉文
-
机构
北京理工大学计算机科学与工程系
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2003年第9期1334-1336,共3页
-
基金
国家自然科学基金项目 (No.K60 0 750 0 5)
国防基础研究项目(No .60 1 0 72 1 1 )
-
文摘
本文给出一种实时计算场景稠密深度图的多目立体视觉机设计与实现方法 .立体视觉机使用多个微型摄像机同步获取场景图像 ,采用图像修正、LoG滤波、多立体图像对匹配和稠密深度图等并行算法 ,利用FPGA的大规模并行处理能力和各算法间的多级流水线关系 ,在一片FPGA芯片上实现了立体视觉信息的实时处理 .设计的立体视觉机体积小 ,运行速度快 .当图像分辨率为 32 0× 2 4 0像素 ,深度搜索范围为 6 4级 ,深度图精度为 8位 ,时钟频率为6 0MHz时 ,恢复稠密深度图的速度大于 30帧 /秒 .
-
关键词
立体视觉
稠密深度图
FPGA
实时计算
微型系统
-
Keywords
stereo vision
dense depth map
FPGA
real time computing
miniature system
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-