-
题名基于中心点注意力的多视角多人三维人体姿态估计
被引量:1
- 1
-
-
作者
江以恒
李洋
刘春颜
赵蕴龙
-
机构
南京航空航天大学计算机科学与技术学院
南京航空航天大学无人机研究院
-
出处
《计算机科学》
北大核心
2025年第3期68-76,共9页
-
基金
新一代人工智能国家科技重大专项(2022ZD0115403)。
-
文摘
多视角多人三维人体姿态估计被广泛应用于各类计算机视觉任务中。当前基于空间体素的方法由于需要消耗巨大的资源难以实现在边缘计算设备上的实时性运算;而回归方法因缺乏几何约束导致泛化能力有限,在新的环境中无法直接应用而需要采集数据进行微调。通过结合空间体素方法与基于回归的姿态估计方法并融合二者的特点,提出了基于中心点注意力回归的多视角多人三维人体姿态估计模型。该模型通过一个小规模的体素网络粗略估计人体中心点位置,并以此构建初始姿态,随后在人体中心点的范围内进行回归预测得到更精确的人体姿态。本研究通过结合空间关键点位置,使得模型的回归预测更加准确,在大尺度上平均准确率提升1.16%,同时使得模型非常容易训练,在小样本微调中准确率最多提升了12%。这使得基于回归的模型可以在新的场景下通过小数据量的训练快速部署而实现泛化性能和通用性的大幅提升。
-
关键词
三维人体姿态估计
多视角
中心点预测网络
中心点注意力
TRANSFORMER
体素网络
-
Keywords
3D human pose estimation
Multi-view
Center-point proposal network
Center-point attention
Transformer
voxelnet
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名改进的基于冗余点过滤的3D目标检测方法
被引量:4
- 2
-
-
作者
宋一凡
张鹏
宗立波
马波
刘立波
-
机构
宁夏大学信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2020年第9期2555-2560,共6页
-
基金
国家自然科学基金资助项目(61862050)
宁夏重点研发计划项目(2017BY067)。
-
文摘
VoxelNet网络模型是第一个基于点云的端对端目标检测网络,只利用点云数据来生成高精度的3D目标检测框,具有十分良好的效果。但是,VoxelNet使用完整场景的点云数据作为输入,导致耗费了更多的计算资源在背景点云数据上,而且只包含几何信息的点云对目标的识别粒度较低,在较复杂的场景中容易出现误检测和漏检测。针对这些问题对VoxelNet进行了改进,在VoxelNet模型中加入视锥体候选区。首先,通过RGB前视图对感兴趣目标进行定位;然后,将目标2D位置升维至空间视锥体,在点云中提取目标视锥体候选区,过滤冗余点云,仅对视锥体候选区中的点云数据进行计算来得到检测结果。改进后的算法与VoxelNet相比,降低了点云计算量,避免了对背景点云数据的计算,提升了有效运算率,同时,避免了过多背景点的干扰,降低了误检测和漏检测率。KITTI数据集上的实验结果表明,改进后的算法在简单、中等、困难三种模式下的3D平均精度分别为67.92%、59.98%、53.95%,优于VoxelNet模型。
-
关键词
3D目标检测
点云
冗余点过滤
深度学习
voxelnet
视锥体
-
Keywords
three-dimensional(3D)object detection
point cloud
redundant point filtering
deep learning
voxelnet
view frustum
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-