文摘针对含有噪声和外点的三维点云刚体配准问题,由于迭代最近点(iterative closest point,ICP)算法的配准精度较低,为此,该文提出了一种基于改进ICP算法的三维点云刚体配准方法。考虑到伪Huber损失函数对噪声和外点不敏感、鲁棒性强,首先,建立了基于伪Huber损失函数的三维点云刚体配准模型。其次,利用RGB-D点云数据中颜色信息辅助建立点云对应关系,以提高改进ICP算法中对应点匹配的准确性。最后,结合奇异值分解(singular value decomposition,SVD)和Levenberg-Marquardt(LM)的优化算法对三维点云刚体配准模型进行优化求解。实验结果表明,该文所提三维点云刚体配准方法的配准精度高,能够有效抑制噪声和外点对配准精度的影响。
文摘图像描述(Image captioning)是一个融合了计算机视觉和自然语言处理这两个领域的研究方向,本文为图像描述设计了一种新颖的显著性特征提取机制(Salient feature extraction mechanism,SFEM),能够在语言模型预测每一个单词之前快速地向语言模型提供最有价值的视觉特征来指导单词预测,有效解决了现有方法对视觉特征选择不准确以及时间性能不理想的问题.SFEM包含全局显著性特征提取器和即时显著性特征提取器这两个部分:全局显著性特征提取器能够从多个局部视觉向量中提取出显著性视觉特征,并整合这些特征到全局显著性视觉向量中;即时显著性特征提取器能够根据语言模型的需要,从全局显著性视觉向量中提取出预测每一个单词所需的显著性视觉特征.本文在MS COCO(Microsoft common objects in context)数据集上对SFEM进行了评估,实验结果表明SFEM能够显著提升基准模型(baseline)生成图像描述的准确性,并且SFEM在生成图像描述的准确性方面明显优于广泛使用的空间注意力模型,在时间性能上也大幅领先空间注意力模型.