3D目标识别---局部特征描述子介绍

来源：互联网发布：10年前你错过了淘宝编辑：程序博客网时间：2024/05/18 00:13

3D目标识别研究随着深度传感器的普及逐渐受到关注，本文主要介绍了到目前为止一些经典的三维局部特征描述方法，有些地方可能不够完善或错误解读，仅供读者参考了解。后续还会继续完善。

1. 3D识别的流程图

2. 局部特征描述子

Spin Image

统计的是在特征点局部圆柱坐标系下的领域点2D坐标分布直方图特征。如下图所示，圆柱坐标系由特征点p的法向量n以及切平面构成。点p的所有球形领域点q在圆柱坐标系下的坐标分布形成一个2D的Points分布图，然后离散化得到spin image。离散的过程会通过双线性插值的方式平滑每个点的作用，是的该描述子具有一定的抗噪声能力。最后得到的spin image 往往还需要一个归一化步骤，通过除以自旋图中最大的像素值得到，该步骤使得自旋图描述子具有一定的抗分辨率变化的能力。

不足：

a)坐标系依赖特征点的法向量，容易受噪声干扰；

b)没有考虑领域点的方位信息，使得特异性降低。

参考文献：

[1]Johnson AE, Hebert M (1999) Using spin images for efficient object recognition in cluttered 3D scenes. IEEE Transactions on Pattern Analysis and Machine Intelligence 21(5):433–449

SHOT(Signature of Histograms of OrienTations)
一种结合了几何分布信息以及直方图统计信息的鲁棒性，特异性描述子。具体的实现步骤如下：

step1: 根据特征点球邻域信息建立局部参考坐标系LRF,对特征点的球邻域分别沿径向（内外球)、经度(时区）和纬度方向(南北半球)进行区域划分。通常径向划分为2，经度划分为8，纬度划分为2，总共32个小区域。

step2:分别统计每个小区域内的法向量夹角余弦值分布情况，法向量划分为11个bin。最终SHOT的长度为：32x11=352。

step2具体实现细节：采用双线性插值统计每个区域中的直方图特征

参考文献：

[1]Tombari, Federico, Samuele Salti, and Luigi Di Stefano. "Unique signatures of histograms for local surface description." European conference on computer vision. Springer Berlin Heidelberg, 2010.

[2]Salti S, Tombari F, Di Stefano L. SHOT: unique signatures of histograms for surface and texture description[J]. Computer Vision and Image Understanding, 2014, 125: 251-264.

RoPS
通过统计领域点在局部坐标系LRF三个平面的投影分布图的某些图像特征信息所构建的1D直方图特征，具体的实现步骤如下：
step1: 由特征点的球领域点建立局部参考坐标系LRF
step2: 将领域点转化到局部参考坐标系LRF下，绕x轴转θk（k=1,2,...,T)。每次旋转后将领域点向三个坐标平面投影，分别获取三个投影的最小包围盒（通过计算最小和最大坐标得到）。然后将每个投影图离散为LxL的图像，计算每个图像的特征信息，包括μ_11，μ₂₁，μ₁₂，μ₂₂，e。其中μmn 表示图像的m,n阶中心矩，e表示香农熵。也即是每次旋转得到3个投影图像，每个图像计算5个图像特征量，则绕x轴得到的特征向量的长度为Tx3x5。
step3: 然后分别绕y轴和z轴进行同样的操作。最终得到的RoPS特征长度=3xTx3x5，T一般取值为3，则RoPS的总长度为135。
描述子的性能评价：
优点：该描述子具有很好的抗噪声和抗干扰能力，基于该描述子的3D识别算法在多个数据集上取得了state-of-the-art的识别效果
不足：依赖于LRF的鲁棒性和特异性，文中提到的LRF构建方法需要mesh数据，不能直接在点云数据上计算。描述子的计算开销大，实时性差。

参考文献：
[1]Guo Y, Sohel F, Bennamoun M, Lu M, Wan J (2013b) Rotational projection statistics for 3D local surface description and object recognition.International Journal of Computer Vision 105(1):63–86

TriSI
spin image的一种改进，利用特征点领域点建立局部参考坐标系LRF, 然后沿着每个轴分别获取相应的spin image，得到F={SI,SI,SI}。然后利用PCA进行降维处理，通常降到95%的特征值比例。该描述子具有很好的抗噪声和抗分辨率变化的性能。建立LRF，沿着三个轴的方向得到各自的SI，一定程度上融合了领域点的方位信息。
不足：描述子的性能依赖LRF的鲁棒性和特异性。

参考文献：
[1]Guo Y, Sohel F, Bennamoun M, Lu M, Wan J (2013c) TriSI: A distinctive local surface descriptor for 3D modeling and object recognition. In: 8th International Conference on Computer Graphics Theory and Applications, pp 86–93

3D shape context
扩展自2D shape context 的一种3D局部特征描述子。具体的实现方式是以特征点的法向量为其球邻域的北极方向，然后分别沿径向（半径方向）Dsc_r，经度Dsc_a和纬度Dsc_e方向进行区域划分。然后统计落入每个区域的加权点的值的和

参考文献：
[1]Frome A, Huber D, Kolluri R, et al. Recognizing objects in range data using regional point descriptors[C]//European conference on computer vision. Springer Berlin Heidelberg, 2004: 224-237.

Unique shape context
3D shape context 的改进版，通过建立局部参考坐标系LRF，消除3DSC 经度划分方向存在的歧义问题，提高了描述子的区分性，节省了存储空间。

参考文献：
[1]Tombari, Federico, Samuele Salti, and Luigi Di Stefano. "Unique shape context for 3D data description." Proceedings of the ACM workshop on 3D object retrieval. ACM, 2010.

ISS（intrinsic shape signatures)

VD-LSD
建立特征点的局部参考坐标系，然后计算邻域点在该坐标系下一系列的属性值，如下图所示：
接着利用一个特征选择算法筛选出一个属性子集，然后依据这个属性子集构建一个特征直方图作为描述子。

参考文献：
[1]Taati B, Bondy M, Jasiobedzki P, et al. Variable dimensional local shape descriptors for object recognition in range data[C]//2007 IEEE 11th International Conference on Computer Vision. IEEE, 2007: 1-8.
[2]Taati B, Greenspan M. Local shape descriptor selection for object recognition in range data[J]. Computer Vision and Image Understanding, 2011, 115(5): 681-694.

LSP(Local surface patch)
由特征点邻域内所有点的Shape index指数和邻域点与特征点法向量夹角余弦值离散化形成的2D直方图特征。Shape index由曲面点的最大曲率和最小曲率生成得到。具体的计算公式如下：

为了匹配的高效性，通过计算局部曲面的类型Surface Type 以及重心坐标值进行简单匹配，然后在进行直方图匹配。下面是surface type的计算公式：

其中H和K分别是p点的平均曲率和高斯曲率。

参考文献：
[1]Chen H, Bhanu B. 3D free-form object recognition in range images using local surface patches[J]. Pattern Recognition Letters, 2007, 28(10): 1252-1262.

THRIFT
利用两个不同的球邻域估计特征点邻域内的每个点的大窗口法向量n_large以及小窗口法向量n_small，一般大窗口半径为0.8R,小窗口半径为0.3R，其中R是特征点的支持半径。计算每个邻域点的两个法向量的夹角θ，将它们映射到一个1D直方图中，直方图的bin一般取10，每个bin的宽度=90/10.然后将直方图归一化为单位长度向量。

参考文献：
[1]Flint, Alex, Anthony R. Dick, and Anton Van Den Hengel. "Thrift: Local 3D Structure Recognition." dicta. Vol. 7. 2007.

PFH(Point Feature Histograms)
统计的是特征点邻域内任意点对之间的夹角以及距离特征信息，任意点对之间需要建立一个局部参考坐标系，具体细节可参照文献[1]，然后将每个点对4元特征映射为一个Index值，如下式所示：

上面因为对每个特征元进行了2分（0或1）,则直方图的长度为2⁴=16,如果3分，则直方图的长度为3⁴=81.

参考文献：
[1]Rusu R B, Marton Z C, Blodow N, et al. Persistent point feature histograms for 3D point clouds[C]//Proc 10th Int Conf Intel Autonomous Syst (IAS-10), Baden-Baden, Germany. 2008: 119-128.

FPFH（Fast Point Feature Histogram)
PFH计算开销很大，存在很多重复性的计算。因为邻域点对存在大量重叠，FPFH是对PFH的改进，使得计算效率从O(nk²)降到了O(nk)，同时保留了PFH的描述性。具体的实现步骤如下：
step1: 计算p点邻域内与之直接相连的所有点对特征，生成Simplified Point Feature Histogram(SPFH)。
step2: 计算邻域内其他点的SPFH特征。
step3: p点的FPFH特征由邻域内的所有点的SPFH特征加权得到。

参考文献：

[1]Rusu R B, Blodow N, Beetz M. Fast point feature histograms (FPFH) for 3D registration[C]//Robotics and Automation, 2009. ICRA'09. IEEE International Conference on. IEEE, 2009: 3212-3217.

2.5D-SIFT

SI-SIFT
EM
MeshHoG

阅读全文

0 0

3D目标识别---局部特征描述子介绍

3D目标识别研究随着深度传感器的普及逐渐受到关注，本文主要介绍了到目前为止一些经典的三维局部特征描述方法，有些地方可能不够完善或错误解读，仅供读者参考了解。后续还会继续完善。

1. 3D识别的流程图

2. 局部特征描述子

Spin Image

SHOT(Signature of Histograms of OrienTations)一种结合了几何分布信息以及直方图统计信息的鲁棒性，特异性描述子。具体的实现步骤如下：

参考文献：[1]Guo Y, Sohel F, Bennamoun M, Lu M, Wan J (2013b) Rotational projection statistics for 3D local surface description and object recognition.International Journal of Computer Vision 105(1):63–86

参考文献：[1]Guo Y, Sohel F, Bennamoun M, Lu M, Wan J (2013c) TriSI: A distinctive local surface descriptor for 3D modeling and object recognition. In: 8th International Conference on Computer Graphics Theory and Applications, pp 86–93

LSP(Local surface patch)由特征点邻域内所有点的Shape index指数和邻域点与特征点法向量夹角余弦值离散化形成的2D直方图特征。Shape index由曲面点的最大曲率和最小曲率生成得到。具体的计算公式如下：

[1]Rusu R B, Blodow N, Beetz M. Fast point feature histograms (FPFH) for 3D registration[C]//Robotics and Automation, 2009. ICRA'09. IEEE International Conference on. IEEE, 2009: 3212-3217.

2.5D-SIFT SI-SIFTEMMeshHoG

SHOT(Signature of Histograms of OrienTations)
一种结合了几何分布信息以及直方图统计信息的鲁棒性，特异性描述子。具体的实现步骤如下：

参考文献：
[1]Guo Y, Sohel F, Bennamoun M, Lu M, Wan J (2013b) Rotational projection statistics for 3D local surface description and object recognition.International Journal of Computer Vision 105(1):63–86

参考文献：
[1]Guo Y, Sohel F, Bennamoun M, Lu M, Wan J (2013c) TriSI: A distinctive local surface descriptor for 3D modeling and object recognition. In: 8th International Conference on Computer Graphics Theory and Applications, pp 86–93

LSP(Local surface patch)
由特征点邻域内所有点的Shape index指数和邻域点与特征点法向量夹角余弦值离散化形成的2D直方图特征。Shape index由曲面点的最大曲率和最小曲率生成得到。具体的计算公式如下：

2.5D-SIFT

SI-SIFT
EM
MeshHoG