Distinctive Image Features from Scale-Invariant Keypoints（SIFT）

来源：互联网发布：矩阵秩的性质编辑：程序博客网时间：2024/05/21 19:50

SIFT的论文：Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International journal of computer vision, 2004, 60(2): 91-110.

摘要和引言。。。

摘要：本文提出了一种从图像中提取独特不变特征的方法，可用于不同视角之间目标或场景的可靠匹配的方法。这种特点对图像的尺度和旋转具有不变性。并在大范围的仿射变换，三维视点的改变，噪音和光照变化的图像匹配具有鲁棒性。特征是highly distinctive的，使场景图像中的单一特征和许多图像中提取的大型特征数据库一样，有很高的正确匹配率。本文还介绍了一个使用该特征来识别目标的方法。通过将个别特征与由已知目标特征组成的数据库进行快速最近邻算法的匹配，然后使用 Hough变换来识别属于单一目标的聚类（ clusters），最后通过执行一致的姿态参数的最小二乘解来验证。这种识别方法可以在杂乱和遮挡的对象间鲁棒的识别目标并且具有接近线性的时间复杂度。
关键词：不变特征，目标识别，尺度不变性，图像匹配

1. Introduction
图像匹配是计算机视觉领域中很多问题的关键，包括目标和场景识别、多幅影像的 3D structure、stereo correspondence、 motion tracking等。本文描述的图像特征有很多特性使得它适合将一个目标或场景的不同影像进行匹配。这些特征对于图像尺度和旋转具有不变性，并在光照变化和三维相机视点变化的情况下具有部分的不变性。它在空间域和频率域具有很好的局部性，减少了遮挡（occlusion ）、杂乱和噪音的影响。通过有效的算法，可以从典型的图像中提取海量的特征。另外，这些特征是 highly distinctive的，使场景图像中的单一特征和大型特征数据库一样，有很高的正确匹配率，为目标和场景识别提供了基础。
通过一个级联滤波算法将 minimized提取这些特征的 cost，这样，昂贵的运算仅在通过初步测试的 locations。下面是生成图像特征集的主要步骤：

1.Scale-space extrema detection：第一阶段对所有尺度和图像 locations进行搜索。通过使用 difference-of-Gaussian function高斯差分函数来识别对于尺度和方向具有不变性的潜在兴趣点。

2.Keypoint localization：在每一个候选 location，一个 detailed model适合于确定位置和尺度。基于关键点的稳定性来选择关键点。

3.Orientation assignment：基于局部图像的梯度方向，给每个 keypoint location指定一个或多个方向。后面所有操作的图像数据都是将每个特征的方向、尺度和位置进行相关变换得到的，因此特征对这些变换具有不变性。

4.Keypoint descriptor：局部梯度是在所选尺度上每个关键点附近的区域测量得到的。这些局部梯度可以转化为允许强烈的局部形状扭曲和光照变化的图像表示法。

这种方法被命名为Scale Invariant Feature Transform (SIFT)，把图像数据转换到对于局部特征尺度不变的坐标上。
该方法的一个重要方面是它生成了大量特征，它们密集的覆盖了图像所有的尺度和 locations。一幅 500*500像素的典型图片可以产生约 2000个稳定的特征（这个数字依赖于图像内容和几个参数的选择）。特征的数量对目标识别尤为重要，要检测杂乱背景下的小目标，至少要求每个目标有三个特征被正确匹配才是可靠的识别。
对于图像匹配和识别，从一组参考图像中提取 SIFT features并存储在数据库中，通过将新图像中的各个特征与原有数据库进行对比并基于特征向量的欧氏距离找到候选匹配特征。本文将讨论可以在大型数据库中进行快速计算的 fast nearest-neighbor algorithms。
关键点描述子是highly distinctive 的，可以使单个特征在大型特征数据库中以很大概率进行正确匹配。然而，在杂乱的图像中，很多背景中的特征在数据库中不存在正确匹配，产生了很多错误的配对。通过标识与新图像在 the object and its location、尺度和方向一致的关键点的子集，将正确的匹配从匹配的全集中过滤出来。几个特征的这些参数恰好一致的概率比任一个特征匹配错误的概率要小很多。可以通过一个高效的广义 Hough transform的散列表快速确定这些一致的类簇。
每个拥有三个及三个以上与目标一致的特征的类簇的构成需进一步的更详细的验证。首先，最小二乘估计是 the object pose(对象构成 )的仿射近似。其他与此构成一致的图像特征被标识出来，而离群点被丢弃。最后，详细的计算可以认为是一个特定的特征集合表明目标存在的概率，给出匹配的准确率和可能的错误匹配数。通过这些测试的 Object matches可以认为就是正确的匹配。

后面还是不贴了，毕竟经典算法，看完发现很多大神有分享相关学习经验，都总结的超美。。
译文：http://www.cnblogs.com/cuteshongshong/archive/2012/05/25/2506374.html
译文下载：http://download.csdn.net/detail/terry_o0o/9482612 （基本是上面的）
July大神的总结：http://blog.csdn.net/v_JULY_v/article/details/6186942
SIFT原理与源码分析：http://blog.csdn.net/xiaowei_cqu/article/details/8069548
Opencv2.4.9源码分析–SIFT：http://blog.csdn.net/zhaocj/article/details/42124473

0 0