再读HOG(梯度方向直方图)

来源:互联网 发布:淘宝司法拍卖房产平台 编辑:程序博客网 时间:2024/05/18 18:53

1、Gamma/Color Computation  伽玛和色彩归一化

论文:作者采用几种输入分别做实验进行测试,分别为RGB、LAB、灰度图。但是最终结果显示在性能表现上,仅仅只能得倒适中的效果。所以作者猜测这也许与后面步骤中对描述符的归一化所获取的结果是相同的。

结果:这一步可以省略,因为后面有对描述符的归一化


2、Gradient Computation 梯度计算

论文:作者采用一维的离散微分模板(uncentred[-1, 1], centred[-1, 0, 1], cubic[1, -8, 0, 8, 1]),3×3的Sobel模板,2×2的对角线模板,结果显示模板类型越简单效果会越好。其中一维的离散微分模板中,centered的效果是最佳的。作者还试着加入高斯平滑,但是加入后效果更差。这因为加入高斯平滑后,会减轻图像的边缘效果,使得图像的有用信息减少,计算梯度信息更难。

结果:选取最简单的离散微分模板,一维的,centered。

    而对于彩色图像而言,对每一个颜色通道都计算其梯度,把具有最大准则的那一个作为此像素的梯度向量。


3、Spatial/Orientation Binning 空间/方向直方图

论文:单元中的每一个像素点为梯度元素的方向在梯度方向直方图上进行投票。图片中的单元可以是矩形的,也可以是辐射形的。投票采用的是像素点梯度幅度的函数,即要么是幅度本身,要么是幅值平方,要么是幅值的平方根或者是幅值的截断形式。实验证明,采用幅值本身是最好的。图像单元经过证实,采用9个bin获取的效果最佳,超过9个的性能几乎没什么提升。直方图通道是分布在0-180度之间,采用0-360度的即使是直方图通道的数目比原来增加两倍,最小效果依然不如0-180度。作者猜测也许是人的衣着和背景的不同,导致采用有方向的(0-360度)是没有信息的。然而,采用有方向的表示在某些特别的对象识别中是有用的,比如汽车、摩托车。

结论:投票机制采取梯度幅度值本身,直方图通道选择9为最佳,而对于直方图通道的方向或者无方向,则具体问题具体对待。


4、Normalization and Descriptor Blocks 标准化和描述符块

论文:经过第3步得到的梯度,其之间的相差变化非常的大,需要标准化才能够得到更好的性能。思路是将每个单元中组成一个更大的块然后对每个块进行标准化。作者对矩状的HOG分别用L2-Norm,L2-Hys,L1-Norm以及L1-Sqrt。其中,L2-Norm,L2-Hys和L1-Sqrt性能相差无几,L1-Norm减低了性能。对于圆形的HOG,作者也采用了围绕中心点的标准化,但是效果不理想,原因应该是辐射状的HOG没有重合的区域。

原创粉丝点击