再读HOG(梯度方向直方图)
来源:互联网 发布:淘宝司法拍卖房产平台 编辑:程序博客网 时间:2024/05/18 18:53
1、Gamma/Color Computation 伽玛和色彩归一化
论文:作者采用几种输入分别做实验进行测试,分别为RGB、LAB、灰度图。但是最终结果显示在性能表现上,仅仅只能得倒适中的效果。所以作者猜测这也许与后面步骤中对描述符的归一化所获取的结果是相同的。
结果:这一步可以省略,因为后面有对描述符的归一化
2、Gradient Computation 梯度计算
论文:作者采用一维的离散微分模板(uncentred[-1, 1], centred[-1, 0, 1], cubic[1, -8, 0, 8, 1]),3×3的Sobel模板,2×2的对角线模板,结果显示模板类型越简单效果会越好。其中一维的离散微分模板中,centered的效果是最佳的。作者还试着加入高斯平滑,但是加入后效果更差。这因为加入高斯平滑后,会减轻图像的边缘效果,使得图像的有用信息减少,计算梯度信息更难。
结果:选取最简单的离散微分模板,一维的,centered。
而对于彩色图像而言,对每一个颜色通道都计算其梯度,把具有最大准则的那一个作为此像素的梯度向量。
3、Spatial/Orientation Binning 空间/方向直方图
论文:单元中的每一个像素点为梯度元素的方向在梯度方向直方图上进行投票。图片中的单元可以是矩形的,也可以是辐射形的。投票采用的是像素点梯度幅度的函数,即要么是幅度本身,要么是幅值平方,要么是幅值的平方根或者是幅值的截断形式。实验证明,采用幅值本身是最好的。图像单元经过证实,采用9个bin获取的效果最佳,超过9个的性能几乎没什么提升。直方图通道是分布在0-180度之间,采用0-360度的即使是直方图通道的数目比原来增加两倍,最小效果依然不如0-180度。作者猜测也许是人的衣着和背景的不同,导致采用有方向的(0-360度)是没有信息的。然而,采用有方向的表示在某些特别的对象识别中是有用的,比如汽车、摩托车。
结论:投票机制采取梯度幅度值本身,直方图通道选择9为最佳,而对于直方图通道的方向或者无方向,则具体问题具体对待。
4、Normalization and Descriptor Blocks 标准化和描述符块
论文:经过第3步得到的梯度,其之间的相差变化非常的大,需要标准化才能够得到更好的性能。思路是将每个单元中组成一个更大的块然后对每个块进行标准化。作者对矩状的HOG分别用L2-Norm,L2-Hys,L1-Norm以及L1-Sqrt。其中,L2-Norm,L2-Hys和L1-Sqrt性能相差无几,L1-Norm减低了性能。对于圆形的HOG,作者也采用了围绕中心点的标准化,但是效果不理想,原因应该是辐射状的HOG没有重合的区域。
- 再读HOG(梯度方向直方图)
- HOG(方向梯度直方图)
- HOG(方向梯度直方图)
- HOG(方向梯度直方图)
- HOG(方向梯度直方图)
- HOG(方向梯度直方图)
- HOG(方向梯度直方图)
- 方向梯度直方图(HOG)
- 方向梯度直方图(HOG)
- 梯度方向直方图(HOG)
- HoG 梯度方向直方图
- HOG方向梯度直方图
- HOG 梯度方向直方图
- HOG 梯度方向直方图
- HOG 梯度方向直方图
- HOG(方向梯度直方图)
- 方向梯度直方图(HOG)阅读笔记
- HOG特征(方向梯度直方图特征)
- 利用 gnuplot 绘制时间序列图
- insmod: error inserting 'first_drv.ko': -1 Invalid module format
- 主流操作系统内核、操作系统以及它们之间的联系
- hdu 1087 Super Jumping! Jumping! Jumping!(dp+最长递增序列)
- kernel中断
- 再读HOG(梯度方向直方图)
- Combination Sum II
- 大学计算机网络复习题
- Android开发学习第一天
- Ubuntu 12.04 LTS,MySQL不支持中文,C语言从数据库中读取出来的中文显示???
- secure CRT 登陆虚拟机中ubuntu详解
- MySQL数据库备份与恢复方法
- CTreeCtrl
- Oracle Solaris 11 配置网络