HOG基本概念
来源:互联网 发布:uml 数据库建模 编辑:程序博客网 时间:2024/06/10 22:49
HOG基本概念
在构造函数中,有几个参数非常重要,分别为winSize(64,128), blockSize(16,16), blockStride(8,8), cellSize(8,8), nbins(9)。在此,用几个示意图来表示。
a) 窗口大小winSize
b) 块大小blockSize
c) 胞元大小cellSize
d) 梯度方向数
nbins代表在一个胞元中统计梯度的方向数目。如:nbins=9表示一个胞元内统计9个方向的梯度直方图。
Hog特征维数的计算
首先给出一个hog
HOGDescriptor* hog = newHOGDescriptor(cvSize(64, 48), cvSize(8, 6), cvSize(8, 6), cvSize(4, 3), 9);
根据上面的概念可知,cvSize(64,48)表示窗口的大小,cvSize(8, 6)表示块(block)大小,cvSize(8,6)表示块滑动增量(blockStride)大小,cvSize(4, 3)表示胞元(cell)大小,9表示每个胞单元中梯度直方图的数量。
注:输入的图片尺寸为640×480。
据此,可知:
一个块(block)包含A=(blockSize.width/cellSize.width)*(blockSize.height / cellSize.height)个胞元(cell),所以一个块(block)含有9A个梯度直方图。按照所给出的数据,可得结果为36。
一个窗口包含B=((windowSize.width-blockSize.width)/(blockStrideSize.width)+1)* ((windowSize.height-blockSize.height)/(blockStrideSize.height)+1)个块(block),所以一个窗口包含9AB个梯度直方图。
按照所给出的数据,可得结果为2304。
其次,计算特征向量hog->compute(trainImg,descriptors, Size(64, 48), Size(0, 0))
此处,trainImg代表输入的图片(此处尺寸为640×480),descriptors表示保存特征结果的Vector,Size(64,48)表示windows的步进,第四个为padding,用于填充图片以适应大小。
当padding以默认状态Size(0,0)出现,滑动窗口window来计算图片时,
结果不一定为整数。
此时,查看compute()函数发现,其中有一段代码如下:
padding.width = (int)alignSize(std::max(padding.width,0), cacheStride.width);
padding.height = (int)alignSize(std::max(padding.height,0), cacheStride.height);
这段代码就是用来将padding的大小来适应stride的大小。
在我的实例中,由于取得数都事先设计好,都是整数。而当若结果不为整数时,则将其取值为比其大的最小整数。如若padding.width计算为7.8时,就取8.
所以一幅640×480的图片,按照前面的参数,则可以取的特征数为230400维。
- HOG基本概念
- HOG
- HOG
- HOG
- hog
- HOG
- HOG
- HOG
- HOG
- HoG
- HOG
- 基本概念
- 基本概念
- 基本概念
- 基本概念
- 基本概念
- 基本概念
- 基本概念
- Application Fundamentals(应用基础)
- NYOJ 49 【开心的小明】
- 运算符优先级
- Spring 3整合Quartz 2实现定时任务
- 音乐播放器乱码
- HOG基本概念
- PJSIP2.0使用以及交叉编译存在问题解决
- 7周项目3
- 网络管理功能
- dwz 时间控件 onchange方法
- IE兼容模式下面,js中的json字符串不能有多余的逗号
- 将博客搬至CSDN
- Android之ActionBar学习
- ios中的各中动画(旋转,平移)