人脸检测

来源：互联网发布：dota2公开天梯数据编辑：程序博客网时间：2024/05/15 08:39

http://abruzzi.iteye.com/blog/463668

Harr特征级联表

OpenCV在物体检测上使用的是haar特征的级联表，这个级联表中包含的是boost的分类器。首先，人们采用样本的haar特征进行分类器的训练，从而得到一个级联的boost分类器。训练的方式包含两方面：

1. 正例样本，即待检测目标样本
2. 反例样本，其他任意的图片

首先将这些图片统一成相同的尺寸，这个过程被称为归一化，然后进行统计。一旦分类器建立完成，就可以用来检测输入图片中的感兴趣区域的检测了，一般来说，输入的图片会大于样本，那样，需要移动搜索窗口，为了检索出不同大小的目标，分类器可以按比例的改变自己的尺寸，这样可能要对输入图片进行多次的扫描。

什么是级联的分类器呢？级联分类器是由若干个简单分类器级联成的一个大的分类器，被检测的窗口依次通过每一个分类器，可以通过所有分类器的窗口即可判定为目标区域。同时，为了考虑效率问题，可以将最严格的分类器放在整个级联分类器的最顶端，那样可以减少匹配次数。

基础分类器以haar特征为输入，以0/1为输出，0表示未匹配，1表示匹配。

Haar特征

边界特征，包含四种
线性特征，包含8种
中心围绕特征，包含两种

在扫描待检测图片的时候，以边界特征中的(a)为例，正如前面提到的那样，计算机中的图片是一个数字组成的矩阵，程序先计算整个窗口中的灰度值x，然后计算矩形框中的黑色灰度值y，然后计算(x-2y)的值，得到的数值与x做比较，如果这个比值在某一个范围内，则表示待检测图片的当前扫描区域符合边界特征(a)，然后继续扫描。

关于这个算法的更详细描述已经超出了本文的范围，可以在参考资源中获得更多的信息。

非固定大小目标检测

因为是基于视频流的目标检测，我们事先不太可能知道要检测的目标的大小，这就要求我们的级联表中的分类器具有按比例增大(或者缩小)的能力，这样，当小的窗口移动完整个待检测图片没有发现目标时，我们可以调整分类器的大小，然后继续检测，直到检测到目标或者窗口与待检测图片的大小相当为止。

步骤一：图片预处理

在从摄像头中获得一个帧(一张图片)后，我们需要先对这张图片进行一些预处理：

将图片从RGB模式转为灰度图将灰度图
进行灰度图直方图均衡化操作

这两个步骤在OpenCV中是非常简单的：

Python代码

image_size = cv.cvGetSize(image)#获取原始图像尺寸
grayscale = cv.cvCreateImage(image_size, 8, 1)# 建立一个空的灰度图
cv.cvCvtColor(image, grayscale, cv.CV_BGR2GRAY)#转换
storage = cv.cvCreateMemStorage(0)#新建一块存储区，以备后用
cv.cvClearMemStorage(storage)
cv.cvEqualizeHist(grayscale, grayscale)# 灰度图直方图均衡化

步骤二：检测并标记目标

OpenCV中，对于人脸检测的模型已经建立为一个XML文件，其中包含了上面提到的harr特征的分类器的训练结果，我们可以通过加载这个文件而省略掉自己建立级联表的过程。有了级联表，我们只需要将待检测图片和级联表一同传递给OpenCV的目标检测算法即可得到一个检测到的人脸的集合。

Python代码

# detect objects
cascade = cv.cvLoadHaarClassifierCascade('haarcascade_frontalface_alt.xml',
cv.cvSize(1,1))
faces = cv.cvHaarDetectObjects(grayscale, cascade, storage, 1.2, 2,
cv.CV_HAAR_DO_CANNY_PRUNING,
cv.cvSize(50, 50))#设置最小的人脸为50*50像素
if faces:
print 'face detected here', cv.cvGetSize(grayscale)
for i in faces:
cv.cvRectangle(image, cv.cvPoint( int(i.x), int(i.y)),
cv.cvPoint(int(i.x + i.width), int(i.y + i.height)),
cv.CV_RGB(0, 255, 0), 1, 8, 0)#画一个绿色的矩形框

步骤三：用highgui画出视频窗口

Python代码

highgui.cvNamedWindow ('camera', highgui.CV_WINDOW_AUTOSIZE)
highgui.cvMoveWindow ('camera', 50, 50)
highgui.cvShowImage('camera', detimg)

可以看到，OpenCV的API相当清晰，使用Python的包装，可以使得代码非常小。好了，我们可以看看程序的运行结果：

由于视频流是动态的，所以我们可以在程序的入口中使用一个无限循环，在循环中，每次从视频中读入一个帧，将这个帧传输给人脸检测模块，检测模块在这个帧上进行标记(如果有人脸的话)，然后返回这个帧，主程序拿到这个帧后，更新显示窗口。

opencv的其他特性

拉普拉斯边缘检测

Python代码

def laplaceTransform(image):
laplace = None
colorlaplace = None
planes = [None, None, None]
image_size = cv.cvGetSize(image)
if not laplace:
for i in range(len(planes)):
planes[i] = cv.cvCreateImage(image_size, 8, 1)
laplace = cv.cvCreateImage(image_size, cv.IPL_DEPTH_16S, 1)
colorlaplace = cv.cvCreateImage(image_size, 8, 3)
cv.cvSplit(image, planes[0], planes[1], planes[2], None)
for plane in planes:
cv.cvLaplace(plane, laplace, 3)
cv.cvConvertScaleAbs(laplace, plane, 1, 0)
cv.cvMerge(planes[0], planes[1], planes[2], None, colorlaplace)
colorlaplace.origin = image.origin
return colorlaplace

效果图：

CVtypes中自带了一个关于图像色彩空间的直方图的例子：

结束语

OpenCV的功能十分强大，而且提供了大量的算法实现，文中涉及到的内容只是计算机视觉中很小的一部分。读者可以考虑将采集到的人脸进行标识，从而实现特定人的人脸识别。或者考虑将人脸检测移植到网络上，从而实现远程监控。试想一下，原来没有生命的机器，我们可以通过自己的思想，动作来使得它们看起来像是有思想一样，这件事本身就非常的有趣。

阅读全文

0 0