opencv中camshift例子的应用

来源：互联网发布：电子杂志app软件哪个好编辑：程序博客网时间：2024/05/17 22:23

贴一篇对opencv里camshiftdemo注释比较详细的博客

原地址

http://www.cnblogs.com/tornadomeet/archive/2012/03/15/2398769.html

目标跟踪学习笔记_1(opencv中meanshift和camshift例子的应用)

在这一节中，主要讲目标跟踪的一个重要的算法Camshift，因为它是连续自使用的meanShift，所以这2个函数opencv中都有，且都很重要。为了让大家先达到一个感性认识。这节主要是看懂和运行opencv中给的sample并稍加修改。

Camshift函数的原型为：RotatedRect CamShift(InputArray probImage, Rect& window, TermCriteria criteria)。

其中probImage为输入图像直方图的反向投影图，window为要跟踪目标的初始位置矩形框，criteria为算法结束条件。函数返回一个有方向角度的矩阵。该函数的实现首先是利用meanshift算法计算出要跟踪的中心，然后调整初始窗口的大小位置和方向角度。在camshift内部调用了meanshift算法计算目标的重心。

下面是一个opencv自带的CamShift算法使用工程实例。该实例的作用是跟踪摄像头中目标物体，目标物体初始位置用鼠标指出，其跟踪窗口大小和方向随着目标物体的变化而变化。其代码及注释大概如下：

#include "StdAfx.h"#include "opencv2/video/tracking.hpp"#include "opencv2/imgproc/imgproc.hpp"#include "opencv2/highgui/highgui.hpp"#include <iostream>#include <ctype.h>using namespace cv;using namespace std;Mat image;bool backprojMode = false; //表示是否要进入反向投影模式，ture表示准备进入反向投影模式bool selectObject = false;//代表是否在选要跟踪的初始目标，true表示正在用鼠标选择int trackObject = 0; //代表跟踪目标数目bool showHist = true;//是否显示直方图Point origin;//用于保存鼠标选择第一次单击时点的位置Rect selection;//用于保存鼠标选择的矩形框int vmin = 10, vmax = 256, smin = 30;void onMouse( int event, int x, int y, int, void* ){    if( selectObject )//只有当鼠标左键按下去时才有效，然后通过if里面代码就可以确定所选择的矩形区域selection了    {        selection.x = MIN(x, origin.x);//矩形左上角顶点坐标        selection.y = MIN(y, origin.y);        selection.width = std::abs(x - origin.x);//矩形宽        selection.height = std::abs(y - origin.y);//矩形高        selection &= Rect(0, 0, image.cols, image.rows);//用于确保所选的矩形区域在图片范围内    }    switch( event )    {    case CV_EVENT_LBUTTONDOWN:        origin = Point(x,y);        selection = Rect(x,y,0,0);//鼠标刚按下去时初始化了一个矩形区域        selectObject = true;        break;    case CV_EVENT_LBUTTONUP:        selectObject = false;        if( selection.width > 0 && selection.height > 0 )            trackObject = -1;        break;    }}void help(){    cout << "\nThis is a demo that shows mean-shift based tracking\n"            "You select a color objects such as your face and it tracks it.\n"            "This reads from video camera (0 by default, or the camera number the user enters\n"            "Usage: \n"            "    ./camshiftdemo [camera number]\n";    cout << "\n\nHot keys: \n"            "\tESC - quit the program\n"            "\tc - stop the tracking\n"            "\tb - switch to/from backprojection view\n"            "\th - show/hide object histogram\n"            "\tp - pause video\n"            "To initialize tracking, select the object with mouse\n";}const char* keys = {    "{1|  | 0 | camera number}"};int main( int argc, const char** argv ){    help();    VideoCapture cap; //定义一个摄像头捕捉的类对象    Rect trackWindow;    RotatedRect trackBox;//定义一个旋转的矩阵类对象    int hsize = 16;    float hranges[] = {0,180};//hranges在后面的计算直方图函数中要用到    const float* phranges = hranges;    CommandLineParser parser(argc, argv, keys);//命令解析器函数    int camNum = parser.get<int>("1");             cap.open(camNum);//直接调用成员函数打开摄像头    if( !cap.isOpened() )    {        help();        cout << "***Could not initialize capturing...***\n";        cout << "Current parameter's value: \n";        parser.printParams();        return -1;    }    namedWindow( "Histogram", 0 );    namedWindow( "CamShift Demo", 0 );    setMouseCallback( "CamShift Demo", onMouse, 0 );//消息响应机制    createTrackbar( "Vmin", "CamShift Demo", &vmin, 256, 0 );//createTrackbar函数的功能是在对应的窗口创建滑动条，滑动条Vmin,vmin表示滑动条的值，最大为256    createTrackbar( "Vmax", "CamShift Demo", &vmax, 256, 0 );//最后一个参数为0代表没有调用滑动拖动的响应函数    createTrackbar( "Smin", "CamShift Demo", &smin, 256, 0 );//vmin,vmax,smin初始值分别为10,256,30    Mat frame, hsv, hue, mask, hist, histimg = Mat::zeros(200, 320, CV_8UC3), backproj;    bool paused = false;        for(;;)    {        if( !paused )//没有暂停        {            cap >> frame;//从摄像头抓取一帧图像并输出到frame中            if( frame.empty() )                break;        }        frame.copyTo(image);                if( !paused )//没有按暂停键        {            cvtColor(image, hsv, CV_BGR2HSV);//将rgb摄像头帧转化成hsv空间的            if( trackObject )//trackObject初始化为0,或者按完键盘的'c'键后也为0，当鼠标单击松开后为-1            {                int _vmin = vmin, _vmax = vmax;                //inRange函数的功能是检查输入数组每个元素大小是否在2个给定数值之间，可以有多通道,mask保存0通道的最小值，也就是h分量//这里利用了hsv的3个通道，比较h,0~180,s,smin~256,v,min(vmin,vmax),max(vmin,vmax)。如果3个通道都在对应的范围内，则//mask对应的那个点的值全为1(0xff)，否则为0(0x00).                inRange(hsv, Scalar(0, smin, MIN(_vmin,_vmax)),                        Scalar(180, 256, MAX(_vmin, _vmax)), mask);                int ch[] = {0, 0};                hue.create(hsv.size(), hsv.depth());//hue初始化为与hsv大小深度一样的矩阵，色调的度量是用角度表示的，红绿蓝之间相差120度，反色相差180度                mixChannels(&hsv, 1, &hue, 1, ch, 1);//将hsv第一个通道(也就是色调)的数复制到hue中，0索引数组                if( trackObject < 0 )//鼠标选择区域松开后，该函数内部又将其赋值1                {                    //此处的构造函数roi用的是Mat hue的矩阵头，且roi的数据指针指向hue，即共用相同的数据，select为其感兴趣的区域                    Mat roi(hue, selection), maskroi(mask, selection);//mask保存的hsv的最小值//calcHist()函数第一个参数为输入矩阵序列，第2个参数表示输入的矩阵数目，第3个参数表示将被计算直方图维数通道的列表，第4个参数表示可选的掩码函数//第5个参数表示输出直方图，第6个参数表示直方图的维数，第7个参数为每一维直方图数组的大小，第8个参数为每一维直方图bin的边界                    calcHist(&roi, 1, 0, maskroi, hist, 1, &hsize, &phranges);//将roi的0通道计算直方图并通过mask放入hist中，hsize为每一维直方图的大小                    normalize(hist, hist, 0, 255, CV_MINMAX);//将hist矩阵进行数组范围归一化，都归一化到0~255                                        trackWindow = selection;                    trackObject = 1;//只要鼠标选完区域松开后，且没有按键盘清0键'c'，则trackObject一直保持为1，因此该if函数只能执行一次，除非重新选择跟踪区域                    histimg = Scalar::all(0);//与按下'c'键是一样的，这里的all(0)表示的是标量全部清0                    int binW = histimg.cols / hsize;  //histing是一个200*300的矩阵，hsize应该是每一个bin的宽度，也就是histing矩阵能分出几个bin出来                    Mat buf(1, hsize, CV_8UC3);//定义一个缓冲单bin矩阵                    for( int i = 0; i < hsize; i++ )//saturate_case函数为从一个初始类型准确变换到另一个初始类型                        buf.at<Vec3b>(i) = Vec3b(saturate_cast<uchar>(i*180./hsize), 255, 255);//Vec3b为3个char值的向量                    cvtColor(buf, buf, CV_HSV2BGR);//将hsv又转换成bgr                                            for( int i = 0; i < hsize; i++ )                    {                        int val = saturate_cast<int>(hist.at<float>(i)*histimg.rows/255);//at函数为返回一个指定数组元素的参考值                        rectangle( histimg, Point(i*binW,histimg.rows),    //在一幅输入图像上画一个简单抽的矩形，指定左上角和右下角，并定义颜色，大小，线型等                                   Point((i+1)*binW,histimg.rows - val),                                   Scalar(buf.at<Vec3b>(i)), -1, 8 );                    }                }                calcBackProject(&hue, 1, 0, hist, backproj, &phranges);//计算直方图的反向投影，计算hue图像0通道直方图hist的反向投影，并让入backproj中                backproj &= mask;                //opencv2.0以后的版本函数命名前没有cv两字了，并且如果函数名是由2个意思的单词片段组成的话，且前面那个片段不够成单词，则第一个字母要//大写，比如Camshift，如果第一个字母是个单词，则小写，比如meanShift，但是第二个字母一定要大写                RotatedRect trackBox = CamShift(backproj, trackWindow,               //trackWindow为鼠标选择的区域，TermCriteria为确定迭代终止的准则                                    TermCriteria( CV_TERMCRIT_EPS | CV_TERMCRIT_ITER, 10, 1 ));//CV_TERMCRIT_EPS是通过forest_accuracy,CV_TERMCRIT_ITER                if( trackWindow.area() <= 1 )                                                  //是通过max_num_of_trees_in_the_forest                  {                    int cols = backproj.cols, rows = backproj.rows, r = (MIN(cols, rows) + 5)/6;                    trackWindow = Rect(trackWindow.x - r, trackWindow.y - r,                                       trackWindow.x + r, trackWindow.y + r) &                                  Rect(0, 0, cols, rows);//Rect函数为矩阵的偏移和大小，即第一二个参数为矩阵的左上角点坐标，第三四个参数为矩阵的宽和高                }                if( backprojMode )                    cvtColor( backproj, image, CV_GRAY2BGR );//因此投影模式下显示的也是rgb图？                ellipse( image, trackBox, Scalar(0,0,255), 3, CV_AA );//跟踪的时候以椭圆为代表目标            }        }        //后面的代码是不管pause为真还是为假都要执行的        else if( trackObject < 0 )//同时也是在按了暂停字母以后            paused = false;        if( selectObject && selection.width > 0 && selection.height > 0 )        {            Mat roi(image, selection);            bitwise_not(roi, roi);//bitwise_not为将每一个bit位取反        }        imshow( "CamShift Demo", image );        imshow( "Histogram", histimg );        char c = (char)waitKey(10);        if( c == 27 )              //退出键            break;        switch(c)        {        case 'b':             //反向投影模型交替            backprojMode = !backprojMode;            break;        case 'c':            //清零跟踪目标对象            trackObject = 0;            histimg = Scalar::all(0);            break;        case 'h':          //显示直方图交替            showHist = !showHist;            if( !showHist )                destroyWindow( "Histogram" );            else                namedWindow( "Histogram", 1 );            break;        case 'p':       //暂停跟踪交替            paused = !paused;            break;        default:            ;        }    }    return 0;}

运行截图如下(由于摄像头中一般会拍到人，影响不好，所以含目标物体的截图就不贴上来了)：

另外，由于Camshift主要是利用到了meanShift算法，在目标跟踪领域应用比较广泛，而meanShift也可以用于目标跟踪，只是自适用性没CamShift好，但也可以用。首先看看meanShift算法的声明：

int meanShift(InputArray probImage, Rect& window, TermCriteria criteria)

与CamShift函数不同的一点是，它返回的不是一个矩形框，而是一个int型变量。该int型变量应该是代表找到目标物体的个数。特别需要注意的是参数window，它不仅是目标物体初始化的位置，还是实时跟踪目标后的位置，所以其实也是一个返回值。由于meanShift好像主要不是用于目标跟踪上，很多应用是在图像分割上。但是这里还是将CamShift算法例子稍微改一下，就成了meanShift算法了。主要是用window代替CamShift中的trackWindow.

其代码注释如下：

#include "StdAfx.h"#include "opencv2/video/tracking.hpp"#include "opencv2/imgproc/imgproc.hpp"#include "opencv2/highgui/highgui.hpp"#include <iostream>#include <ctype.h>using namespace cv;using namespace std;Mat image;bool backprojMode = false; //表示是否要进入反向投影模式，ture表示准备进入反向投影模式bool selectObject = false;//代表是否在选要跟踪的初始目标，true表示正在用鼠标选择int trackObject = 0; //代表跟踪目标数目bool showHist = true;//是否显示直方图Point origin;//用于保存鼠标选择第一次单击时点的位置Rect selection;//用于保存鼠标选择的矩形框int vmin = 10, vmax = 256, smin = 30;void onMouse( int event, int x, int y, int, void* ){    if( selectObject )//只有当鼠标左键按下去时才有效，然后通过if里面代码就可以确定所选择的矩形区域selection了    {        selection.x = MIN(x, origin.x);//矩形左上角顶点坐标        selection.y = MIN(y, origin.y);        selection.width = std::abs(x - origin.x);//矩形宽        selection.height = std::abs(y - origin.y);//矩形高        selection &= Rect(0, 0, image.cols, image.rows);//用于确保所选的矩形区域在图片范围内    }    switch( event )    {    case CV_EVENT_LBUTTONDOWN:        origin = Point(x,y);        selection = Rect(x,y,0,0);//鼠标刚按下去时初始化了一个矩形区域        selectObject = true;        break;    case CV_EVENT_LBUTTONUP:        selectObject = false;        if( selection.width > 0 && selection.height > 0 )            trackObject = -1;        break;    }}void help(){    cout << "\nThis is a demo that shows mean-shift based tracking\n"        "You select a color objects such as your face and it tracks it.\n"        "This reads from video camera (0 by default, or the camera number the user enters\n"        "Usage: \n"        "    ./camshiftdemo [camera number]\n";    cout << "\n\nHot keys: \n"        "\tESC - quit the program\n"        "\tc - stop the tracking\n"        "\tb - switch to/from backprojection view\n"        "\th - show/hide object histogram\n"        "\tp - pause video\n"        "To initialize tracking, select the object with mouse\n";}const char* keys = {    "{1|  | 0 | camera number}"};int main( int argc, const char** argv ){    help();    VideoCapture cap; //定义一个摄像头捕捉的类对象    Rect trackWindow;    RotatedRect trackBox;//定义一个旋转的矩阵类对象    int hsize = 16;    float hranges[] = {0,180};//hranges在后面的计算直方图函数中要用到    const float* phranges = hranges;    CommandLineParser parser(argc, argv, keys);//命令解析器函数    int camNum = parser.get<int>("1");         cap.open(camNum);//直接调用成员函数打开摄像头    if( !cap.isOpened() )    {        help();        cout << "***Could not initialize capturing...***\n";        cout << "Current parameter's value: \n";        parser.printParams();        return -1;    }    namedWindow( "Histogram", 0 );    namedWindow( "CamShift Demo", 0 );    setMouseCallback( "CamShift Demo", onMouse, 0 );//消息响应机制    createTrackbar( "Vmin", "CamShift Demo", &vmin, 256, 0 );//createTrackbar函数的功能是在对应的窗口创建滑动条，滑动条Vmin,vmin表示滑动条的值，最大为256    createTrackbar( "Vmax", "CamShift Demo", &vmax, 256, 0 );//最后一个参数为0代表没有调用滑动拖动的响应函数    createTrackbar( "Smin", "CamShift Demo", &smin, 256, 0 );//vmin,vmax,smin初始值分别为10,256,30    Mat frame, hsv, hue, mask, hist, histimg = Mat::zeros(200, 320, CV_8UC3), backproj;    bool paused = false;    for(;;)    {        if( !paused )//没有暂停        {            cap >> frame;//从摄像头抓取一帧图像并输出到frame中            if( frame.empty() )                break;        }        frame.copyTo(image);        if( !paused )//没有按暂停键        {            cvtColor(image, hsv, CV_BGR2HSV);//将rgb摄像头帧转化成hsv空间的            if( trackObject )//trackObject初始化为0,或者按完键盘的'c'键后也为0，当鼠标单击松开后为-1            {                int _vmin = vmin, _vmax = vmax;                //inRange函数的功能是检查输入数组每个元素大小是否在2个给定数值之间，可以有多通道,mask保存0通道的最小值，也就是h分量                //这里利用了hsv的3个通道，比较h,0~180,s,smin~256,v,min(vmin,vmax),max(vmin,vmax)。如果3个通道都在对应的范围内，则                //mask对应的那个点的值全为1(0xff)，否则为0(0x00).                inRange(hsv, Scalar(0, smin, MIN(_vmin,_vmax)),                    Scalar(180, 256, MAX(_vmin, _vmax)), mask);                int ch[] = {0, 0};                hue.create(hsv.size(), hsv.depth());//hue初始化为与hsv大小深度一样的矩阵，色调的度量是用角度表示的，红绿蓝之间相差120度，反色相差180度                mixChannels(&hsv, 1, &hue, 1, ch, 1);//将hsv第一个通道(也就是色调)的数复制到hue中，0索引数组                if( trackObject < 0 )//鼠标选择区域松开后，该函数内部又将其赋值1                {                    //此处的构造函数roi用的是Mat hue的矩阵头，且roi的数据指针指向hue，即共用相同的数据，select为其感兴趣的区域                    Mat roi(hue, selection), maskroi(mask, selection);//mask保存的hsv的最小值                    //calcHist()函数第一个参数为输入矩阵序列，第2个参数表示输入的矩阵数目，第3个参数表示将被计算直方图维数通道的列表，第4个参数表示可选的掩码函数                    //第5个参数表示输出直方图，第6个参数表示直方图的维数，第7个参数为每一维直方图数组的大小，第8个参数为每一维直方图bin的边界                    calcHist(&roi, 1, 0, maskroi, hist, 1, &hsize, &phranges);//将roi的0通道计算直方图并通过mask放入hist中，hsize为每一维直方图的大小                    normalize(hist, hist, 0, 255, CV_MINMAX);//将hist矩阵进行数组范围归一化，都归一化到0~255                    trackWindow = selection;                    trackObject = 1;//只要鼠标选完区域松开后，且没有按键盘清0键'c'，则trackObject一直保持为1，因此该if函数只能执行一次，除非重新选择跟踪区域                    histimg = Scalar::all(0);//与按下'c'键是一样的，这里的all(0)表示的是标量全部清0                    int binW = histimg.cols / hsize;  //histing是一个200*300的矩阵，hsize应该是每一个bin的宽度，也就是histing矩阵能分出几个bin出来                    Mat buf(1, hsize, CV_8UC3);//定义一个缓冲单bin矩阵                    for( int i = 0; i < hsize; i++ )//saturate_case函数为从一个初始类型准确变换到另一个初始类型                        buf.at<Vec3b>(i) = Vec3b(saturate_cast<uchar>(i*180./hsize), 255, 255);//Vec3b为3个char值的向量                    cvtColor(buf, buf, CV_HSV2BGR);//将hsv又转换成bgr                    for( int i = 0; i < hsize; i++ )                    {                        int val = saturate_cast<int>(hist.at<float>(i)*histimg.rows/255);//at函数为返回一个指定数组元素的参考值                        rectangle( histimg, Point(i*binW,histimg.rows),    //在一幅输入图像上画一个简单抽的矩形，指定左上角和右下角，并定义颜色，大小，线型等                            Point((i+1)*binW,histimg.rows - val),                            Scalar(buf.at<Vec3b>(i)), -1, 8 );                    }                }                calcBackProject(&hue, 1, 0, hist, backproj, &phranges);//计算直方图的反向投影，计算hue图像0通道直方图hist的反向投影，并让入backproj中                backproj &= mask;                //opencv2.0以后的版本函数命名前没有cv两字了，并且如果函数名是由2个意思的单词片段组成的话，且前面那个片段不够成单词，则第一个字母要                //大写，比如Camshift，如果第一个字母是个单词，则小写，比如meanShift，但是第二个字母一定要大写                meanShift(backproj, trackWindow,               //trackWindow为鼠标选择的区域，TermCriteria为确定迭代终止的准则                    TermCriteria( CV_TERMCRIT_EPS | CV_TERMCRIT_ITER, 10, 1 ));//CV_TERMCRIT_EPS是通过forest_accuracy,CV_TERMCRIT_ITER                if( trackWindow.area() <= 1 )                                                  //是通过max_num_of_trees_in_the_forest                  {                    int cols = backproj.cols, rows = backproj.rows, r = (MIN(cols, rows) + 5)/6;                    trackWindow = Rect(trackWindow.x - r, trackWindow.y - r,                        trackWindow.x + r, trackWindow.y + r) &                        Rect(0, 0, cols, rows);//Rect函数为矩阵的偏移和大小，即第一二个参数为矩阵的左上角点坐标，第三四个参数为矩阵的宽和高                }                if( backprojMode )                    cvtColor( backproj, image, CV_GRAY2BGR );//因此投影模式下显示的也是rgb图？                //ellipse( image, trackBox, Scalar(0,0,255), 3, CV_AA );//跟踪的时候以椭圆为代表目标                rectangle(image,Point(trackWindow.x,trackWindow.y),Point(trackWindow.x+trackWindow.width,trackWindow.y+trackWindow.height),Scalar(0,0,255),-1,CV_AA);            }        }        //后面的代码是不管pause为真还是为假都要执行的        else if( trackObject < 0 )//同时也是在按了暂停字母以后            paused = false;        if( selectObject && selection.width > 0 && selection.height > 0 )        {            Mat roi(image, selection);            bitwise_not(roi, roi);//bitwise_not为将每一个bit位取反        }        imshow( "CamShift Demo", image );        imshow( "Histogram", histimg );        char c = (char)waitKey(10);        if( c == 27 )              //退出键            break;        switch(c)        {        case 'b':             //反向投影模型交替            backprojMode = !backprojMode;            break;        case 'c':            //清零跟踪目标对象            trackObject = 0;            histimg = Scalar::all(0);            break;        case 'h':          //显示直方图交替            showHist = !showHist;            if( !showHist )                destroyWindow( "Histogram" );            else                namedWindow( "Histogram", 1 );            break;        case 'p':       //暂停跟踪交替            paused = !paused;            break;        default:            ;        }    }    return 0;}

本文感性上认识了怎样使用meanShift()和CamShift()函数，跟进一步的实现原理需要看其相关的论文和代码才能理解。但是从本例中调用的其它函数也可以学到很多opencv函数，效果还是很不错的。

作者：tornadomeet 出处：http://www.cnblogs.com/tornadomeet 欢迎转载或分享，但请务必声明文章出处。（新浪微博：tornadomeet,欢迎交流！）

0 0