机器学习_2之目标跟踪Camshift算法

来源:互联网 发布:自动切换窗口软件 编辑:程序博客网 时间:2024/06/05 23:45

Camshift它是MeanShift算法的改进,称为连续自适应的MeanShift算法,CamShift算法的全称是"Continuously Adaptive Mean-SHIFT",它的基本思想是视频图像的所有帧作MeanShift运算,并将上一帧的结果(即Search Window的中心和大小)作为下一帧MeanShift算法的Search Window的初始值,如此迭代下去。

关于camshift的原理在网上也找了一些,在http://blog.csdn.net/leixiaohua1020/article/details/12236091中介绍的比较有条理,代码也运行通过了。

也尝试运行了一些其他代码,比如http://blog.csdn.net/Sunshine_in_Moon/article/details/45154639中的,文中代码解释的比较详细易懂,但是前两个代码是完全一样的,后两个代码也是完全一样的,而前两者与后两者的不同之处是:前两者第181行代码在后两者中注释掉了,后两者有添加了182行代码,这就是文中提到的meanshift和camshift的区别之处吧。源代码是通过直接调用摄像头的,而我小改了一下,可以调用已有视频,更改部分如下:


整个代码如下:

//#include "StdAfx.h"  #include <opencv2/core/core.hpp>#include "opencv2/video/tracking.hpp"  #include "opencv2/imgproc/imgproc.hpp"  #include "opencv2/highgui/highgui.hpp"  #include <iostream>  #include <ctype.h>  using namespace cv;using namespace std;Mat image;bool backprojMode = false; //表示是否要进入反向投影模式,ture表示准备进入反向投影模式  bool selectObject = false;//代表是否在选要跟踪的初始目标,true表示正在用鼠标选择  int trackObject = 0; //代表跟踪目标数目  bool showHist = true;//是否显示直方图  Point origin;//用于保存鼠标选择第一次单击时点的位置  Rect selection;//用于保存鼠标选择的矩形框  int vmin = 10, vmax = 256, smin = 30;void onMouse(int event, int x, int y, int, void*){if (selectObject)//只有当鼠标左键按下去时才有效,然后通过if里面代码就可以确定所选择的矩形区域selection了  {selection.x = MIN(x, origin.x);//矩形左上角顶点坐标  selection.y = MIN(y, origin.y);selection.width = std::abs(x - origin.x);//矩形宽  selection.height = std::abs(y - origin.y);//矩形高  selection &= Rect(0, 0, image.cols, image.rows);//用于确保所选的矩形区域在图片范围内  }switch (event){case CV_EVENT_LBUTTONDOWN:origin = Point(x, y);selection = Rect(x, y, 0, 0);//鼠标刚按下去时初始化了一个矩形区域  selectObject = true;break;case CV_EVENT_LBUTTONUP:selectObject = false;if (selection.width > 0 && selection.height > 0)trackObject = -1;break;}}void help(){cout << "\nThis is a demo that shows mean-shift based tracking\n""You select a color objects such as your face and it tracks it.\n""This reads from video camera (0 by default, or the camera number the user enters\n""Usage: \n""    ./camshiftdemo [camera number]\n";cout << "\n\nHot keys: \n""\tESC - quit the program\n""\tc - stop the tracking\n""\tb - switch to/from backprojection view\n""\th - show/hide object histogram\n""\tp - pause video\n""To initialize tracking, select the object with mouse\n";}const char* keys ={"{1|  | 0 | camera number}"};int main(int argc, const char** argv){help();VideoCapture cap; //定义一个摄像头捕捉的类对象 Rect trackWindow;RotatedRect trackBox;//定义一个旋转的矩阵类对象  int hsize = 16;float hranges[] = { 0,180 };//hranges在后面的计算直方图函数中要用到  const float* phranges = hranges;CommandLineParser parser(argc, argv, keys);//命令解析器函数  //int camNum = parser.get<int>("1");//cap.open(camNum);//直接调用成员函数打开摄像头 //86-93行为读取已有视频代码,替换84-85行直接调用摄像头的代码cout << "Please input the name of the video file " << endl;char* imp;imp = new char[20];cin >> imp;if (imp != "")cap.open(imp);//read a video fileelse cap.open(0);//read the default video filecap.open(imp);if (!cap.isOpened()){help();cout << "***Could not initialize capturing...***\n";cout << "Current parameter's value: \n"<< imp;//parser.printParams();return -1;}namedWindow("Histogram", 0);namedWindow("CamShift Demo", 0);setMouseCallback("CamShift Demo", onMouse, 0);//消息响应机制  createTrackbar("Vmin", "CamShift Demo", &vmin, 256, 0);//createTrackbar函数的功能是在对应的窗口创建滑动条,滑动条Vmin,vmin表示滑动条的值,最大为256  createTrackbar("Vmax", "CamShift Demo", &vmax, 256, 0);//最后一个参数为0代表没有调用滑动拖动的响应函数  createTrackbar("Smin", "CamShift Demo", &smin, 256, 0);//vmin,vmax,smin初始值分别为10,256,30  Mat frame, hsv, hue, mask, hist, histimg = Mat::zeros(200, 320, CV_8UC3), backproj;bool paused = false;for (;;){if (!paused)//没有暂停  {cap >> frame;//从摄像头抓取一帧图像并输出到frame中  if (frame.empty())break;}frame.copyTo(image);if (!paused)//没有按暂停键  {cvtColor(image, hsv, CV_BGR2HSV);//将rgb摄像头帧转化成hsv空间的  if (trackObject)//trackObject初始化为0,或者按完键盘的'c'键后也为0,当鼠标单击松开后为-1  {int _vmin = vmin, _vmax = vmax;//inRange函数的功能是检查输入数组每个元素大小是否在2个给定数值之间,可以有多通道,mask保存0通道的最小值,也就是h分量  //这里利用了hsv的3个通道,比较h,0~180,s,smin~256,v,min(vmin,vmax),max(vmin,vmax)。如果3个通道都在对应的范围内,则  //mask对应的那个点的值全为1(0xff),否则为0(0x00).  inRange(hsv, Scalar(0, smin, MIN(_vmin, _vmax)),Scalar(180, 256, MAX(_vmin, _vmax)), mask);int ch[] = { 0, 0 };hue.create(hsv.size(), hsv.depth());//hue初始化为与hsv大小深度一样的矩阵,色调的度量是用角度表示的,红绿蓝之间相差120度,反色相差180度  mixChannels(&hsv, 1, &hue, 1, ch, 1);//将hsv第一个通道(也就是色调)的数复制到hue中,0索引数组  if (trackObject < 0)//鼠标选择区域松开后,该函数内部又将其赋值1  {//此处的构造函数roi用的是Mat hue的矩阵头,且roi的数据指针指向hue,即共用相同的数据,select为其感兴趣的区域  Mat roi(hue, selection), maskroi(mask, selection);//mask保存的hsv的最小值    //calcHist()函数第一个参数为输入矩阵序列,第2个参数表示输入的矩阵数目,第3个参数表示将被计算直方图维数通道的列表,第4个参数表示可选的掩码函数    //第5个参数表示输出直方图,第6个参数表示直方图的维数,第7个参数为每一维直方图数组的大小,第8个参数为每一维直方图bin的边界  calcHist(&roi, 1, 0, maskroi, hist, 1, &hsize, &phranges);//将roi的0通道计算直方图并通过mask放入hist中,hsize为每一维直方图的大小  normalize(hist, hist, 0, 255, CV_MINMAX);//将hist矩阵进行数组范围归一化,都归一化到0~255  trackWindow = selection;trackObject = 1;//只要鼠标选完区域松开后,且没有按键盘清0键'c',则trackObject一直保持为1,因此该if函数只能执行一次,除非重新选择跟踪区域  histimg = Scalar::all(0);//与按下'c'键是一样的,这里的all(0)表示的是标量全部清0  int binW = histimg.cols / hsize;  //histing是一个200*300的矩阵,hsize应该是每一个bin的宽度,也就是histing矩阵能分出几个bin出来  Mat buf(1, hsize, CV_8UC3);//定义一个缓冲单bin矩阵  for (int i = 0; i < hsize; i++)//saturate_case函数为从一个初始类型准确变换到另一个初始类型  buf.at<Vec3b>(i) = Vec3b(saturate_cast<uchar>(i*180. / hsize), 255, 255);//Vec3b为3个char值的向量  cvtColor(buf, buf, CV_HSV2BGR);//将hsv又转换成bgr  for (int i = 0; i < hsize; i++){int val = saturate_cast<int>(hist.at<float>(i)*histimg.rows / 255);//at函数为返回一个指定数组元素的参考值  rectangle(histimg, Point(i*binW, histimg.rows),    //在一幅输入图像上画一个简单抽的矩形,指定左上角和右下角,并定义颜色,大小,线型等  Point((i + 1)*binW, histimg.rows - val),Scalar(buf.at<Vec3b>(i)), -1, 8);}}calcBackProject(&hue, 1, 0, hist, backproj, &phranges);//计算直方图的反向投影,计算hue图像0通道直方图hist的反向投影,并让入backproj中  backproj &= mask;//opencv2.0以后的版本函数命名前没有cv两字了,并且如果函数名是由2个意思的单词片段组成的话,且前面那个片段不够成单词,则第一个字母要  //大写,比如Camshift,如果第一个字母是个单词,则小写,比如meanShift,但是第二个字母一定要大写  RotatedRect trackBox = CamShift(backproj, trackWindow,               //trackWindow为鼠标选择的区域,TermCriteria为确定迭代终止的准则  TermCriteria(CV_TERMCRIT_EPS | CV_TERMCRIT_ITER, 10, 1));//CV_TERMCRIT_EPS是通过forest_accuracy,CV_TERMCRIT_ITER  if (trackWindow.area() <= 1)                                                  //是通过max_num_of_trees_in_the_forest    {int cols = backproj.cols, rows = backproj.rows, r = (MIN(cols, rows) + 5) / 6;trackWindow = Rect(trackWindow.x - r, trackWindow.y - r,trackWindow.x + r, trackWindow.y + r) &Rect(0, 0, cols, rows);//Rect函数为矩阵的偏移和大小,即第一二个参数为矩阵的左上角点坐标,第三四个参数为矩阵的宽和高  }if (backprojMode)cvtColor(backproj, image, CV_GRAY2BGR);//因此投影模式下显示的也是rgb图?  ellipse(image, trackBox, Scalar(0, 0, 255), 3, CV_AA);//跟踪的时候以椭圆为代表目标  }}//后面的代码是不管pause为真还是为假都要执行的  else if (trackObject < 0)//同时也是在按了暂停字母以后  paused = false;if (selectObject && selection.width > 0 && selection.height > 0){Mat roi(image, selection);bitwise_not(roi, roi);//bitwise_not为将每一个bit位取反  }imshow("CamShift Demo", image);imshow("Histogram", histimg);char c = (char)waitKey(10);if (c == 27)              //退出键  break;switch (c){case 'b':             //反向投影模型交替  backprojMode = !backprojMode;break;case 'c':            //清零跟踪目标对象  trackObject = 0;histimg = Scalar::all(0);break;case 'h':          //显示直方图交替  showHist = !showHist;if (!showHist)destroyWindow("Histogram");elsenamedWindow("Histogram", 1);break;case 'p':       //暂停跟踪交替  paused = !paused;break;default:;}waitKey(1000);}return 0;}

我的跑代码的平台是win10 x64,visual studio 2017 x64,opencv 3.2 x64

camshift的python语言版http://docs.opencv.org/trunk/db/df8/tutorial_py_meanshift.html

camshift算是相对比较老的目标追踪算法了,在http://blog.csdn.net/linolzhang/article/details/55274883文中说的: 目标跟踪的算法有很多,像 Mean-Shift、光流法、粒子滤波、卡尔曼滤波等 传统方法,也有 TLD、CT、Struct、KCF 等掺杂了某些 “外力”,不那么纯粹的方法。但不管怎样,Tracking这项工作有着很大的研究群体,也不乏有人为之奋斗终生!

原创粉丝点击