OpenCV第一课

来源：互联网发布：ug编程自学能学会吗编辑：程序博客网时间：2024/06/05 04:33

为了七月份的RoboMasters比赛，作为视觉组的队长，老师给我们分配的任务是机器人的智能自动摄像头识别，经过在论坛上的资料收集以及官方的资料，最终决定用OpenCV加vs2013调制程序，最终结果代码会移植到Linux上。

下面介绍一下opencv（这是百度百科上的内容）：

OpenCV的全称是：Open Source Computer Vision Library。OpenCV是一个基于BSD许可（开源）发行的跨平台计算机视觉库，可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。

OpenCV用C++语言编写，它的主要接口也是C++语言，但是依然保留了大量的C语言接口。该库也有大量的Python, Java and MATLAB/OCTAVE (版本2.5)的接口。这些语言的API接口函数可以通过在线文档获得。如今也提供对于C#,Ch, Ruby的支持。

所有新的开发和算法都是用C++接口。一个使用CUDA的GPU接口也于2010年9月开始实现。

他的应用领域：

1、人机互动

2、物体识别

3、图像分割

4、人脸识别

5、动作识别

6、运动跟踪

7、机器人

8、运动分析

9、机器视觉

10、结构分析

11、汽车安全驾驶

下面是第一节课学习的内容（ps：环境的搭建网上有很多版本，这里就不写了！）：

先上代码：

#include <highgui.h>
using namespace std;
int main(int argc , char *argv[])
{
IplImage *img;
img = cvLoadImage("h.jpg");
cvNamedWindow("text");
cvShowImage("text", img);
cvWaitKey(0);
cvReleaseImage(&img);
cvDestroyWindow("text");
return 0;
}

代码的目的是在当前程序文件下显示一副jpg文件，下面逐语句解答一下：

首先第一行，头文件highgui.h它是OpenCV中编译好的一个头文件，设计意图是为用户提供简单易用的图形用户接口。

第二行是c++的命名空间，百度；

第三行是主函数的入口，但是很多学过c++的人都无法理解main函数里的参数的作用是啥，下面解答一下：

argc命令行总的参数的个数,即argv中元素的格式。
* argv[ ]: 字符串数组,用来存放指向你的字符串参数的指针数组,每一个元素指向一个参数
argv[0]:指向程序的全路径名
argv[1]:指向在DOS命令行中执行程序名后的第一个字符串。
argv[2]:指向第二个字符串。

第五行

IplImage是OpenCV中图像的结构体，下面是百度的讲解：
typedef struct _IplImage
{
int nSize; /* IplImage大小 */
int ID; /* 版本 (=0)*/
int nChannels; /* 大多数OPENCV函数支持1,2,3 或 4 个通道 */
int alphaChannel; /* 被OpenCV忽略 */
int depth; /* 像素的位深度，主要有以下支持格式： IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16U,IPL_DEPTH_16S, IPL_DEPTH_32S,
IPL_DEPTH_32F 和IPL_DEPTH_64F */
char colorModel[4]; /* 被OpenCV忽略 */
char channelSeq[4]; /* 同上 */
int dataOrder; /* 0 - 交叉存取颜色通道, 1 - 分开的颜色通道.
只有cvCreateImage可以创建交叉存取图像 */
int origin; /*图像原点位置： 0表示顶-左结构,1表示底-左结构 */
int align; /* 图像行排列方式 (4 or 8)，在 OpenCV 被忽略，使用 widthStep 代替 */
int width; /* 图像宽像素数 */
int height; /* 图像高像素数*/
struct _IplROI *roi; /* 图像感兴趣区域，当该值非空时，
只对该区域进行处理 */
struct _IplImage *maskROI; /* 在 OpenCV中必须为NULL */
void *imageId; /* 同上*/
struct _IplTileInfo *tileInfo; /*同上*/
int imageSize; /* 图像数据大小(在交叉存取格式下ImageSize=image->height*image->widthStep），单位字节*/
char *imageData; /* 指向排列的图像数据 */
int widthStep; /* 排列的图像行大小，以字节为单位 */
int BorderMode[4]; /* 边际结束模式, 在 OpenCV 被忽略*/
int BorderConst[4]; /* 同上 */
char *imageDataOrigin; /* 指针指向一个不同的图像数据结构（不是必须排列的），是为了纠正图像内存分配准备的 */
} IplImage;
IplImage结构体是整个OpenCV函数库的基础，在定义该结构变量时需要用到函数cvCreatImage，变量定义方法如下：
IplImage* src="/cvCreateImage"(cvSize(400,300), IPL_DEPTH_8U,3);

上句定义了一个IplImage指针变量src，图像的大小是400×300，图像颜色深度8位，3通道图像。

第六行：cvLoadImage（）函数：
函数原型：IplImage* cvLoadImage( const char* filename, int flags=CV_LOAD_IMAGE_COLOR );
filename ：要被读入的文件的文件名(包括后缀)；
指定的颜色可以将输入的图片转为3通道(CV_LOAD_IMAGE_COLOR), 单通道 (CV_LOAD_IMAGE_GRAYSCALE), 或者保持不变(CV_LOAD_IMAGE_ANYCOLOR)。
深度指定输入的图像是否转为每个颜色通道每象素8位，（OpenCV的早期版本一样），或者同输入的图像一样保持不变。
选中CV_LOAD_IMAGE_ANYDEPTH，则输入图像格式可以为8位无符号，16位无符号，32位有符号或者32位浮点型。
如果输入有冲突的标志，将采用较小的数字值。比如CV_LOAD_IMAGE_COLOR | CV_LOAD_IMAGE_ANYCOLOR 将载入3通道图。CV_LOAD_IMAGE_ANYCOLOR和CV_LOAD_IMAGE_UNCHANGED是等值的。但是，CV_LOAD_IMAGE_ANYCOLOR有着可以和CV_LOAD_IMAGE_ANYDEPTH同时使用的优点，所以CV_LOAD_IMAGE_UNCHANGED不再使用了。
如果想要载入最真实的图像，选择CV_LOAD_IMAGE_ANYDEPTH | CV_LOAD_IMAGE_ANYCOLOR。
函数cvLoadImage从指定文件读入图像，返回读入图像的指针。目前支持如下文件格式：
Windows位图文件- BMP, DIB；
JPEG文件 - JPEG, JPG, JPE；
便携式网络图片- PNG；
便携式图像格式- PBM，PGM，PPM；
Sun rasters - SR，RAS；
TIFF文件 - TIFF，TIF;
JPEG 2000 图片- jp2,OpenEXR HDR 图片 - EXR;
flags ：指定读入图像的颜色和深度：

第七行：cvNamedWindow函数：
该函数的作用是申请一个窗口。
int cvNamedWindow( const char* name, int flags=CV_WINDOW_AUTOSIZE );
name 窗口的名字，它被用来区分不同的窗口，并被显示为窗口标题。
flags 窗口属性标志。可以选择CV_WINDOW_AUTOSIZE(1)和0两种值。CV_WINDOW_AUTOSIZE这个标志被设置后，如果用户不能手动改变窗口大小，窗口大小会自动调整以适合被显示图像（参考cvShowImage）。0表示用户可以手动调节窗口大小，且显示的图像尺寸随之变化。
函数cvNamedWindow创建一个可以放置图像和trackbar的窗口。被创建的窗口可以通过它们的名字被引用。如果已经存在这个名字的窗口，这个函数将不做任何事情。

第八行：cvShowImage（）函数
用来在在指定窗口中显示图像。
void cvShowImage( const char* name, const CvArr* image );
name 窗口的名字。
image 被显示的图像。
函数cvShowImage 在指定窗口中显示图像。如果窗口创建的时候被设定标志CV_WINDOW_AUTOSIZE，那么图像将以原始尺寸显示；否则，图像将被伸缩以适合窗口大小[1] 。

第九行：cvWaitKey（）函数
cvWaitKey()函数的功能是不断刷新图像，频率时间为delay，单位为ms。
返回值为当前键盘按键值。
所以显示图像时，如果需要在cvShowImage("xxxx.bmp",image)后加上while（cvWaitKey(n)==key）为大于等于0的数即可，那么程序将会停在显示函数处，不运行其他代码;直到键盘值为key的响应之后。
delay>0时，延迟"delay"ms，在显示视频时这个函数是有用的，用于设置在显示完一帧图像后程序等待"delay"ms再显示下一帧视频；如果使用cvWaitKey(0)则只会显示第一帧视频。
当delay<=0的时，如果没有键盘触发，则一直等待，否则返回值为键盘按下的码字；
返回值：返回值为int型，函数的参数为int型.如果delay>0,那么超过指定时间则返回-1；如果delay<=0时，函数cvWaitKey无限制的等待按键事件，所以显示图像时，需要在cvShowImage("**.bmp",image)后加上cvWaitKey(n)——n为小于等于0的数即可，程序停在显示函数处，不运行其他代码;否则，图像无法正常显示。如果程序想响应某个按键，可利用if(cvWaitKey(1)==Keyvalue)；
经常程序里面出现if( cvWaitKey(10) >= 0 ) 。首先cvWaitKey(10)代表在当前状态下等待十毫秒，整句的意思就是如果在十毫秒内按下任意键就进入if子句中。举个例子：如果出现在摄像头调用中，10就代表摄像头画面刷新间隔，按下任意键则可以进入if子句（一般是用break跳出循环，结束调用）。

第十行：cvReleaseImage（）函数
释放图像占用的内存，不过另一种说法是：
cvReleaseImage函数只是将IplImage*型的变量值赋为NULL，而这个变量本身还是存在的并且在内存中的存储位置不变。
下面是文章出处:http://blog.sina.com.cn/s/blog_a2f5b8790101b5js.html

第十一行：cvDestroyWindow（）函数
用来销毁一个窗口。
void cvDestroyWindow( const char* name );

以后继续加油！！路漫漫其修远兮，吾将上下而求索！！

0 0

OpenCV第一课

第十一行：cvDestroyWindow（）函数用来销毁一个窗口。void cvDestroyWindow( const char* name );

第十一行：cvDestroyWindow（）函数
用来销毁一个窗口。
void cvDestroyWindow( const char* name );