OpenCV第一课

来源:互联网 发布:ug编程自学能学会吗 编辑:程序博客网 时间:2024/06/05 04:33

为了七月份的RoboMasters比赛,作为视觉组的队长,老师给我们分配的任务是机器人的智能自动摄像头识别,经过在论坛上的资料收集以及官方的资料,最终决定用OpenCV加vs2013调制程序,最终结果代码会移植到Linux上。

下面介绍一下opencv(这是百度百科上的内容):

OpenCV的全称是:Open Source Computer Vision Library。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。
OpenCV用C++语言编写,它的主要接口也是C++语言,但是依然保留了大量的C语言接口。该库也有大量的Python, Java and MATLAB/OCTAVE (版本2.5)的接口。这些语言的API接口函数可以通过在线文档获得。如今也提供对于C#,Ch, Ruby的支持。
所有新的开发和算法都是用C++接口。一个使用CUDA的GPU接口也于2010年9月开始实现。
他的应用领域:

1、人机互动
2、物体识别
3、图像分割
4、人脸识别
5、动作识别
6、运动跟踪
7、机器人
8、运动分析
9、机器视觉
10、结构分析
11、汽车安全驾驶

下面是第一节课学习的内容(ps:环境的搭建网上有很多版本,这里就不写了!):
先上代码:

#include <highgui.h>
using namespace std;
int main(int argc , char *argv[])
{
IplImage *img;
img = cvLoadImage("h.jpg");
cvNamedWindow("text");
cvShowImage("text", img);
cvWaitKey(0);
        cvReleaseImage(&img);
cvDestroyWindow("text");
return 0;
}

代码的目的是在当前程序文件下显示一副jpg文件,下面逐语句解答一下:

首先第一行,头文件highgui.h它是OpenCV中编译好的一个头文件,设计意图是为用户提供简单易用的图形用户接口。

第二行是c++的命名空间,百度;

第三行是主函数的入口,但是很多学过c++的人都无法理解main函数里的参数的作用是啥,下面解答一下:

argc命令行总的参数的个数,即argv中元素的格式。
* argv[ ]: 字符串数组,用来存放指向你的字符串参数的指针数组,每一个元素指向一个参数
argv[0]:指向程序的全路径名
argv[1]:指向在DOS命令行中执行程序名后的第一个字符串。
argv[2]:指向第二个字符串。

第五行

IplImage是OpenCV中图像的结构体,下面是百度的讲解:
typedef struct _IplImage
{
int nSize; /* IplImage大小 */
int ID; /* 版本 (=0)*/
int nChannels; /* 大多数OPENCV函数支持1,2,3 或 4 个通道 */
int alphaChannel; /* 被OpenCV忽略 */
int depth; /* 像素的位深度,主要有以下支持格式: IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16U,IPL_DEPTH_16S, IPL_DEPTH_32S,
IPL_DEPTH_32F 和IPL_DEPTH_64F */
char colorModel[4]; /* 被OpenCV忽略 */
char channelSeq[4]; /* 同上 */
int dataOrder; /* 0 - 交叉存取颜色通道, 1 - 分开的颜色通道.
只有cvCreateImage可以创建交叉存取图像 */
int origin; /*图像原点位置: 0表示顶-左结构,1表示底-左结构 */
int align; /* 图像行排列方式 (4 or 8),在 OpenCV 被忽略,使用 widthStep 代替 */
int width; /* 图像宽像素数 */
int height; /* 图像高像素数*/
struct _IplROI *roi; /* 图像感兴趣区域,当该值非空时,
只对该区域进行处理 */
struct _IplImage *maskROI; /* 在 OpenCV中必须为NULL */
void *imageId; /* 同上*/
struct _IplTileInfo *tileInfo; /*同上*/
int imageSize; /* 图像数据大小(在交叉存取格式下ImageSize=image->height*image->widthStep),单位字节*/
char *imageData; /* 指向排列的图像数据 */
int widthStep; /* 排列的图像行大小,以字节为单位 */
int BorderMode[4]; /* 边际结束模式, 在 OpenCV 被忽略*/
int BorderConst[4]; /* 同上 */
char *imageDataOrigin; /* 指针指向一个不同的图像数据结构(不是必须排列的),是为了纠正图像内存分配准备的 */
} IplImage;
IplImage结构体是整个OpenCV函数库的基础,在定义该结构变量时需要用到函数cvCreatImage,变量定义方法如下:
IplImage* src="/cvCreateImage"(cvSize(400,300), IPL_DEPTH_8U,3);

上句定义了一个IplImage指针变量src,图像的大小是400×300,图像颜色深度8位,3通道图像。

第六行:cvLoadImage()函数:
函数原型:IplImage* cvLoadImage( const char* filename, int flags=CV_LOAD_IMAGE_COLOR );
filename :要被读入的文件的文件名(包括后缀);
指定的颜色可以将输入的图片转为3通道(CV_LOAD_IMAGE_COLOR), 单通道 (CV_LOAD_IMAGE_GRAYSCALE), 或者保持不变(CV_LOAD_IMAGE_ANYCOLOR)。
深度指定输入的图像是否转为每个颜色通道每象素8位,(OpenCV的早期版本一样),或者同输入的图像一样保持不变。
选中CV_LOAD_IMAGE_ANYDEPTH,则输入图像格式可以为8位无符号,16位无符号,32位有符号或者32位浮点型
如果输入有冲突的标志,将采用较小的数字值。比如CV_LOAD_IMAGE_COLOR | CV_LOAD_IMAGE_ANYCOLOR 将载入3通道图。CV_LOAD_IMAGE_ANYCOLOR和CV_LOAD_IMAGE_UNCHANGED是等值的。但是,CV_LOAD_IMAGE_ANYCOLOR有着可以和CV_LOAD_IMAGE_ANYDEPTH同时使用的优点,所以CV_LOAD_IMAGE_UNCHANGED不再使用了。
如果想要载入最真实的图像,选择CV_LOAD_IMAGE_ANYDEPTH | CV_LOAD_IMAGE_ANYCOLOR。
函数cvLoadImage从指定文件读入图像,返回读入图像的指针。目前支持如下文件格式:
Windows位图文件- BMP, DIB;
JPEG文件 - JPEG, JPG, JPE;
便携式网络图片- PNG;
便携式图像格式- PBM,PGM,PPM;
Sun rasters - SR,RAS;
TIFF文件 - TIFF,TIF;
JPEG 2000 图片- jp2,OpenEXR HDR 图片 - EXR;
flags :指定读入图像的颜色和深度:

第七行:cvNamedWindow函数:
该函数的作用是申请一个窗口。
int cvNamedWindow( const char* name, int flags=CV_WINDOW_AUTOSIZE );
name 窗口的名字,它被用来区分不同的窗口,并被显示为窗口标题。
flags 窗口属性标志。可以选择CV_WINDOW_AUTOSIZE(1)和0两种值。CV_WINDOW_AUTOSIZE这个标志被设置后, 如果用户不能手动改变窗口大小,窗口大小会自动调整以适合被显示图像(参考cvShowImage)。0表示用户可以手动调节窗口大小,且显示的图像尺寸随之变化。
函数cvNamedWindow创建一个可以放置图像和trackbar的窗口。被创建的窗口可以通过它们的名字被引用。 如果已经存在这个名字的窗口,这个函数将不做任何事情。

第八行:cvShowImage()函数
用来在在指定窗口中显示图像。
void cvShowImage( const char* name, const CvArr* image );
name 窗口的名字。
image 被显示的图像。
函数cvShowImage 在指定窗口中显示图像。如果窗口创建的时候被设定标志CV_WINDOW_AUTOSIZE,那么图像将以原始尺寸显示;否则,图像将被伸缩以适合窗口大小[1]  。

第九行:cvWaitKey()函数
cvWaitKey()函数的功能是不断刷新图像,频率时间为delay,单位为ms。
返回值为当前键盘按键值。
所以显示图像时,如果需要在cvShowImage("xxxx.bmp",image)后加上while(cvWaitKey(n)==key)为大于等于0的数即可,那么程序将会停在显示函数处,不运行其他代码;直到键盘值为key的响应之后。
delay>0时,延迟"delay"ms,在显示视频时这个函数是有用的,用于设置在显示完一帧图像后程序等待"delay"ms再显示下一帧视频;如果使用cvWaitKey(0)则只会显示第一帧视频。
当delay<=0的时,如果没有键盘触发,则一直等待,否则返回值为键盘按下的码字;
返回值:返回值为int型,函数的参数为int型.如果delay>0,那么超过指定时间则返回-1;如果delay<=0时,函数cvWaitKey无限制的等待按键事件,所以显示图像时,需要在cvShowImage("**.bmp",image)后加上cvWaitKey(n)——n为小于等于0的数即可,程序停在显示函数处,不运行其他代码;否则,图像无法正常显示。如果程序想响应某个按键,可利用if(cvWaitKey(1)==Keyvalue);
经常程序里面出现if( cvWaitKey(10) >= 0 ) 。首先cvWaitKey(10)代表在当前状态下等待十毫秒,整句的意思就是如果在十毫秒内按下任意键就进入if子句中。举个例子:如果出现在摄像头调用中,10就代表摄像头画面刷新间隔,按下任意键则可以进入if子句(一般是用break跳出循环,结束调用)。

          第十行:cvReleaseImage()函数
释放图像占用的内存,不过另一种说法是:
cvReleaseImage函数只是将IplImage*型的变量值赋为NULL,而这个变量本身还是存在的并且在内存中的存储位置不变。
下面是文章出处:http://blog.sina.com.cn/s/blog_a2f5b8790101b5js.html

第十一行:cvDestroyWindow()函数
用来销毁一个窗口。
void cvDestroyWindow( const char* name );



以后继续加油!!路漫漫其修远兮,吾将上下而求索!!










0 0