[Learning OpenCV入门2]CMake生成源代码以及HighGUI部分内容

来源:互联网 发布:网络好声音第二季 编辑:程序博客网 时间:2024/06/05 15:58

本文主体及代码由摘录《OpenCV3编程入门》部分并加上自己理解内容整理而成如有纰漏欢迎指正


本文要点
1,了解imread,imwrite,imshow,Rect,Range,addWeighted,namedWindow,destoryWindow()以及destoryAllWindows()本部分还尚未编写成员函数
其中namedWindow为imshow服务,namedWindow创建一个**名称的窗口,imshow成员函数通过imshow("**",srcImage);即可以在**窗口中显示
2,了解OpenCV交互式性质成员函数的使用,比如说createTrackbar(),getTrackbarPos(),setMouseCallback()成员函数
3,报错,版本显示以及控制台程序
4,书写程序规范
本文第一个程序为自己书写,存在很多值得改进的地方,作为对比不再修改
下图为第二个程序--交互式程序(实现滑动条控制透明度改变,核心调用createTrackbar函数)的思路整理

这是该交互式程序书写规范总结

全书章节部分

该书中主体部分分为

第一部分快速上手OpenCV 

包括一些命名规则,命名空间,CMake以及OpenCV的安装
HighGUI部分初步
(包含Mat容器,imread,imshow,imwrite,namedWindow,createTrackbar函数,这一部分可以联系Matlab相关语句进行学习
既然是初步说明很多函数没有展示,还需要后续掌握学习

第二部分初探core组件

opencv_core模块:其中包含OpenCV基本数据结构、动态数据结构、绘图与数组操作的相关函数、辅助功能与系统函数、基本的算法函数等核心功能。 
包含两个章节OpenCV数据结构与基本绘图core组件进阶

OpenCV数据结构与基本绘图

在OpenCV数据结构与基本绘图当中介绍了基础图像容器Mat,常用数据结构(比如点,尺寸表示,矩形表示,颜色空间转换)以及函数(DrawEllipse等等,可以联系VC++中GDI的知识

core组件进阶

在core组件中主要有访问图像的像素(介绍了图像在内存当中的存储方式,访问等等),图像混合,分离颜色通道,调整对比度以及亮度,离散傅里叶变换,输入输出XML和YAML文件

第三部分 掌握imgproc组件

opencv_imgproc模块:包含图像处理函数,主要包含图像滤波、图像的几何变换、直方图、特征检测、目标跟踪等内容。  
该部分顾名思义就是图像处理为主的组件介绍

在图像处理方面:

包括线性滤波,非线性滤波,形态学处理,图像金字塔以及尺寸缩放,阈值化,漫水填充等内容。

在图像变换方面:

边缘检测,Hough变换,重映射,仿射变换,直方图的均衡化。

在图像轮廓与图像分割修复方面:

绘制轮廓,寻找土包,图像的矩运算,分水岭算法,图像修补。

在直方图与匹配方面:

直方图介绍,直方图对比,反向投影,模板匹配。

第四部分深入feature2d组件

该内容包含角点检测以及特征检测与匹配

在角点检测中包含几种角点检测:

Harris角点,Shi-Tomasi角点检测,亚像素角点检测

特征检测与匹配中:

SURF,FLANN,ORB


智能显示当前使用的OpenCV版本代码:
printf("当前OpenCV版本为OpenCV"CV_VERSION);


CMake生成OpenCV源代码工程的解决方案

通过CMake可以对源代码进行再次编译得到二进制文件

或者修改原版官方的OpenCV代码,编译后为自己所用,深入理解OpenCV

大致步骤:选择好源文件夹和目标文件夹后经过两次Configure和一次Generate即可以生成解决方案,通过打开sln即可以对里边的相关代码进行阅读以及编辑

具体参见OpenCV3编程入门相关部分。

BTW 目前编写OpenCV在VS2013下的方法是创建Win32控制台程序而不是Win32项目,空项目不空项目现在还没体会出来有什么不同

感受到唯一的不同是预编译头的区分,下面粘贴上预编译头的知识

所谓头文件预编译,就是把一个工程(Project)中使用的一些MFC标准头文件(如Windows.H、Afxwin.H)预先编译,以后该工程编译时,不再编译这部分头文件,仅仅使用预编译的结果。这样可以加快编译速度,节省时间
预编译头文件通过编译stdafx.cpp(stdafx=std+afx,记得在学习MFC的时候afx应该是一个全局函数,具体忘了还需要补充)生成,以工程名命名,由于预编译的头文件的后缀是“pch”,所以编译结果文件是projectname.pch。
编 译器通过一个头文件stdafx.h来使用预编译头文件。stdafx.h这个头文件名是可以在project的编译设置里指定的。编译器认为,所有在指 令#include "stdafx.h"前的代码都是预编译的,它跳过#include "stdafx. h"指令,使用projectname.pch编译这条指令之后的所有代码。
因此,所有的CPP实现文件第一条语句都是:#include "stdafx.h"。

HighGUI图形用户界面

PS:在#include<opencv2/opencv.hpp>中包含了core,imgproc等等模块的头文件,在实际操作中可以不必写冗余的包含在这个里边的头文件比如说#include"opencv2/highgui/highgui.hpp"等等等等

回到之前上一篇的模块:

opencv_core模块:其中包含OpenCV基本数据结构、动态数据结构、绘图与数组操作的相关函数、辅助功能与系统函数、基本的算法函数等核心功能。 
opencv_imgproc模块:包含图像处理函数,主要包含图像滤波、图像的几何变换、直方图、特征检测、目标跟踪等内容。 
opencv_highgui模块:高层GUI图形用户界面,包含媒体的I/O输入输出函数,读写图像及视频的函数,以及操作图形用户界面函数。 

Markimread函数,imshow,imwrite以及namedWindow()函数都分别与Matlab中的imread,imshow,imwrite,figure()有相近之处,可以互为参考学习

imread函数

通过右键转到定义

CV_EXPORTS_W Mat imread( const String& filename, int flags = IMREAD_COLOR );<pre name="code" class="cpp">/** @brief Loads a multi-page image from a file. (see imread for details.)@param filename Name of file to be loaded.@param flags Flag that can take values of @ref cv::ImreadModes, default with IMREAD_ANYCOLOR.@param mats A vector of Mat objects holding each page, if more than one.*/

可以看到一共有两个参数,第一个参数为路径名称

第二个参数定义输入图片显示的类型(真实度,可以采用或运算)

可以在OpenCV中标识图像格式的枚举体中取值。通过转到定义,我们可以在higui_c.h中发现这个枚举的定义是这样的:

[cpp] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. enum  
  2. {  
  3. /* 8bit, color or not */  
  4.    CV_LOAD_IMAGE_UNCHANGED  =-1,  
  5. /* 8bit, gray */  
  6.    CV_LOAD_IMAGE_GRAYSCALE  =0,  
  7. /* ?, color */  
  8.    CV_LOAD_IMAGE_COLOR      =1,  
  9. /* any depth, ? */  
  10.    CV_LOAD_IMAGE_ANYDEPTH   =2,  
  11. /* ?, any color */  
  12.    CV_LOAD_IMAGE_ANYCOLOR   =4  
  13. };  

相应的解释:

  • CV_LOAD_IMAGE_UNCHANGED,这个标识在新版本中被废置了,忽略。
  • CV_LOAD_IMAGE_ANYDEPTH- 如果取这个标识的话,若载入的图像的深度为16位或者32位,就返回对应深度的图像,否则,就转换为8位图像再返回。
  • CV_LOAD_IMAGE_COLOR- 如果取这个标识的话,总是转换图像到彩色一体
  • CV_LOAD_IMAGE_GRAYSCALE- 如果取这个标识的话,始终将图像转换成灰度1

 

如果输入有冲突的标志,将采用较小的数字值。比如CV_LOAD_IMAGE_COLOR | CV_LOAD_IMAGE_ANYCOLOR 将载入3通道图。

如果想要载入最真实的图像,选择CV_LOAD_IMAGE_ANYDEPTH | CV_LOAD_IMAGE_ANYCOLOR。

 

因为flags是int型的变量,如果我们不在这个枚举体中取值的话,还可以这样来:

  • flags >0返回一个3通道的彩色图像。
  • flags =0返回灰度图像。
  • flags <0返回包含Alpha通道的加载的图像。

需要注意的点:输出的图像默认情况下是不载入Alpha通道进来的。如果我们需要载入Alpha通道的话呢,这里就需要取负值。

 

如果你搞怪,flags取1999,也是可以的,这时就表示返回一个3通道的彩色图像。

 

 

[cpp] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. Mat image0=imread("dota.jpg",CV_LOAD_IMAGE_ANYDEPTH | CV_LOAD_IMAGE_ANYCOLOR);//载入最真实的图像  
  2. ge1=imread("dota.jpg",0);//载入灰度图  
  3. Mat image2=imread("dota.jpg",199);//载入3通道的彩色图像  
  4. Mat logo=imread("dota_logo.jpg");//载入3通道的彩色图像  

namedWindow函数

顾名思义,namedWindow函数,用于创建一个窗口。

函数原型是这样的:

[cpp] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. void namedWindow(const string& winname,int flags=WINDOW_AUTOSIZE );   

      ■ 第一个参数,const string&型的name,即填被用作窗口的标识符的窗口名称。

      ■ 第二个参数,int 类型的flags ,窗口的标识,可以填如下的值:

    • WINDOW_NORMAL设置了这个值,用户便可以改变窗口的大小(没有限制)
    • WINDOW_AUTOSIZE如果设置了这个值,窗口大小会自动调整以适应所显示的图像,并且不能手动改变窗口大小。
    • WINDOW_OPENGL 如果设置了这个值的话,窗口创建的时候便会支持OpenGL。

函数剖析:

首先需要注意的是,它有默认值WINDOW_AUTOSIZE,所以,一般情况下,这个函数我们填一个变量就行了。

namedWindow函数的作用是,通过指定的名字,创建一个可以作为图像和进度条的容器窗口。如果具有相同名称的窗口已经存在,则函数不做任何事情。

我们可以调用destroyWindow()或者destroyAllWindows()函数来关闭窗口,并取消之前分配的与窗口相关的所有内存空间。

但话是这样说,其实对于代码量不大的简单小程序来说,我们完全没有必要手动调用上述的destroyWindow()或者destroyAllWindows()函数,因为在退出时,所有的资源和应用程序的窗口会被操作系统会自动关闭。

imshow函数

在指定的窗口中显示一幅图像。

[cpp] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. void imshow(const string& winname, InputArray mat);  

 ■ 第一个参数,const string&类型的winname,填需要显示的窗口标识名称。

 ■ 第二个参数,InputArray 类型的mat,填需要显示的图像。

很多时候,遇到函数原型中的InputArray类型,我们把它简单地当做Mat类型就行了。

imwrite函数

在OpenCV中,输出图像到文件,我们一般都用imwrite函数,它的声明如下:

[cpp] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. bool imwrite(const string& filename,InputArray img, const vector<int>& params=vector<int>() );  

 

 ■ 第一个参数,const string&类型的filename,填需要写入的文件名就行了,带上后缀,比如,“123.jpg”这样。

 ■ 第二个参数,InputArray类型的img,一般填一个Mat类型的图像数据就行了。

 ■ 第三个参数,const vector<int>&类型的params,表示为特定格式保存的参数编码,它有默认值vector<int>(),所以一般情况下不需要填写。而如果要填写的话,有下面这些需要了解的地方:

 对于JPEG格式的图片,这个参数表示从0到100的图片质量(CV_IMWRITE_JPEG_QUALITY),默认值是95.

    • 对于PNG格式的图片,这个参数表示压缩级别(CV_IMWRITE_PNG_COMPRESSION)从0到9。较高的值意味着更小的尺寸和更长的压缩时间,而默认值是3。
    • 对于PPM,PGM,或PBM格式的图片,这个参数表示一个二进制格式标志(CV_IMWRITE_PXM_BINARY),取值为0或1,而默认值是1。

 

函数解析:

imwrite函数用于将图像保存到指定的文件。图像格式是基于文件扩展名的,可保存的扩展名和imread中可以读取的图像扩展名一样,为了方便查看,我们在这里再列一遍:

    • Windows位图 - *.bmp, *.dib
    • JPEG文件 - *.jpeg, *.jpg, *.jpe
    • JPEG 2000文件- *.jp2
    • PNG图片 - *.png
    • 便携文件格式- *.pbm, *.pgm, *.ppm
    • Sun rasters光栅格式 - *.sr, *.ras
    • TIFF 文件 - *.tiff, *.tif

addWeighted函数

顾名思义它是一个加权函数,在OpenCV的core.hpp头文件下可以发现如下定义

CV_EXPORTS_W void addWeighted(InputArray src1, double alpha, InputArray src2,                              double beta, double gamma, OutputArray dst, int dtype = -1);/** @brief Scales, calculates absolute values, and converts the result to 8-bit.简单的进行缩放,计算绝对值,将结果转换为8位On each element of the input array, the function convertScaleAbsperforms three operations sequentially: scaling, taking an absolutevalue, conversion to an unsigned 8-bit type:\f[\texttt{dst} (I)= \texttt{saturate\_cast<uchar>} (| \texttt{src} (I)* \texttt{alpha} +  \texttt{beta} |)\f]In case of multi-channel arrays, the function processes each channelindependently.如果是多通道数组,这个函数将分别对每个通道进行处理 When the output is not 8-bit, the operation can beemulated by calling the Mat::convertTo method (or by using matrixexpressions) and then by calculating an absolute value of the result.For example:@code{.cpp}    Mat_<float> A(30,30);    randu(A, Scalar(-100), Scalar(100));    Mat_<float> B = A*5 + 3;    B = abs(B);    // Mat_<float> B = abs(A*5+3) will also do the job,    // but it will allocate a temporary matrix@endcode@param src input array.@param dst output array.@param alpha optional scale factor.@param beta optional delta added to the scaled values.@sa  Mat::convertTo, cv::abs(const Mat&)*/


下面给出一个实例,对读取图像以及显示图像,划分ROI区域进行一个认识

int _tmain(int argc, _TCHAR* argv[]){//下列部分为简单读图以及显示程序/*显示流程:1,定义Mat迭代器(Mat为一种迭代器,迭代器类似于指针,参见OpenCV1.0的读取过程)2,将图片读入到Mat类型的变量当中3,创建新窗口(新窗口中首先定义名称,然后定义窗口的flag:比如说WINDOW_AUTOSIZE,OPENGL,NORMAL)4,将图片依附在窗口中:imshow("窗口名称",Mat变量名)*/Mat colorimag = imread("1.jpg", 199);namedWindow("向日葵", WINDOW_AUTOSIZE);if (!colorimag.data){ printf("没有图1啊大哥"); return -1; }imshow("向日葵", colorimag);Mat grayimag = imread("1.jpg", 0);if (!grayimag.data){ printf("没有图1啊大哥"); return -1; }namedWindow("灰度向日葵", WINDOW_AUTOSIZE);imshow("灰度向日葵", grayimag);//下列部分为为图片划定ROI区域/*1,初始化imageROI2,给imageROI赋值:即在一个大矩阵中通过采用Rect或者Range成员函数在生成图像内划定一个子矩阵3,调用addWeighted函数将图像进行合成*/Mat logo = imread("dota_logo.jpg");namedWindow("dota_logo", WINDOW_AUTOSIZE);imshow("dota_logo", logo);Mat imageROI;imageROI = colorimag(Rect(80, 35, logo.cols, logo.rows));//也可以采用Range:colorimag(Range(80,80+logo.rows,35,35+logo.cols));addWeighted(imageROI, 0.5, logo, 0.5, 0., imageROI);namedWindow("合成", WINDOW_AUTOSIZE);imshow("合成", colorimag);imwrite("imwrite生成的图片.bmp", colorimag);waitKey(0);}


OpenCV交互式操作成员函数

在这里先介绍几个目前用到的createTrackbar(),getTrackbarPos(),setMouseCallback()成员函数

先从滑动条开始

再次pou上上面那张图



//---------------------------------【头文件、命名空间包含部分】-------------------------------//描述:包含程序所使用的头文件和命名空间//-------------------------------------------------------------------------------------------------#include <opencv2/opencv.hpp>#include <opencv2/highgui/highgui.hpp>using namespace cv;//-----------------------------------【宏定义部分】-------------------------------------------- //  描述:定义一些辅助宏 //------------------------------------------------------------------------------------------------ #define WINDOW_NAME "【滑动条的创建&线性混合示例】"        //为窗口标题定义的宏 //-----------------------------------【全局变量声明部分】--------------------------------------//描述:全局变量声明将全局变量写在一起有助于理解//-----------------------------------------------------------------------------------------------const int g_nMaxAlphaValue = 100;//Alpha值的最大值int g_nAlphaValueSlider;//滑动条对应的变量double g_dAlphaValue;double g_dBetaValue;//声明存储图像的变量Mat g_srcImage1;Mat g_srcImage2;Mat g_dstImage;//-----------------------------------【on_Trackbar( )函数】--------------------------------//描述:响应滑动条的回调函数//------------------------------------------------------------------------------------------void on_Trackbar(int, void*){//求出当前alpha值相对于最大值的比例g_dAlphaValue = (double)g_nAlphaValueSlider / g_nMaxAlphaValue;//则beta值为1减去alpha值g_dBetaValue = (1.0 - g_dAlphaValue);//根据alpha和beta值进行线性混合addWeighted(g_srcImage1, g_dAlphaValue, g_srcImage2, g_dBetaValue, 0.0, g_dstImage);/*先熟悉一下addWeighted的原型,Mat将在下一篇博文进行介绍void addWeighted(InputArray src1, double alpha, InputArray src2, double beta, double gamma, OutputArray dst, int dtype=-1);第一个参数,InputArray类型的src1,表示需要加权的第一个数组,常常填一个Mat。    第二个参数,alpha,表示第一个数组的权重    第三个参数,src2,表示第二个数组,它需要和第一个数组拥有相同的尺寸和通道数。    第四个参数,beta,表示第二个数组的权重值。    第五个参数,dst,输出的数组,它和输入的两个数组拥有相同的尺寸和通道数。    第六个参数,gamma,一个加到权重总和上的标量值。看下面的式子自然会理解。    第七个参数,dtype,输出阵列的可选深度,有默认值-1。;当两个输入数组具有相同的深度时,这个参数设置为-1(默认值),即等同于src1.depth()。*///显示效果图imshow(WINDOW_NAME, g_dstImage);}//-----------------------------【ShowHelpText( )函数】--------------------------------------//描述:输出帮助信息//-------------------------------------------------------------------------------------------------//-----------------------------------【ShowHelpText( )函数】----------------------------------//描述:输出一些帮助信息//----------------------------------------------------------------------------------------------void ShowHelpText(){system("color 5E");//改变控制台窗口颜色printf("\n\n\t\t\t   当前使用的OpenCV版本为:" CV_VERSION);printf("\n\n  ----------------------------------------------------------------------------\n");}//--------------------------------------【main( )函数】-----------------------------------------//描述:控制台应用程序的入口函数,我们的程序从这里开始执行//-----------------------------------------------------------------------------------------------int main(int argc, char** argv){//显示帮助信息ShowHelpText();//加载图像 (两图像的尺寸需相同)g_srcImage1 = imread("1.jpg");g_srcImage2 = imread("2.jpg");if (!g_srcImage1.data) { printf("读取第一幅图片错误,请确定目录下是否有imread函数指定图片存在~! \n"); return -1; }if (!g_srcImage2.data) { printf("读取第二幅图片错误,请确定目录下是否有imread函数指定图片存在~!\n"); return -1; }//设置滑动条初值为70g_nAlphaValueSlider = 70;//创建窗体namedWindow(WINDOW_NAME, 1);//在创建的窗体中创建一个滑动条控件char TrackbarName[50];sprintf(TrackbarName, "透明值 %d", g_nMaxAlphaValue);//把格式化的数据写入某个字符串缓冲区。//int sprintf( char *buffer, const char *format, [ argument] … );createTrackbar(TrackbarName, WINDOW_NAME, &g_nAlphaValueSlider, g_nMaxAlphaValue, on_Trackbar);//结果在回调函数中显示on_Trackbar(g_nAlphaValueSlider, 0);//按任意键退出waitKey(0);return 0;}


0 0