OpenCV教程之基础操作：图像的读入、输出、访问、Mat类、色彩缩减与线性融合

来源：互联网发布：淘宝直播销量权重编辑：程序博客网时间：2024/05/17 23:47

这里总结了一点关于OpenCV3版本的简单操作、供初学者快速入门。过程中会对代码分块逐个讲解，并给出测试结果图

一、OpenCV简介

OpenCV，是一个基于开源发行的跨平台计算机视觉库，它实现了图像处理和计算机视觉方面的很多通用的算法，已经成为了计算机视觉领域最有力的研究工具之一。其全称是Open Source Computer Vision Library，直译就是开源计算机视觉库，OpenCV由一系列C函数和C++类构成，轻量且高效，强大的OpenCV除了用C/C++语言进行开发和使用之外，还支持使用C#、Ch、Ruby等编程语言，同时提供了对Python、Ruby、MATLAB等语言的接口，通用性强。本文所用的语言为C++，在eclipse-Mac环境下开发，代码基本兼容Windows系统

OpenCV图标

二、图像的读入与输出

作为最基本的图像操作，读入和输出这里需要介绍两个非常实用的基本函数imread还有imshow

2.1 imread

    //imread的函数原型      Mat imread(const string& filename, int flags = 1);    (1)第一个参数，const string&类型的filepath，填我们需要载入的图片路径名       imread函数支持读取的常用文件类型有：       > Windows位图： *.bmp,*.dib       >JPEG文件：     *.jpeg,*jpg,*jpe       >JPEG 2000文件：*.jp2       >PNG图片：      *.png       >...     (2)第二个参数，int类型的flags，为载入标识，它指定一个加载图像的颜色类型，自带默认值为1       其备选参数和意义为：       >0 : 将原图准换为灰度图像读取       >1 : 返回一个3通道的彩色图像       >2 : 如果读入的图像深度为16位活着32位，则返回对应深度的图像，否则转换为8位图像再返回       >4 : 读取任意色彩模式的图像，根据原图       ps ：flags可以不取以上枚举值，当       flags > 0时，等价于1       flags < 0时，返回包含Alpha通道的加载图像

2.2 imshow

     //imshow的函数原型     void imshow(const string& winname,InputArray mat);     (1)第一个参数：const string&类型的winname，需要填写显示的窗口标识名称     (2)第二个参数：InputArray 类型的mat，填写需要显示的图像

2.3 应用举例

#include <opencv2/opencv.hpp>using namespace cv;int main(){    Mat g_srcImage1 = imread("/Users/zhuxiaoxiansheng/Desktop/lalaland_1.jpeg",0);    resize(g_srcImage1,g_srcImage1,Size(1000,640));  //设定图像大小    imshow("flags = 0",g_srcImage1);                 //显示图像    waitKey();                                       //等待任意键输入    Mat g_srcImage2 = imread("/Users/zhuxiaoxiansheng/Desktop/lalaland_1.jpeg",1);    resize(g_srcImage2,g_srcImage2,Size(1000,640));    imshow("flags = 1",g_srcImage2);    waitKey();    Mat g_srcImage3 = imread("/Users/zhuxiaoxiansheng/Desktop/lalaland_1.jpeg",2);    resize(g_srcImage3,g_srcImage3,Size(1000,640));    imshow("flags = 2",g_srcImage3);    waitKey();    Mat g_srcImage4 = imread("/Users/zhuxiaoxiansheng/Desktop/lalaland_1.jpeg",4);    resize(g_srcImage4,g_srcImage4,Size(1000,640));    imshow("flags = 4",g_srcImage4);    waitKey();    return 0;}

测试结果

三、图像的基本管理：Mat类

自从OpenCV跨入了2.0时代，Mat类数据结构便成为了图像处理的主打类型，Mat类由两部分组成：矩阵头（包含矩阵尺寸、存储方法、存储地址等信息）和一个指向存储所有像素值的矩阵（根据所选存储方法的不同，矩阵可以是不同的维数）的指针。矩阵头的尺寸是一个常数值，但矩阵本事身的尺寸会依图像的不同而不同，通常比矩阵头的尺寸数大数个数量级。

在解决问题中，传递图像是常有的事，但图像的复制会造成很大的计算开销与空间损失，因此，OpenCV使用了引用计数机制，其思路是让每个Mat对像有自己的信息头，但共享一个矩阵，接下来简单介绍一下Mat类型的创建，和元素访问

3.1 Mat类的创建

这里介绍几种常用的Mat创建方法

    （1）使用Mat的构造函数     Mat M(2,2,CV_8UC3,Scalar:all(0));     cout << M << endl;     上式中CV_8UC3是指使用8位的unsigned char型，每个像素由三个元素组成三通道     Scalar是一个short型向量，能用指定的定制化值来初始化矩阵，上式的输出为     [  0,   0,   0,   0,   0,   0;        0,   0,   0,   0,   0,   0]     (2)采用Matlab的初始化方式     Mat E = Mat::eye(4,4,CV_64F);     cout << "E = " << endl << E << endl << endl;     Mat O = Mat::ones(2,2,CV_32F);     cout << "O = " << endl << O << endl << endl;     Mat Z = Mat::zeros(3,3,CV_8UC1);     cout << "Z = " << endl << Z << endl << endl;     上式的输出为：     E =        [1, 0, 0, 0;        0, 1, 0, 0;        0, 0, 1, 0;        0, 0, 0, 1]     O =        [1, 1;        1, 1]     Z =        [0,   0,   0;        0,   0,   0;        0,   0,   0]

3.2 Mat类的元素值访问

这一部分可以简单的用一个swich代表来表述，示例如下：

    switch(img.channels())              //根据图像的通道数作出不同的选择{    case 1:    {for(int i=0;i<img.rows;i++)      {        for(int j=0;j<img.cols;j++)            {                img.at<uchar>(i,j)=0;   //访问单通道元素            }       }    break;     }        case 3:    {        for(int i=0;i<img.rows;i++)        {            for(int j=0;j<img.cols;j++)            {                img.at<Vec3b>(i,j)[0]=0;    //访问三通道元素                img.at<Vec3b>(i,j)[1]=0;                img.at<Vec3b>(i,j)[2]=0;            }        }    break;    }}

3.3 应用举例

#include <opencv2/opencv.hpp>#include <iostream>using namespace cv;using namespace std;int main(){    Mat A(2,2,CV_8UC3),B,C;     //定义A矩阵，设定其结构为2X2,3通道颜色，并声明B，C    randu(A,0,255);             //给A随机赋值    B = A;                      //引用    A.copyTo(C);                //复制    cout << "A = " << endl << A << endl;    cout << "B = " << endl << B << endl;    cout << "C = " << endl << C << endl <<endl;    A.at<Vec3b>(1,1)[0] = 0;    //改变A的（1，1）元素三个通道的值    A.at<Vec3b>(1,1)[1] = 0;    A.at<Vec3b>(1,1)[2] = 0;    cout << "A = " << endl << A << endl;    cout << "B = " << endl << B << endl;    cout << "C = " << endl << C << endl;    return 0;}

显示结果

A = [ 91,   2,  79, 179,  52, 205; 236,   8, 181, 239,  26, 248]B = [ 91,   2,  79, 179,  52, 205; 236,   8, 181, 239,  26, 248]C = [ 91,   2,  79, 179,  52, 205; 236,   8, 181, 239,  26, 248]A = [ 91,   2,  79, 179,  52, 205; 236,   8, 181,   0,   0,   0]B = [ 91,   2,  79, 179,  52, 205; 236,   8, 181,   0,   0,   0]C = [ 91,   2,  79, 179,  52, 205; 236,   8, 181, 239,  26, 248]

四、图像的色彩缩减

我们知道，若矩阵元素存储的是单通道像素，使用C或C++的无符号字符类型，那么像素可能有256个不同的值。但若是三通道图像，这种存储格式的颜色会达到一千六百多万种，用如此之多的颜色来进行处理，可能会对算法性能造成严重影响。

其实仅用这些颜色中最具有代表性的很小的部分，就足以达到相同的效果，颜色空间缩减的做法是：将现有的颜色空间值除以某个输入值，以获得较少的颜色数。比如，颜色0～9可以取值为0，10～19可以取值为10，依次类推，依据这种思想，我们可以实现如下代码

#include <iostream>#include <opencv2/core/core.hpp>#include <opencv2/highgui/highgui.hpp>#include <opencv2/opencv.hpp>using namespace cv;using namespace std;void colorReduce(Mat& inputImage,Mat& outputImage,int div);int main(){    Mat srcImage = imread("/Users/zhuxiaoxiansheng/Desktop/lalaland_1.jpeg");    resize(srcImage,srcImage,Size(1000*1.5,640*1.5));    Mat dstImage;    dstImage.create(srcImage.rows,srcImage.cols,srcImage.type());    colorReduce(srcImage,dstImage,32);    imshow("效果图",dstImage);    waitKey(0);    return 0;}void colorReduce(Mat& inputImage,Mat&outputImage,int div){    outputImage = inputImage.clone();    Mat_<Vec3b>::iterator it = outputImage.begin<Vec3b>();    Mat_<Vec3b>::iterator itend = outputImage.end<Vec3b>();    for(;it != itend;++it){        (*it)[0] = (*it)[0]/div*div + div/2;        (*it)[1] = (*it)[1]/div*div + div/2;        (*it)[2] = (*it)[2]/div*div + div/2;    }}

效果图

五、两张图片的线形融合

两张图片的线形融合，在OpenCV里有一个非常实用的函数，接下来，先简单介绍一下这个函数

    //addWeighted的函数原型        void addWeighted(InputArray src1,double alpha,InputArray          Src2,double beta,double gamma,OutputArray dst,int dtype = -1);    >第一个参数，表示第一个需要加权的图像M    >第二个参数，表示第一个数组的权重    >第三个参数，表示第二个需要加权的图像，两个图像的大小与通道数必须相等    >第四个参数，表示第二个图像的权重    >第五个参数，一个加到总和上的标量值，影响合成图片的亮度    >第六个参数，输出图像    >第七个参数，输出图像的深度，默认-1，即和第一个输入图像相同

接下来在要做的演示中，我们用到的两张图如下

演示代码为

#include <opencv2/imgproc/imgproc.hpp>#include <opencv2/opencv.hpp>using namespace cv;#define WINDOW_NAME "【线性混合示例】"const int g_nMaxAlphaValue = 100;int g_nAlphaValueSlider;double g_dAlphaValue;double g_dBetaValue;Mat g_srcImage1;Mat g_srcImage2;Mat g_dstImage;void on_Trackbar(int ,void*){    g_dAlphaValue = (double) g_nAlphaValueSlider/g_nMaxAlphaValue;    g_dBetaValue = 1 - g_dAlphaValue;    addWeighted(g_srcImage1,g_dAlphaValue,g_srcImage2,g_dBetaValue,0.0,g_dstImage);    imshow(WINDOW_NAME, g_dstImage);}int main(int argc,char *argv[]){    g_srcImage1 = imread("/Users/zhuxiaoxiansheng/Desktop/lalaland_1.jpeg");    g_srcImage2 = imread("/Users/zhuxiaoxiansheng/Desktop/lalaland_2.jpg");    resize(g_srcImage1,g_srcImage1,Size(1000*1.5,640*1.5));    resize(g_srcImage2,g_srcImage2,Size(1000*1.5,640*1.5));    if(!g_srcImage1.data){        printf("读取第一幅图片错误，请确定目录下是否有imread函数指定图片存在！\n");        return -1;    }    if(!g_srcImage2.data){        printf("读取第二幅图片错误，请确定目录下是否有imread函数指定图片存在！\n");        return -1;    }    g_nAlphaValueSlider = 70;    namedWindow(WINDOW_NAME,1);    char TrackbarName[50];    sprintf(TrackbarName,"透明值 %d",g_nMaxAlphaValue);    createTrackbar(TrackbarName,WINDOW_NAME,&g_nAlphaValueSlider,g_nMaxAlphaValue,on_Trackbar);    on_Trackbar(g_nAlphaValueSlider,0);    waitKey(0);    return 0;}