CvMat的数据访问

来源:互联网 发布:注册登录源码 编辑:程序博客网 时间:2024/06/04 11:47

http://blog.sina.com.cn/s/blog_4b0020f30101075w.html

 CvMat矩阵数据结构是OpenCV的基础数据类型,对于图像处理这种密级型运算,经常需要访问,修改,设置其元素的值。OpenCV提供了很多优良的函数,能够很简单的实现上述功能。在《学习OpenCV》一书中,作者分别就简单的方法,麻烦的方法,和恰当的方法对相关函数进行了讲解,讲得比较清晰。本文主要讲解通过指针高效访问CvMat元素的方法z及平时容易忽视的一些小问题。

1.关于元素数据类型
    CvMat中数据类型由几个部分构成 CV_<bit_depth>(S|U|F)channels,S表示有符号的,U表示无符号的,F表示浮点数;比如CV_32F1,表示32位1通道浮点数;CV_8U3,表示8位无符号3通道整形;数据类型重要的原因在于
A.它决定了CvMat数据的分布,比如,若元素类型CV_8UC1(常用于灰度图像 ),那么CvMat的数据排列是每行按照ggggggg(g表示一个像素的灰度值)的格式排列;若元素类型为CV_8UC3,则可以表示彩色图像,其行排列成为bgrbgrbgr(分别表示蓝绿红三个通道值,三个通道值表征1个像素)的形式;
B.在访问其数据类型时,如何正确转换成对应的数据类型指针;后面的例子会说到;

2.访问CvMat中的元素
   简单的通过CV_MAT_ELEM宏,cvGetRealXD()函数即可实现,但是图像处理是计算密集型操作,这些函数虽然简单易用,但是效率比较低。因此最常用的是采用指针来访问CvMat中的元素。
   CvMat结构中data结构对于指针访问其元素非常重要.
   其data成员为
   union{
          uchar* ptr;
          short* s;
          int* i;
          float* fl;
          double* db;
       }data;
  由于是联合体,因此在访问时,指针可以在这几种类型的指针之间转换。当然这还归功于CvMat中每行的字节长度是固定的,成员step记录了CvMat每行的字节数。下面的代码说明如何高效访问矩阵元素。
   CvMat* mat=cvCreateMat(5,3,CV_32FC1);//建立一个5行3列的矩阵,元素类型为32位单通道浮点数;数据类型对于后面使用指针访问矩阵元素非常重要。
   cvZero(mat);
   int row,col;

//下面的代码给矩阵的每个元素赋值
   for (row=0;row<mat->height;row++)
   {
  float* pData=(float*)(mat->data.ptr+row*mat->step);//获取第row行的行首指针,因为数据类型为浮点型,因此,通过data.ptr与step获得的字节指针需要转换为float* 这样的指针
  for (col=0;col<mat->width;col++)
  {
                      *pData=(row+col);
      pData++;//因为,指针后移一位,也即是指向下一个浮点数
  }
   }
//下面的3段代码功能是一样的,都是在控制台显示各个元素的值

///code1
   for (row=0;row<mat->height;row++)
   {  
      float* pData=(float*)(mat->data.ptr+row*mat->step);//我们通过转换成float*这样的指针
  for (col=0;col<mat->width;col++)
  {
  std::cout<<*pData<<" ";
  pData++;//指向下一个元素
  }
  }
///code2
   for (row=0;row<mat->height;row++)
   {  
  float* pData=mat->data.fl+row*mat->step/4;//这儿就用到了union中的fl指针,由于step是以1字节来计算的,因此实际步长应该为mat->step/4(浮点数的长度为4字节)
  for (col=0;col<mat->width;col++)
  {
  std::cout<<*pData<<" ";
  pData++;
  }
  std::cout<<std::endl;
   }

///code 3
   for (row=0;row<mat->height;row++)
   {  
  float* pData=mat->data.fl+row*mat->step/4;
  for (col=0;col<mat->width;col++)
  {
  std::cout<<*(pData+j)<<" ";//自己计算列指针的位置
  
  }
  std::cout<<std::endl;
   }
///////////////////////

用指针除了顺序访问CvMat中的元素外,还可以访问任意位置的元素,当然前提是需要自己计算指针。比如:
 for (row=0;row<mat->height;row++)
   {  
  float* pData=mat->data.fl+row*mat->step/4;
  for (col=0;col<mat->width;col++)
  {
  if (row>0)
                      {
      std::cout<< *(pData+col-mat->step/4)<<" ";//访问mat(row-1,col)元素
                    if (col>0)
       std::cout<<*(pData+col-1-mat->step/4)<<"";//访问mat(row-1,col-1)元素
                       }   
  }
  std::cout<<std::endl;
   }
cvReleaseMat(&mat);//用完释放相关资源

因此,对CvMat中的元素不要拘泥于书上提供的几种方式,在程序效率很重要的情况下,可以合理使用指针结合step完美的访问CvMat中的元素,当然,使用指针,也有缺点,出现错误不容易发现,自己曾经遭过道。

自己几点体会:
(1):和作者前面提到的一样,数组的数据类型非常重要。其中通道数表明了数据的排列方式,数据类型对后面的访问方式有很大影响;
(2):在CvMat中,最重要一点要理解的是step。其有两点非常重要;
第一:其是以字节为单位的;
第二:对于指定的矩阵每行的字节长度是固定的。
由这两点可以引申出来两种访问方式
第一:对于以字节为单位的这种形式,在上面的code1、code2表现的非常明显。这里对于不同类型的数组,因为其所占的空间大小不同,但是每行的字节长度是固定的,这里可以通过比例放缩,即除以sizeof(*),来准确定位;
第二:对于指定的矩阵每行的字节长度是固定这种形式,在第一个列子中表现明显。这里先用简单的ptr定位,再进行强制转换。因为是利用了固定的长度,这种一一对应的方式来进行定位,非常方便。这里是把定位和操作分开进行的。


依据以上分析,下面给出简单的总结(http://blog.sina.com.cn/s/blog_78fd98af0100yfjk.html)

CvMat* mat;

mat = cvCreateMat(9,10,CV_64FC3);//注意所申请矩阵元素的类型,不同的类型访问操作方法不同,但类似可推导,以此为例。

opencv中的多通道矩阵CvMat元素的访问方法总结如下:

1.

  mat(i,j,1):  *(mat->data.db + i*(mat->step/8) + 3*j);//.db为double数据类型,step类型为int,代表矩阵每行的字节数,因此要处以sizeof(double)  =8。

  mat(i,j,2):  *(mat->data.db + i*(mat->step/8) + 3*j+1);

  mat(i,j,3):  *(mat->data.db + i*(mat->step/8) + 3*j+2);

2.

  mat(i,j,1):  ((double*)(mat->data.ptr+i*mat->step))[3*j];//ptr的类型为uchar*,step类型为int,代表矩阵每行的字节数。另外指针可以当做数组名,因此可以这样操作。

  mat(i,j,2):  ((double*)(mat->data.ptr+i*mat->step))[3*j+1];

  mat(i,j,3):  ((double*)(mat->data.ptr+i*mat->step))[3*j+2];

3.

mat(i,j,1):  *( (double*)(mat->data.ptr+i*mat->step) + 3*j );//根据以上也可以这样

总之就是C语言中的指针操作啦,要注意指针的类型,以及step的单位是字节就可以了。

自己的几点体会:
(1):第一种方法是顺序访问的,但是这种最可能出问题。learning opencvp-46中说到,CvMat数据指针可以指向一个大型数组中的ROI,所以无法保证数据逐行连续存取。因此,这种容易出问题。
(2):第二种和第三种方法是每次重新计算起点,这种是精确的。



1. 理解CvMat结构的数据类型

 新建二维矩阵:cvMat* cvCreateMat(int rows, int cols,int type);

其中type可以是任何预定义类型,其结构为:CV_<bit_depth>(S|U|F)C<number_of_channels>,bit_depth表示存储一个数字所需要的位数;S|U|F表示数据类型,即S为有符号的整型,U表示无符号整型,F表示浮点型;number_of_channels表示数据的通道数,即一个单元里存储的数字个数。OpenCV在为矩阵赋值的时候,依照type的值对数据进行二进制编码,并存于对应的内存中。当需要从矩阵中取出数据的时候,系统找到指向对应数据的指针,如何对该指针指向的内存中的二进制编码进行解释,需要我们指定其数据类型。例如,当type的值为CV_8UC3时,bit_depth的值为8,number_of_channels的值为3,则CV_8UC3表示用8位存储一个无符号的整数,一个存储单元里含有3个这种无符号的整数,一个存储单元占有3*8=24位的内存空间。往矩阵中写入数据时,系统先把源数据按照8位无符号整数进行编码,然后按照3个数据一组将编码写入对应的内存中。取数据时,系统找到指向对应数据的指针,由用户指定该指针的类型,系统则按照指针的类型来解释内存中的数据。在这里,我们需要指定该指针的类型为:unsigned char* 型。如果类型不匹配,则会因编码和解码规则不一致而导致错误。win32系统中,char为1字节(8位),short为2字节(16位),long和int为4字节(32位),float为4字节(32位),double为8字节(64位),所以,CV_8UC1对应unsigned char,CV_8SC1对应signed char,CV_16UC1对应unsigned short,CV_16SC1对应signed short,CV_32UC1对应unsigned int或者unsigned long,CV_32SC1对应signed int或者signed long,CV_32FC1对应float,CV_64FC1对应double。以上的通道数都为1。

对应的,在OpenCV的图像结构IplImage中,变量depth的值可以为:IPL_DEPTH_8U、IPL_DEPTH_8S、IPL_DEPTH_16S、IPL_DEPTH_32S等等,其存储规则和CvMat结构一致。

2. 理解CvMat结构多通道数据的存储规则

OpenCV支持多通道矩阵。在多通道矩阵中,通道的存储是连续的。例如一个CV_8UC3型矩阵,其存储结构为(uchar1,uchar2,uchar3),(uchar1,uchar2,uchar3)……。若有一个uchar型指针指向该矩阵数据,要将该指针移向下一通道,只需将其加1,;如果想访问下一个元素集,则需要家一定的偏移量(这里为3)。即若有uchar* pt指向uchar1,则pt++指向uchar2,要指向下一个uchar1需要pt=pt+3。

同样,在图像结构IplImage中,imageData的排列方式也是交错排列的。对于3通道RGB图像来说,imageData的排列方式为:RGBRGBRGB……。

3. 理解CvMat结构的step元素

step表示矩阵中行的长度,单位为字节。出于效率的考虑,step的长度为4字节的整数倍。例如:对于一个CV_8UC3类型大小为10*10的数组,每一个数字占1个字节(8位),一个元素集含有3个数字,占3个字节,一行10个元素集,所以一行所占的内存为30个字节。而在CvMat结构中,由于行数所占的内存要求为4字节的整数倍,所以OpenCV会在每一行的结尾添2个空字节,于是每一行所占的内存为32个字节。

与CvMat类似,图像结构IplImage中,元素widthStep表示图像中行的长度,单位为字节,且也必须为4字节的整数倍。如果实际长度不是4字节的整数倍,则在每一行的结尾设置冗余字节,使其为4字节的整数倍。

4. 理解CvMat结构中指向数据体的指针

在CvMat中,指向数据体的指针被设置为union类型:

                                      union{

                                          uchar* ptr;

                                          short*  s;

                                          int*       i;

                                          float*    f;

                                          double*  db;

                                                 }data;

虽然每一个指针变量长度都一样(4字节) ,但它代表了对数据体的解释方法。例如:data.ptr表示数据体为uchar型,data.s表示数据体为short型等等。若有一个CV_32FC3型二维数组mat,指向第i行的指针可以用以下语句来表示:

                 float* ptr = (float*) (mat->data.ptr+mat->step*i);

或者         float* ptr = mat->data.fl+mat->step/sizeof(float)*i;

前一种方法首先将数据看成uchar型,加入偏移量后将指向数据体的指针强制转换为float*型。由于uchar型数据只占一个字节,和step的单位一致,所以偏移量为step*i;

后一种方法直接将数据看成float型然后加入偏移量。由于float数据所占的字节数为sizeof(float),所以偏移量为step/sizeof(float)*i,其中,每行的偏移量为step/sizeof(float)。

与CvMat不同的是,在图像结构IplImage中,指向图像数据的指针imageData总是uchar*型的。所以在图像数据进行指针运算的时候,可以直接增加widthStep个单位。而不必关心实际数据类型。总之,“当要处理的是矩阵时,必须对偏移量进行调整,因为数据指针可能是非字节类型;当要处理的是图像时,可以直接使用偏移,因为数据指针总是字节类型。”(《学习OpenCV》中文版P51)



0 0