CvMat的数据访问

来源：互联网发布：注册登录源码编辑：程序博客网时间：2024/06/04 11:47

http://blog.sina.com.cn/s/blog_4b0020f30101075w.html

CvMat矩阵数据结构是OpenCV的基础数据类型，对于图像处理这种密级型运算，经常需要访问，修改，设置其元素的值。OpenCV提供了很多优良的函数，能够很简单的实现上述功能。在《学习OpenCV》一书中，作者分别就简单的方法，麻烦的方法，和恰当的方法对相关函数进行了讲解，讲得比较清晰。本文主要讲解通过指针高效访问CvMat元素的方法z及平时容易忽视的一些小问题。

1.关于元素数据类型

CvMat中数据类型由几个部分构成 CV_<bit_depth>(S|U|F)channels,S表示有符号的，U表示无符号的，F表示浮点数;比如CV_32F1，表示32位1通道浮点数;CV_8U3，表示8位无符号3通道整形;数据类型重要的原因在于

A.它决定了CvMat数据的分布，比如，若元素类型CV_8UC1（常用于灰度图像 ),那么CvMat的数据排列是每行按照ggggggg(g表示一个像素的灰度值)的格式排列;若元素类型为CV_8UC3，则可以表示彩色图像，其行排列成为bgrbgrbgr(分别表示蓝绿红三个通道值，三个通道值表征1个像素)的形式；

B.在访问其数据类型时，如何正确转换成对应的数据类型指针；后面的例子会说到；

2.访问CvMat中的元素

简单的通过CV_MAT_ELEM宏，cvGetRealXD()函数即可实现，但是图像处理是计算密集型操作，这些函数虽然简单易用，但是效率比较低。因此最常用的是采用指针来访问CvMat中的元素。

CvMat结构中data结构对于指针访问其元素非常重要.

其data成员为

union{

uchar* ptr;

short* s;

int* i;

float* fl;

double* db;

}data;

由于是联合体，因此在访问时，指针可以在这几种类型的指针之间转换。当然这还归功于CvMat中每行的字节长度是固定的，成员step记录了CvMat每行的字节数。下面的代码说明如何高效访问矩阵元素。

CvMat* mat=cvCreateMat(5,3,CV_32FC1);//建立一个5行3列的矩阵，元素类型为32位单通道浮点数;数据类型对于后面使用指针访问矩阵元素非常重要。

cvZero(mat);

int row,col;

//下面的代码给矩阵的每个元素赋值

for (row=0;row<mat->height;row++)

{

float* pData=(float*)(mat->data.ptr+row*mat->step);//获取第row行的行首指针，因为数据类型为浮点型，因此，通过data.ptr与step获得的字节指针需要转换为float* 这样的指针

for (col=0;col<mat->width;col++)

{

*pData=(row+col);

pData++;//因为,指针后移一位，也即是指向下一个浮点数

}

//下面的3段代码功能是一样的，都是在控制台显示各个元素的值

///code1

for (row=0;row<mat->height;row++)

{

float* pData=(float*)(mat->data.ptr+row*mat->step);//我们通过转换成float*这样的指针

for (col=0;col<mat->width;col++)

{

std::cout<<*pData<<" ";

pData++;//指向下一个元素

}

///code2

for (row=0;row<mat->height;row++)

{

float* pData=mat->data.fl+row*mat->step/4;//这儿就用到了union中的fl指针,由于step是以1字节来计算的，因此实际步长应该为mat->step/4（浮点数的长度为4字节）

for (col=0;col<mat->width;col++)

{

std::cout<<*pData<<" ";

pData++;

}

std::cout<<std::endl;

}

///code 3

for (row=0;row<mat->height;row++)

{

float* pData=mat->data.fl+row*mat->step/4;

for (col=0;col<mat->width;col++)

{

std::cout<<*(pData+j)<<" ";//自己计算列指针的位置

}

std::cout<<std::endl;

}

///////////////////////

用指针除了顺序访问CvMat中的元素外，还可以访问任意位置的元素，当然前提是需要自己计算指针。比如：

for (row=0;row<mat->height;row++)

{

float* pData=mat->data.fl+row*mat->step/4;

for (col=0;col<mat->width;col++)

{

if (row>0)

{

std::cout<< *(pData+col-mat->step/4)<<" ";//访问mat(row-1,col)元素

if (col>0)

std::cout<<*(pData+col-1-mat->step/4)<<"";//访问mat(row-1,col-1)元素

}

std::cout<<std::endl;

}

cvReleaseMat(&mat);//用完释放相关资源

因此，对CvMat中的元素不要拘泥于书上提供的几种方式，在程序效率很重要的情况下，可以合理使用指针结合step完美的访问CvMat中的元素，当然，使用指针，也有缺点，出现错误不容易发现，自己曾经遭过道。

自己几点体会：

（1）：和作者前面提到的一样，数组的数据类型非常重要。其中通道数表明了数据的排列方式，数据类型对后面的访问方式有很大影响；

（2）：在CvMat中，最重要一点要理解的是step。其有两点非常重要;

第一：其是以字节为单位的;

第二：对于指定的矩阵每行的字节长度是固定的。

由这两点可以引申出来两种访问方式

第一：对于以字节为单位的这种形式，在上面的code1、code2表现的非常明显。这里对于不同类型的数组，因为其所占的空间大小不同，但是每行的字节长度是固定的，这里可以通过比例放缩，即除以sizeof(*),来准确定位；

第二：对于指定的矩阵每行的字节长度是固定这种形式，在第一个列子中表现明显。这里先用简单的ptr定位，再进行强制转换。因为是利用了固定的长度，这种一一对应的方式来进行定位，非常方便。这里是把定位和操作分开进行的。

依据以上分析，下面给出简单的总结（http://blog.sina.com.cn/s/blog_78fd98af0100yfjk.html）

CvMat* mat；

mat = cvCreateMat(9,10,CV_64FC3);//注意所申请矩阵元素的类型，不同的类型访问操作方法不同，但类似可推导，以此为例。

opencv中的多通道矩阵CvMat元素的访问方法总结如下：

mat(i,j,1)： *(mat->data.db + i*(mat->step/8) + 3*j);//.db为double数据类型，step类型为int，代表矩阵每行的字节数，因此要处以sizeof(double) =8。

mat(i,j,2)： *(mat->data.db + i*(mat->step/8) + 3*j+1);

mat(i,j,3)： *(mat->data.db + i*(mat->step/8) + 3*j+2);

mat(i,j,1)： ((double*)(mat->data.ptr+i*mat->step))[3*j];//ptr的类型为uchar*,step类型为int，代表矩阵每行的字节数。另外指针可以当做数组名，因此可以这样操作。

mat(i,j,2)： ((double*)(mat->data.ptr+i*mat->step))[3*j+1];

mat(i,j,3)： ((double*)(mat->data.ptr+i*mat->step))[3*j+2];

mat(i,j,1)： *( (double*)(mat->data.ptr+i*mat->step) + 3*j );//根据以上也可以这样

总之就是C语言中的指针操作啦，要注意指针的类型，以及step的单位是字节就可以了。

自己的几点体会：

（1）：第一种方法是顺序访问的，但是这种最可能出问题。learning opencvp-46中说到，CvMat数据指针可以指向一个大型数组中的ROI，所以无法保证数据逐行连续存取。因此，这种容易出问题。

（2）：第二种和第三种方法是每次重新计算起点，这种是精确的。

1. 理解CvMat结构的数据类型

新建二维矩阵：cvMat* cvCreateMat(int rows, int cols,int type);

其中type可以是任何预定义类型，其结构为：CV_<bit_depth>(S|U|F)C<number_of_channels>，bit_depth表示存储一个数字所需要的位数；S|U|F表示数据类型，即S为有符号的整型，U表示无符号整型，F表示浮点型；number_of_channels表示数据的通道数，即一个单元里存储的数字个数。OpenCV在为矩阵赋值的时候，依照type的值对数据进行二进制编码，并存于对应的内存中。当需要从矩阵中取出数据的时候，系统找到指向对应数据的指针，如何对该指针指向的内存中的二进制编码进行解释，需要我们指定其数据类型。例如，当type的值为CV_8UC3时，bit_depth的值为8，number_of_channels的值为3，则CV_8UC3表示用8位存储一个无符号的整数，一个存储单元里含有3个这种无符号的整数，一个存储单元占有3*8=24位的内存空间。往矩阵中写入数据时，系统先把源数据按照8位无符号整数进行编码，然后按照3个数据一组将编码写入对应的内存中。取数据时，系统找到指向对应数据的指针，由用户指定该指针的类型，系统则按照指针的类型来解释内存中的数据。在这里，我们需要指定该指针的类型为：unsigned char* 型。如果类型不匹配，则会因编码和解码规则不一致而导致错误。win32系统中，char为1字节(8位)，short为2字节(16位)，long和int为4字节(32位)，float为4字节(32位)，double为8字节(64位)，所以，CV_8UC1对应unsigned char，CV_8SC1对应signed char，CV_16UC1对应unsigned short，CV_16SC1对应signed short，CV_32UC1对应unsigned int或者unsigned long，CV_32SC1对应signed int或者signed long，CV_32FC1对应float，CV_64FC1对应double。以上的通道数都为1。

对应的，在OpenCV的图像结构IplImage中，变量depth的值可以为：IPL_DEPTH_8U、IPL_DEPTH_8S、IPL_DEPTH_16S、IPL_DEPTH_32S等等，其存储规则和CvMat结构一致。

2. 理解CvMat结构多通道数据的存储规则

OpenCV支持多通道矩阵。在多通道矩阵中，通道的存储是连续的。例如一个CV_8UC3型矩阵，其存储结构为（uchar1，uchar2，uchar3），（uchar1，uchar2，uchar3）……。若有一个uchar型指针指向该矩阵数据，要将该指针移向下一通道，只需将其加1,；如果想访问下一个元素集，则需要家一定的偏移量（这里为3）。即若有uchar* pt指向uchar1，则pt++指向uchar2，要指向下一个uchar1需要pt=pt+3。

同样，在图像结构IplImage中，imageData的排列方式也是交错排列的。对于3通道RGB图像来说，imageData的排列方式为：RGBRGBRGB……。

3. 理解CvMat结构的step元素

step表示矩阵中行的长度，单位为字节。出于效率的考虑，step的长度为4字节的整数倍。例如：对于一个CV_8UC3类型大小为10*10的数组，每一个数字占1个字节（8位），一个元素集含有3个数字，占3个字节，一行10个元素集，所以一行所占的内存为30个字节。而在CvMat结构中，由于行数所占的内存要求为4字节的整数倍，所以OpenCV会在每一行的结尾添2个空字节，于是每一行所占的内存为32个字节。

与CvMat类似，图像结构IplImage中，元素widthStep表示图像中行的长度，单位为字节，且也必须为4字节的整数倍。如果实际长度不是4字节的整数倍，则在每一行的结尾设置冗余字节，使其为4字节的整数倍。

4. 理解CvMat结构中指向数据体的指针

在CvMat中，指向数据体的指针被设置为union类型：

union{

uchar* ptr;

short* s;

int* i;

float* f;

double* db;

}data;

虽然每一个指针变量长度都一样（4字节），但它代表了对数据体的解释方法。例如：data.ptr表示数据体为uchar型，data.s表示数据体为short型等等。若有一个CV_32FC3型二维数组mat，指向第i行的指针可以用以下语句来表示：

float* ptr = (float*) (mat->data.ptr+mat->step*i);

或者 float* ptr = mat->data.fl+mat->step/sizeof(float)*i;

前一种方法首先将数据看成uchar型，加入偏移量后将指向数据体的指针强制转换为float*型。由于uchar型数据只占一个字节，和step的单位一致，所以偏移量为step*i；

后一种方法直接将数据看成float型然后加入偏移量。由于float数据所占的字节数为sizeof(float)，所以偏移量为step/sizeof(float)*i，其中，每行的偏移量为step/sizeof(float)。

与CvMat不同的是，在图像结构IplImage中，指向图像数据的指针imageData总是uchar*型的。所以在图像数据进行指针运算的时候，可以直接增加widthStep个单位。而不必关心实际数据类型。总之，“当要处理的是矩阵时，必须对偏移量进行调整，因为数据指针可能是非字节类型；当要处理的是图像时，可以直接使用偏移，因为数据指针总是字节类型。”（《学习OpenCV》中文版P51）

0 0