C99 柔性数组

来源：互联网发布：java中属性是什么编辑：程序博客网时间：2024/04/30 11:46

转自：http://blog.csdn.net/yby4769250/article/details/7294696

http://blog.csdn.net/zhangboyj/article/details/6232168

在讲述柔性数组成员之前，首先要介绍一下不完整类型（incomplete type）。不完整类型是这样一种类型，它缺乏足够的信息例如长度去描述一个完整的对象。

6.2.5 Types

incomplete types (types that describe objects but lack information needed to determine their sizes).

C与C++关于不完整类型的语义是一样的。

前向声明就是一种常用的不完整类型：

class base;

struct test;

base和test只给出了声明，没有给出定义。不完整类型必须通过某种方式补充完整，才能使用它们进行实例化，否则只能用于定义指针或引用，因为此时实例化的是指针或引用本身，不是base或test对象。

一个未知长度的数组也属于不完整类型：

extern int a[];

extern不能去掉，因为数组的长度未知，不能作为定义出现。不完整类型的数组可以通过几种方式补充完整才能使用，大括号形式的初始化就是其中一种方式：

int a[] = { 10, 20 };

柔性数组成员（flexible array member）也叫伸缩性数组成员，它的出现反映了C程序员对精炼代码的极致追求。这种代码结构产生于对动态结构体的需求。在日常的编程中，有时候需要在结构体中存放一个长度动态的字符串，一般的做法，是在结构体中定义一个指针成员，这个指针成员指向该字符串所在的动态内存空间，例如：

struct test

{

int a;

double b;

char *p;

};

p指向字符串。这种方法造成字符串与结构体是分离的，不利于操作，如果把字符串跟结构体直接连在一起，不是更好吗？于是，可以把代码修改为这样：

char a[] = “hello world”;

struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );

strcpy( PntTest + 1, a );

这样一来，( char* )( PntTest + 1 )就是字符串“hello world”的地址了(已经忽略p)。这时候p成了多余的东西，可以去掉。但是，又产生了另外一个问题：老是使用( char* )( PntTest + 1 )不方便。如果能够找出一种方法，既能直接引用该字符串，又不占用结构体的空间，就完美了，符合这种条件的代码结构应该是一个非对象的符号地址，在结构体的尾部放置一个0长度的数组是一个绝妙的解决方案。不过，C/C++标准规定不能定义长度为0的数组，因此，有些编译器就把0长度的数组成员作为自己的非标准扩展，例如：

struct test

{

int a;

double b;

char c[0];

};

c就叫柔性数组成员，如果把PntTest指向的动态分配内存看作一个整体，c就是一个长度可以动态变化的结构体成员，柔性一词来源于此。c的长度为0，因此它不占用test的空间，同时PntTest->c就是“hello world”的首地址，不需要再使用( char* )( PntTest + 1 )这么丑陋的语法了。

鉴于这种代码结构所产生的重要作用，C99甚至把它收入了标准中：

6.7.2.1 Structure and union specifiers

As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called a flexible array member.

C99使用不完整类型实现柔性数组成员，标准形式是这样的：

struct test

{

int a;

double b;

char c[];

};

c同样不占用test的空间，只作为一个符号地址存在，而且必须是结构体的最后一个成员。柔性数组成员不仅可以用于字符数组，还可以是元素为其它类型的数组，例如：

struct test

{

int a;

double b;

float c[];

};

应当尽量使用标准形式，在非C99的场合，可以使用指针方法。有些人使用char a[1]，这是非常不可取的，把这样的a用作柔性数组成员会发生越界行为，虽然C/C++标准并没有规定编译器应当检查越界，但也没有规定不能检查越界，为了一个小小的指针空间而牺牲移植性，是不值得的。

柔性数组到底如何使用呢？看下面例子：

typedef struct st_type

{

int i;

int a[0];

}type_a;

有些编译器会报错无法编译可以改成：

typedef struct st_type

{

int i;

int a[];

}type_a;

这样我们就可以定义一个可变长的结构体，用 sizeof(type_a)得到的只有 4，就是
sizeof(i)=sizeof(int)。那个 0 个元素的数组没有占用空间，而后我们可以进行变长操作了。通
过如下表达式给结构体分配内存：
type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));这样我们为结构体指针 p 分配了一块内存。用 p->item[n]就能简单地访问可变长元素。
但是这时候我们再用 sizeof（*p）测试结构体的大小，发现仍然为 4。是不是很诡异？我们
不是给这个数组分配了空间么？
别急，先回忆一下我们前面讲过的“模子” 。在定义这个结构体的时候，模子的大小就
已经确定不包含柔性数组的内存大小。柔性数组只是编外人员，不占结构体的编制。只是说
在使用柔性数组时需要把它当作结构体的一个成员，仅此而已。再说白点，柔性数组其实与
结构体没什么关系，只是“挂羊头卖狗肉”而已，算不得结构体的正式成员。
需要说明的是：C89不支持这种东西，C99把它作为一种特例加入了标准。但是，C99
所支持的是 incomplete type，而不是 zero array，形同 int item[0];这种形式是非法的，C99支持的形式是形同 int item[];只不过有些编译器把 int item[0];作为非标准扩展来支持，而且在C99发布之前已经有了这种非标准扩展了，C99发布之后，有些编译器把两者合而为一了。当然，上面既然用 malloc函数分配了内存，肯定就需要用 free函数来释放内存：
free(p);
经过上面的讲解，相信你已经掌握了这个看起来似乎很神秘的东西。不过实在要是没
掌握也无所谓，这个东西实在很少用。

【柔性数组结构成员

　　C99中，结构中的最后一个元素允许是未知大小的数组，这就叫做柔性数组成员，但结构中的柔性数组成员前面必须至少一个其他成员。柔性数组成员允许结构中包含一个大小可变的数组。sizeof返回的这种结构大小不包括柔性数组的内存。包含柔性数组成员的结构用malloc ()函数进行内存的动态分配，并且分配的内存应该大于结构的大小，以适应柔性数组的预期大小。】

C语言版：

type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));

C++语言版:

type_a *p = (type_a*)new char[sizeof(type_a)+100*sizeof(int)];

而释放同样简单：

C语言版：

free(p);

C++语言版：

delete []p;

在标准C和C++中0长数组如charArray[0]是不允许使用的，因为这从语义逻辑上看，是完全没有意义的。

但是，GUN中却允许使用，而且，很多时候，应用在了变长结构体中，如：

StructPacket

{

Int state;

Int len;

Char cData[0]; //这里的0长结构体就为变长结构体提供了非常好的支持

};

首先对0长数组做一个解释：

用途：长度为0的数组的主要用途是为了满足需要变长度的结构体。

用法：在一个结构体的最后，申明一个长度为0的数组，就可以使得这个结构体是可变长的。对于编译器来说，此时长度为0的数组并不占用空间，因为数组名本身不占空间，它只是一个偏移量，数组名这个符号本身代表了一个不可修改的地址常量（注意：数组名永远都不会是指针！），但对于这个数组的大小，我们可以进行动态分配

请仔细理解后半部分，对于编译器而言，数组名仅仅是一个符号，它不会占用任何空间，它在结构体中，只是代表了一个偏移量，代表一个不可修改的地址常量！

对于0长数组的这个特点，很容易构造出变成结构体，如缓冲区，数据包等等：

Struct Buffer

{

Int len;

Char cData[0];

};

这样的变长数组常用于网络通信中构造不定长数据包，不会浪费空间浪费网络流量，比如我要发送1024字节的数据，如果用定长包，假设定长包的长度为2048，就会浪费1024个字节的空间，也会造成不必要的流量浪费

Struct packet

{

char data[2048];

}

packet p;

memcpy(p.data,"1024 datas.........",1024)

send(socket,(char*)&p,sizeof(p));

由于考虑到数据的溢出，变长数据包中的data数组长度一般会设置得足够长足以容纳最大的数据，因此packet中的data数组很多情况下都没有填满数据，因此造成了浪费，而如果我们用变长数组来进行封包的话，就不会造成浪费（最多会造成4个字节的浪费，包头的int型的len不属于数据因此算是浪费），如前面的Buffer结构体，假如我们要发送1024个字节，我们如何构造这个数据包呢：

char *tmp = (char*)malloc(sizeof(Buffer)+1024) //这句代码的作用是申请一块连续的内存空间，这块内存空间的长度是Buffer的大小加上1024数据的大小，由两部分构成，sizeof(Buffer)和1024,如果仔细观察的话，会发现这种申请方法比第一种多了一段sizeof(Buffer)大小的空间，原因何在？如下

Buffer *p = (Buffer*)tmp;

p->len = 1024;

memcpy(p.cData,"1024 datas............",1024);

如上三行代码，首先做一个强制类型转换，Buffer类型的指针指向内存的起始位置，这段内存要分两部分使用，前部分4个字节p->len，作为包头(就是多出来的那部分)，这个包头是用来描述紧接着包头后面的数据部分的长度，这里是1024，所以前四个字节赋值为1024(既然我们要构造不定长数据包，那么这个包到底有多长呢，因此，我们就必须通过一个变量来表明这个数据包的长度，这就是len的作用)，而紧接其后的内存是真正的数据部分，通过p->cData定位到该部分的起始地址，最后，进行一个memcpy()内存拷贝，把要发送的数据填入到这段内存当中，最后：

send(socket,p,sizeof(Buffer)+1024);发送数据

0 0