C99 柔性数组

来源:互联网 发布:java中属性是什么 编辑:程序博客网 时间:2024/04/30 11:46

转自:http://blog.csdn.net/yby4769250/article/details/7294696

    http://blog.csdn.net/zhangboyj/article/details/6232168

在讲述柔性数组成员之前,首先要介绍一下不完整类型(incomplete type)。不完整类型是这样一种类型,它缺乏足够的信息例如长度去描述一个完整的对象。

6.2.5 Types

incomplete types (types that describe objects but lack information needed to determine their sizes).

 

C与C++关于不完整类型的语义是一样的。

 

前向声明就是一种常用的不完整类型:

class base;

struct test;

 

base和test只给出了声明,没有给出定义。不完整类型必须通过某种方式补充完整,才能使用它们进行实例化,否则只能用于定义指针或引用,因为此时实例化的是指针或引用本身,不是base或test对象。

 

一个未知长度的数组也属于不完整类型:

extern int a[];

 

extern不能去掉,因为数组的长度未知,不能作为定义出现不完整类型的数组可以通过几种方式补充完整才能使用,大括号形式的初始化就是其中一种方式:

int a[] = { 10, 20 };

 

柔性数组成员flexible array member)也叫伸缩性数组成员,它的出现反映了C程序员对精炼代码的极致追求。这种代码结构产生于对动态结构体的需求。在日常的编程中,有时候需要在结构体中存放一个长度动态的字符串,一般的做法,是在结构体中定义一个指针成员,这个指针成员指向该字符串所在的动态内存空间,例如:

 

struct test

{

       int a;

       double b;

       char *p;

};

 

p指向字符串。这种方法造成字符串与结构体是分离的,不利于操作,如果把字符串跟结构体直接连在一起,不是更好吗?于是,可以把代码修改为这样:

 

char a[] = “hello world”;

 

struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );

strcpy( PntTest + 1, a );

 

这样一来,( char* )( PntTest + 1 )就是字符串“hello world”的地址了(已经忽略p)。这时候p成了多余的东西,可以去掉。但是,又产生了另外一个问题:老是使用( char* )( PntTest + 1 )不方便。如果能够找出一种方法,既能直接引用该字符串,又不占用结构体的空间,就完美了,符合这种条件的代码结构应该是一个非对象的符号地址,在结构体的尾部放置一个0长度的数组是一个绝妙的解决方案。不过,C/C++标准规定不能定义长度为0的数组,因此,有些编译器就把0长度的数组成员作为自己的非标准扩展,例如:

 

struct test

{

       int a;

       double b;

       char c[0];

};

 

c就叫柔性数组成员,如果把PntTest指向的动态分配内存看作一个整体,c就是一个长度可以动态变化的结构体成员,柔性一词来源于此。c的长度为0,因此它不占用test的空间,同时PntTest->c就是“hello world”的首地址,不需要再使用( char* )( PntTest + 1 )这么丑陋的语法了。

 

鉴于这种代码结构所产生的重要作用,C99甚至把它收入了标准中:

6.7.2.1 Structure and union specifiers

 

As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called a flexible array member.

 

C99使用不完整类型实现柔性数组成员标准形式是这样的:

 

struct test

{

       int a;

       double b;

       char c[];

};

 

c同样不占用test的空间,只作为一个符号地址存在,而且必须是结构体的最后一个成员。柔性数组成员不仅可以用于字符数组,还可以是元素为其它类型的数组,例如:

 

struct test

 

{

       int a;

       double b;

       float c[];

};

 

应当尽量使用标准形式,在非C99的场合,可以使用指针方法。有些人使用char a[1]这是非常不可取的,把这样的a用作柔性数组成员会发生越界行为,虽然C/C++标准并没有规定编译器应当检查越界,但也没有规定不能检查越界,为了一个小小的指针空间而牺牲移植性,是不值得的。

 

 

柔性数组到底如何使用呢?看下面例子:

typedef struct st_type

{

int i;

int a[0];

}type_a;

有些编译器会报错无法编译可以改成:

typedef struct st_type

{

int i;

int a[];

}type_a;

这样我们就可以定义一个可变长的结构体,用 sizeof(type_a)得到的只有 4,就是
sizeof(i)=sizeof(int)。那个 0 个元素的数组没有占用空间,而后我们可以进行变长操作了。通
过如下表达式给结构体分配内存:
type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));这样我们为结构体指针 p 分配了一块内存。用 p->item[n]就能简单地访问可变长元素。
但是这时候我们再用 sizeof*p)测试结构体的大小,发现仍然为 4是不是很诡异?我们
不是给这个数组分配了空间么?
别急,先回忆一下我们前面讲过的“模子” 。在定义这个结构体的时候,模子的大小就
已经确定不包含柔性数组的内存大小。柔性数组只是编外人员,不占结构体的编制。只是说
在使用柔性数组时需要把它当作结构体的一个成员,仅此而已。再说白点,柔性数组其实与
结构体没什么关系,只是“挂羊头卖狗肉”而已,算不得结构体的正式成员。
需要说明的是:C89不支持这种东西,C99把它作为一种特例加入了标准。但是,C99
所支持的是 incomplete type,而不是 zero array,形同 int item[0];这种形式是非法的,C99支持的形式是形同 int item[];只不过有些编译器把 int item[0];作为非标准扩展来支持,而且在C99发布之前已经有了这种非标准扩展了,C99发布之后,有些编译器把两者合而为一了。当然,上面既然用 malloc函数分配了内存,肯定就需要用 free函数来释放内存:
free(p);
经过上面的讲解,相信你已经掌握了这个看起来似乎很神秘的东西。不过实在要是没
掌握也无所谓,这个东西实在很少用。

 

 

【柔性数组结构成员

  C99中,结构中的最后一个元素允许是未知大小的数组,这就叫做柔性数组成员,但结构中的柔性数组成员前面必须至少一个其他成员。柔性数组成员允许结构中包含一个大小可变的数组。sizeof返回的这种结构大小不包括柔性数组的内存。包含柔性数组成员的结构用malloc ()函数进行内存的动态分配,并且分配的内存应该大于结构的大小,以适应柔性数组的预期大小。】

 

C语言版:

type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));

C++语言版:

type_a *p = (type_a*)new char[sizeof(type_a)+100*sizeof(int)];

 

而释放同样简单:

C语言版:

free(p);

C++语言版:

delete []p;

 


在标准CC++0长数组如charArray[0]是不允许使用的,因为这从语义逻辑上看,是完全没有意义的。

但是,GUN中却允许使用,而且,很多时候,应用在了变长结构体中,如:

StructPacket

{

Int state;

Int len;

Char cData[0]; //这里的0长结构体就为变长结构体提供了非常好的支持

};

 

首先对0长数组做一个解释:

用途 :长度为0的数组的主要用途是为了满足需要变长度的结构体。

用法 :在一个结构体的最后 ,申明一个长度为0的数组,就可以使得这个结构体是可变长的。对于编译器来说,此时长度为0的数组并不占用空间,因为数组名本身不占空间,它只是一个偏移量, 数组名这个符号本身代 表了一个不可修改的地址常量 (注意:数组名永远都不会是指针! ),但对于这个数组的大小,我们可以进行动态分配

 

请仔细理解后半部分,对于编译器而言,数组名仅仅是一个符号,它不会占用任何空间,它在结构体中,只是代表了一个偏移量,代表一个不可修改的地址常量!

 

对于0长数组的这个特点,很容易构造出变成结构体,如缓冲区,数据包等等:

Struct Buffer

{

Int len;

Char cData[0];

};

这样的变长数组常用于网络通信中构造不定长数据包,不会浪费空间浪费网络流量,比如我要发送1024字节的数据,如果用定长包,假设定长包的长度为2048,就会浪费1024个字节的空间,也会造成不必要的流量浪费

Struct packet

{

    char data[2048];

}

packet p;

memcpy(p.data,"1024 datas.........",1024)

send(socket,(char*)&p,sizeof(p));

由于考虑到数据的溢出,变长数据包中的data数组长度一般会设置得足够长足以容纳最大的数据,因此packet中的data数组很多情况下都没有填满数据,因此造成了浪费,而如果我们用变长数组来进行封包的话,就不会造成浪费(最多会造成4个字节的浪费,包头的int型的len不属于数据因此算是浪费),如前面的Buffer结构体,假如我们要发送1024个字节,我们如何构造这个数据包呢:

char *tmp = (char*)malloc(sizeof(Buffer)+1024) //这句代码的作用是申请一块连续的内存空间,这块内存空间的长度是Buffer的大小加上1024数据的大小,由两部分构成,sizeof(Buffer)和1024,如果仔细观察的话,会发现这种申请方法比第一种多了一段sizeof(Buffer)大小的空间,原因何在?如下

Buffer *p = (Buffer*)tmp;

p->len = 1024;

memcpy(p.cData,"1024 datas............",1024);

如上三行代码,首先做一个强制类型转换,Buffer类型的指针指向内存的起始位置,这段内存要分两部分使用,前部分4个字节p->len,作为包头(就是多出来的那部分),这个包头是用来描述紧接着包头后面的数据部分的长度,这里是1024,所以前四个字节赋值为1024(既然我们要构造不定长数据包,那么这个包到底有多长呢,因此,我们就必须通过一个变量来表明这个数据包的长度,这就是len的作用),而紧接其后的内存是真正的数据部分,通过p->cData定位到该部分的起始地址,最后,进行一个memcpy()内存拷贝,把要发送的数据填入到这段内存当中,最后:

send(socket,p,sizeof(Buffer)+1024);发送数据

0 0
原创粉丝点击