C语言开发之变量与常量

来源:互联网 发布:网页美工金典案例教程 编辑:程序博客网 时间:2024/05/01 06:46

 数据类型包含两方面的内容:数据的表示和对数据加工的操作。数据的全部可能表示构成数据类型的值的集合。数据全部合理的操作构成数据类型的操作集合。在C语言中,把整型、实型和字符型称为基本数据类型,又称整型和实型为数值型。为了描述更复杂的数据结构,C语言还有构造类型、指针类型、枚举类型和空类型。构造类型是指由若干个相关的数据组合在一起形成的一种复杂数据类型。在编程过程中,不同的CPU,其数据类型的意义各不相同,所以一定要注意相应变量数据类型的定义和转换,否则在计算中可能会出现不确定的错误。

变量与常量

正所谓静中有动,动中有静,常量与变量亦是如此,它们之前相互依赖,相互影响。关于常量与变量,很多朋友可能觉得没有什么好介绍的,它实在是太简单了,单从字面上看就知道什么意思?我想说的不是关于常量与变量的概念,而是其深入的实质。

其实很多朋友在学到后面指针的时候经常会出现,段错误,晕指针(我对那些指针恐惧者的症状叫法),野指针等问题,都是因为对常量和变量的理解不够深入,基础理解不够踏实。

变量

什么是变量

其值在其作用域内可以改变的量称为变量。一个变量应该有一个名字,在内存中占据一定的存储空间。变量在使用前必须要定义。每个变量都有自己的地址。变量依据其定义的类型,分为不同类型,如:整型变量,字符型变量,浮点型变量,指针型变量等等。变量其值可以发生改变,意味着它可以被覆盖,被写入,被赋值。每个变量必须要有一个名字和它所在内存空间绑定,如图2.2.1所示

图2.2.1

代码中声明整型变量a,它的类型已经决定,那么它的大小也就是4个字节(32位机上),那么在内存中就有连续的四个字节与之对应,a变量名就代表了这四个字节的空间,a变量的地址就是连续四个字节的开始的地址0x000。就好像是饭店里每个房间都有一个地址,如201室代表二楼每一个房间,叫201不太雅观,我们起个名字叫:牡丹厅。那么,我们人为的将“牡丹厅”这个名字和201房间绑定在了一起。当我们说到牡丹厅,就知道是201房间,同样当我们说201房间我们也知道是牡丹厅。

同样的道理,当我们说a变量,就知道是从0x000这个地址开始的4个字节,当我们说0x000地址就知道这是a变量的空间。那么既然a是变量也就是说它所代表的空间里的数据是可以修改的,同样0x000地址处的数据也是可以修改的。

变量名和变量值

变量名是在变量的声明的时候,该名字就和内存中一块地址绑定在一起了。可以通过变量名直接找到对应的内存区域,也可以通过地址找到其内存区域。

变量的值是变量所对应的内存区域内存放的二进制序列。变量的值不会因为变量的类型发生了改变而改变,当变量被转换为对应类型时,内存区域的二进制序列以该类型的形式翻译出来。这也是强制类型转换能够成立的原因。

例如:

int a = 97; 

char ch1 = ‘a’; 

char ch2 = (char)a; 

char *p = (char*)a;

 

1)   第一行代码:整型变量a在内存中是以97的二进制形式存放的,当使用它时,会被以十进制形式表现出来。

2)   第二行代码:字符变量ch1的ASCII 码是97,也是以97的二进制存放的,使用时,会被以字符’a’的形式表现出来。

3)   第三行代码:将整型变量a强制类型转换成字符型,a变量里的值没有变,变的是它的类型,它里面的值还是97的二进制,它类型变成了char,97的二进制变成char型,表现出来就是字符’a’。

4)   第四行代码:声明一个字符型指针变量p,p是个变量,它里面的值可变,它的值是整型变量a的值强制类型转换成了字符指针类型。这个时候p里的值还是97的二进制,只不过这个97的意义已经代表了一个字符型指针,也就是一个指向字符的地址了。

由此可见:变量在内存中存放和它的值没有关系,而是和它的类型相关的。同样我们也可以得出:一个二进制序列对于计算机本身而言没有任何意义,计算机根本不知道这个二进制数据是干什么的,只有具体到它的类型时或出现在合适的场合时,才能代表具体的意义。如果一串二进制数据出现在地址总线上,它代表是一个地址,如果该相同数据出现在数据总线上,它代表是一个数据。所以,当我们看到一个数据时,比如:3.1415926,不能把它戴上定向思维的帽子认为它就是PI,而是要看清它的本质,它就是一堆二进制代码。

我们来看下下面的例子:

1.text1.c

char ch = ‘a’;

int a = (int)ch;

printf(“%d %c\n”, a, ch);

ch是什么?ch里装的是什么?a是什么?a里面装的是什么?打印什么?

2.text2.c

int add = 0x12345678;

int *p = (int*)add;

add是什么?add里装的是什么?p是什么?p里装的是什么?*p又是什么?&p又是什么?

3.text3.c

#define PI 3.14

int a = PI;

printf(“%d\n”, a);

上面的代码有没有问题?

4.text4.c

#define PI 3.14

printf(“%d\n”, PI);

代码有没有问题?

5.text5.c

#define PI 3.14

int a = PI;

PI = 3.1415926;

int b = PI;

printf(“%d %d\n”, a, b);

代码有没有问题?

6.text6.c

char *str = “hello world”;

printf(“%s\n”, str);

*str = “goodbye world”;

printf(“%s\n”, str);

代码有没有问题?

1.       测试对变量类型的理解和类型转换。ch是字符型变量,ch里是字符’a’的二进制数,a是整型变量,a里面是字符’a’的二进制数的整型表示方式,以十进制数表示出来97。打印结果为97 和 a。

2.       测试对整型和地址类型转换。add是一个整数变量,add里是0x12345678的二进制数,以十进制表现出来,p是一个整型指针变量名,p里面是0x12345678的二进制数,以地址的方式表现出来,代表地址0x12345678。*p是通过*去访问地址0x12345678这个地址处的数据(如果你试图去打印它,会出错,因为这个地址你不一定有权限去访问)。&p是取出整型指针变量p的地址,因为p是一个变量,它也有自己的地址,所以可以取出它的地址来(见上面变量的定义)。

3.       宏定义一个常量PI,PI这个符号代表了3.14,在代码执行前的预处理阶段第二行int a = PI,已经被替换为了int a = 3.14,将3.14赋值给整型,会舍弃掉小数点后面部分结果,仅保留整数部分,打印结果为3。

4.       和上面3一样,在预处理阶段被替换成了printf(“%d\n”, 3.14),结果为1374389535,这是因为将浮点型的3.14在内存中的数据,以整型来表现的。

5.       第三行PI = 3.1415926会出错,PI是个常量其被替换成了3.14 = 3.1415926,3.14是个字面常量,不能被赋值。错误信息为“向无效左值赋值出错”(关于常见错误信息,见C语言常见错误详解章节)。

6.       第三行*str = “goodbye world”出错,第一行中将字符串常量“hello world”的首地址给了字符指针变量str,第三行试图将“goodbye world”的首地址,通过*str的访问方式覆盖str指向的字符串常量“hello world”。这句话理解起来都比较费劲,因为这里有两个错误:

  •  试图向常量里写数据。

              “hello world” 是字符串常量,那么这个字符串空间里的内容不能改变。

  • 指针变量里应该放地址,字符串都是以首地址为地址。

              向一个地址里写入字符串应该使用strcpy。*str只是代表了str指向的字符串中的第一个字符,将字符串地址写入到一个字符里肯定不行。

局部变量和全局变量

函数形参变量只在被调用期间才分配内存单元,调用结束立即释放。这一点表明形参变量只有在函数内才是有效的,离开该函数就不能再使用了。这种变量有效性的范围称变量的作用域。不仅对于形参变量,C语言中所有的量都有自己的作用域。变量说明的方式不同,其作用域也不同。C语言中的变量,按作用域范围可分为两种,即局部变量和全局变量。

1.         局部变量

局部变量也称为内部变量。局部变量是在函数内作定义说明的。其作用域仅限于函数内,离开该函数后再使用这种变量是非法的。

例如:

    int f1(int a)        /*函数f1*/

    {

        int b,c;    

        ……

}

a,b,c有效

    int f2(int x)        /*函数f2*/

    {

        int y,z;

……

}

x,y,z有效

    int main()

    {

int m,n;

……

    }

m,n有效

在函数f1内定义了三个变量,a为形参,b,c为一般变量。在 f1的范围内a,b,c有效,或者说a,b,c变量的作用域限于f1内。同理,x,y,z的作用域限于f2内。m,n的作用域限于main函数内。

关于局部变量的作用域还要说明以下几点:

1)         主函数中定义的变量也只能在主函数中使用,不能在其它函数中使用。同时,主函数中也不能使用其它函数中定义的变量。因为主函数也是一个函数,它与其它函数是平行关系。这一点是与其它语言不同的,应予以注意。

2)         形参变量是属于被调函数的局部变量,实参变量是属于主调函数的局部变量。

3)         允许在不同的函数中使用相同的变量名,它们代表不同的对象,分配不同的单元,互不干扰,也不会发生混淆。如在前例中,形参和实参的变量名都为n,是完全允许的。

4)         在复合语句中也可定义变量,其作用域只在复合语句范围内。

例如:

    int main()

    {

        int s,a;

        ……

    {

        int b;

        s=a+b;

        ……                 /*b作用域*/

    }

    ……                   /*s,a作用域*/

}

 

int main()

{

    int i=2,j=3,k;

    k=i+j;

    {

      int k=8;

      printf("%d\n",k);

    }

    printf("%d\n",k);

}

本程序在main中定义了i,j,k三个变量,其中k未赋初值。而在复合语句内又定义了一个变量k,并赋初值为8。应该注意这两个k不是同一个变量。在复合语句外由main定义的k起作用,而在复合语句内则由在复合语句内定义的k起作用。因此程序第4行的k为main所定义,其值应为5。第7行输出k值,该行在复合语句内,由复合语句内定义的k起作用,其初值为8,故输出值为8,第9行输出i,k值。i是在整个程序中有效的,第7行对i赋值为3,故以输出也为3。而第9行已在复合语句之外,输出的k应为main所定义的k,此k值由第4 行已获得为5,故输出也为5。

2.         全局变量

全局变量也称为外部变量,它是在函数外部定义的变量。它不属于哪一个函数,它属于一个源程序文件。其作用域是整个源程序。在函数中使用全局变量,一般应作全局变量说明。只有在函数内经过说明的全局变量才能使用。全局变量的说明符为extern。但在一个函数之前定义的全局变量,在该函数内使用可不再加以说明。例如:

    int a,b;          /*外部变量*/

    void f1()         /*函数f1*/

    {

      ……

    }

    float x,y;        /*外部变量*/

    int fz()          /*函数fz*/

    {

      ……

    }

    int main()        /*主函数*/

    {

      ……

    }

从上例可以看出a、b、x、y 都是在函数外部定义的外部变量,都是全局变量。但x,y 定义在函数f1之后,而在f1内又无对x,y的说明,所以它们在f1内无效。a,b定义在源程序最前面,因此在f1,f2及main内不加说明也可使用。

如果同一个源文件中,外部变量与局部变量同名,则在局部变量的作用范围内,外部变量被“屏蔽”,即它不起作用。

 

常量

其值不会发生改变的量,称为常量。它们可以和数据类型接合起来分类。比如:整形常量,浮点型常量,字符常量等等,常量是可以不经过定义和初始化,而直接引用的。常量又分为:直接常量和符号常量,直接常量又叫做:字面常量。如1204.6’a’”abcd”;符号常量:如宏定义的:#define PI 3.14

常量的值在其作用域内不会发生改变,也不能再被赋值。其在出现时就被当作一个立即数来使用。也就是说,只能被访问,被读,而不能被写,被赋值。

其实,你一旦声明了一个常量,那么常量所在的内存空间就被加上了只读的属性,它有点类似于const关键字。

基本内置类型

在C语言中,把整型、实型和字符型称为基本数据类型,又称整型和实型为数值型。为了描述更复杂的数据结构,C语言还有构造类型、指针类型、枚举类型和空类型。构造类型是指由若干个相关的数据组合在一起形成的一种复杂数据类型。

1)         整型

整型数据按其存储在内存中的二进位信息的最高位是当作数值信息位还是当作数据的符号位,将整型数据分成带符号整型和无符号整型两种。每种整型又按所需的字节个数的多少分成三种。所以整型共有6种:

带符号整型(int)、带符号短整型(short int)、带符号长整型(long int,或 long)、无符号整型(unsigned int)、无符号短整型(unsigned short int)以无符号长整型(unsigned long)。

2)         实型

实型数据有表示范围和精度两个不同的特征,为了适应数的范围和精度的不同要求,实型数据分三种类型:单精度型(也称浮点型 float)、双精度型(double)、长双精度型(long double)。

3)         构造类型

构造类型是指由若干个相关的数据组合在一起形成的一种复杂数据类型,构造数据类型的成分数据可以是基本数据类型的,也可以是别的构造类型的。按构造方式和构造要求区分,构造类型主要有数组类型、结构类型和共用类型。数组类型是由相同类型的数据组成;结构类型可以由不同类型的数据组成;当不同数据类型不会同时使用时,以节约内存,让不同数据占用同一区域,这就是共用类型。

4)         指针类型

指针类型是取程序对象(如变量)在内存中占居的地址为值的一种特殊的数据类型。

5)         枚举类型

当变量只取很少几种可能的值,并分别用标识符对值命名时,这种变量的数据类型可用枚举类型来表示。如变量表示一个星期中的某一天,就可用校举类型描述该变量的类型,并以星期见的英文名对日期命名,对应的变量取某日的星期名称为其值。

6)         void类型

用保留字void表示的数据类型有两种完全相反的意思,或表示没有数据(没有结果、没有形式参数),或表示某种任意类型的数据(如又与指针结合,用 void。标记)。 void表示空类型,void。表示任意数据的指针类型,程序如要使用 void。类型的数据,应该将它强制地转换成某种具体的指针类型。

2.4.1数据类型大小

类型说明符

数的范围

字节数

int

即-231~(231-1)

4

unsigned int

0~65535              即0~(216-1)

2

short int

-32768~32767           即-215~(215-1)

2

unsigned short int

0~65535              即0~(216-1)

2

long int

-2147483648~2147483647即-231~(231-1)

4

unsigned long

0~4294967295         即0~(232-1)

4

 

 

 

 

 

 

 

 

 

 

陷阱之有符号与无符号

  我们知道计算机底层只认识0、1.任何数据到了底层都会变计算转换成0、1.那负数怎么

存储呢?肯定这个“-”号是无法存入内存的,怎么办?很好办,做个标记。把基本数据类

型的最高位腾出来,用来存符号,同时约定如下:最高位如果是1,表明这个数是负数,其

值为除最高位以外的剩余位的值添上这个“-”号;如果最高位是0,表明这个数是正数,

其值为除最高位以外的剩余位的值。

这样的话,一个32位的signed int类型整数其值表示法范围为:- 231~231 -1;8 位的

char类型数其值表示的范围为- 27~27 -1。一个32位的unsigned int类型整数其值表示法

范围为:0~ 232 -1;8位的char类型数其值表示的范围为0~28 -1。同样我们的signed 关

键字也很宽宏大量,你也可以完全当它不存在,编译器缺省默认情况下数据为signed 类型

的。

  上面的解释很容易理解,下面就考虑一下这个问题:

int main()

{

char a[1000];

int i;

for(i=0; i<1000; i++)

{

a[i] = -1-i;

}

printf("%d",strlen(a));

return 0;

}

此题看上去真的很简单,但是却鲜有人答对。答案是255。别惊讶,我们先分析分析。for 循环内,当i 的值为0 时,a[0]的值为-1。关键就是-1 在内存里面如何存储。我们知道在计算机系统中,数值一律用补码来表示(存储)。主要原因是使用补码,可以将符号位和其它位统一处理;同时,减法也可按加法来处理。另外,两个用补码表示的数相加时,如果最高位(符号位)有进位,则进位被舍弃。正数的补码与其原码一致;负数的补码:符号位为1,其余位为该数绝对值的原码按位取反,然后整个数加1。按照负数补码的规则,可以知道-1 的补码为0xff,-2 的补码为0xfe……当i 的值为127时,a[127]的值为-128,而-128 是char 类型数据能表示的最小的负数。当i 继续增加,a[128]

的值肯定不能是-129。因为这时候发生了溢出,-129 需要9 位才能存储下来,而char 类型数据只有8 位,所以最高位被丢弃。剩下的8 位是原来9 位补码的低8 位的值,即0x7f。当i 继续增加到255 的时候,-256 的补码的低8 位为0。然后当i 增加到256 时,-257 的补码的低8 位全为1,即低八位的补码为0xff,如此又开始一轮新的循环……按照上面的分析,a[0]到a[254]里面的值都不为0,而a[255]的值为0。strlen 函数是计算字符串长度的,并不包含字符串最后的‘\0’。而判断一个字符串是否结束的标志就是看是否遇到‘\0’。如果遇到‘\0’,则认为本字符串结束。分析到这里,strlen(a)的值为255 应该完全能理解了。这个问题的关键就是要明白char类型默认情况下是有符号的,其表示的值的范围为[-128,127],超出这个范围的值会产生溢出。另外还要清楚的就是负数的补码怎么表示。弄明白了这两点,这个问题其实就很简单了。

2.5声明与定义

什么是定义?什么是声明?它们有何区别?

举个例子:

A)int i

B)extern int i;(关于extern,后面解释)

哪个是定义?哪个是声明?或者都是定义或者都是声明?我所教过的学生几乎没有一人能回答上这个问题。这个十分重要的概念在大学里从来没有被提起过!

定义

什么是定义:所谓的定义就是(编译器)创建一个对象,为这个对象分配一块内存并给它取上一个名字,这个名字就是我们经常所说的变量名或对象名。但注意,这个名字一旦和这块内存匹配起来(可以想象是这个名字嫁给了这块空间,没有要彩礼啊。^_^),它们就同生共死,终生不离不弃。并且这块内存的位置也不能被改变。一个变量或对象在一定的区域内(比如函数内,全局等)只能被定义一次,如果定义多次,编译器会提示你重复定义同一个变量或对象。

声明

什么是声明:有两重含义,如下:

1)         第一重含义:告诉编译器,这个名字已经匹配到一块内存上了,下面的代码用到变量或对象是在别的地方定义的。声明可以出现多次。

2)         第二重含义:告诉编译器,我这个名字我先预定了,别的地方再也不能用它来作为变量名或对象名。比如你在图书馆自习室的某个座位上放了一本书,表明这个座位已经有人预订,别人再也不允许使用这个座位。其实这个时候你本人并没有坐在这个座位上。这种声明最典型的例子就是函数参数的声明,例如:void fun(int i, char c);

好,这样一解释,我们可以很清楚的判断:A)是定义;B)是声明。那他们的区别也很清晰了。