理解C语言——从小菜到大神的晋级之路(8)——数组、指针和字符串

来源:互联网 发布:淘宝店铺可以复制么 编辑:程序博客网 时间:2024/05/29 14:36

       本期视频点击这里


       在前面几次我们接触的数据类型都是简单数据类型,使用一个数据个体表示一个元素。C语言中还提供了多种复杂数据类型,其中最简单的一种就是数组。数组这一结构使用内存中一段连续的内存空间保存一组相同类型的变量,这些变量通过数组的下标/索引的不同相互区分。数组与指针有着十分紧密的联系,通常使用数组下标能实现的操作都可以使用指针完成,而且使用指针的程序通常效率更高。但是指针和数组也存在着一些明显的差别,如果误用将导致错误。另外,C语言中还定义了一种极为常用的特殊的数组——字符串,其本质与字符数组类似,但是又有一些特殊的特性,并且可以使用一些特殊的操作提高对字符串操作的效率。


1、数组的定义和使用


        数组的定义方法同定义变量类似,都是采用数据类型+变量名的方法定义。例如如果希望定义一个包含5个整型数据,数组名为array的数组,则通过以下方式定义:

int array[5];

        数组定义完成后,可以进行初始化操作。数组的初始化有多重方式,可以对数组中所有数据初始化,也可以只初始化前面的几个数据。如果赋初值的个数是确定的,甚至还可以通过初始化类指定数组的大小。例如:

int nArray[5] = {1,2,3,4,5};           //显式初始化数组中所有的元素char cArray[10] = {0};                  //将所有数据初始化为0float fArray[5] = {0, 1.5, -3.87};    //初始化前三个数据,后面的默认为0int nArray[] = {3,2,1};                   //初值指定数组元素的大小

       数组定义和初始化完成后,可以使用数组名和下标来索引数组的元素。数组中起始的元素下标为0,通常称作第0个元素,一个包含n个元素的数组下标最大值为n-1。如对上文定义的nArray,5个元素分别可以用nArray[0]、nArray[1]、nArray[2]、nArray[3]、nArray[4]表示。使用循环来输出每个元素的方法如:

for(int n = 0; n<5; n++){     printf("%d\n", nArray[n]);}

        需要注意的是,数组的读写绝对不可以超过定义的边界。如果数组读写越界,则会导致获取数据错误甚至程序崩溃。


2、数组和指针的关系


        几乎所有的数组数据都可以用对应类型的指针进行操作,甚至在很多场合,指针和数组本质上起的作用就是一致的。究其根本原因在于,一个数组的数组名,本身就是一个指针常量,其值为数组第一个元素的地址。
例如我们定义一个数组,并定义一个指针指向该数组:
int nArray[10] = {1,4,3,16,25,36,49,64,81,100};int *pArray = nArray;

        这样,由于数组名nArray实际上保存了该数组的首地址,指针变量pArray便指向了数组中第一个元素0。第二条语句实际上等价于:
int *pArray = &nArray[0];

        数组和指针变量的关系如图所示:


        当指针变量指向数组的一个元素后,使用间接运算符就可以获取数组中的元素:
int num = *pArray;     //num = nArray[0];

3、指针遍历数组


        前面我们使用的指针变量,只是研究了其指向地址、获取目标内存单元的数据等最简单的功能,指针变量本身并没有考虑移动的问题。实际上,指针变量也是变量的一种,可以进行相应的运算,只要在指向一串连续的有效内存地址,指针变量可以进行前移和后移运算来遍历内存中的数据,这种特性使得指针变量在编程开发中拥有强大的功能。
        如果我们已经将指针变量pArray指向了数组中某一个特定元素,那么指针pArray+1将指向数组的下一个元素,而pArray-1将指向指针的上一个元素。如下图所示:

        例如,我们将指针变量指向数组中的第4个元素,并将指针变量前后移动:
int *pArray = &nArray[3];     //pArray指向nArray[3];pArray--;                              //pArray向前移动一个单元,指向nArray[2];pArray += 2;                        //pArray向后移动一个单元,指向nArray[4];

        这样,遍历数组中的元素除了使用数组下标之外又多了一种选择——使用指针运算。首先将指针指向数组首地址,随后不断获取指向下一个位置的指针直至数组结束,并通过间接运算符获取指向的数据,即可以实现数组的遍历功能。
int nArray[10] = {1,4,3,16,25,36,49,64,81,100}, *pArray;for(int idx = 0, pArray = nArray; idx < 10; idx++){     printf("%d\n", *(pArray+idx));}

        或者可以使指针变量持续向后移动1位来遍历整个数组:
for(int idx = 0, pArray = nArray; idx < 10; idx++){     printf("%d\n", *(pArray++));}

        实际上,从获取连续内存地址中的某个数据这一功能考虑,数组下标法nArray[n]和指针解引用法*(pArray+n)是等价的,二者大部分时间可以无条件互换。不仅如此,当作为函数的参数时,二者也可以相互调换使用。如以下两个函数的声明,实际上没有任何区别:
void foo(int *pArray);void foo(int nArray[10]);

        需要注意的一点是,使用数组作为参数时,编译器只关注数组名(也就是指向数组的指针)而并不关心数组的长度。只是如果形参数组声明的长度超过了实际值,在运行时可能出现问题,因此应避免。实际上,如果使用数组名作为参数,我们更推荐直接省略数组的长度:
void foo(int nArray[]);

        虽然指针和数组有着诸多相同之处,但是我们决不能忽略二者的本质区别。指针是一个变量,可以进行上文中提到的各种运算(只支持前移、后移等运算;如果两个指针指向同一段数组,还可以根据差值计算距离;对指针进行乘除等运算非法);而数组名是一个常量,自定义之后便不可以改变,更不能进行移动等运算。另外,对数组名利用sizeof运算符求大小得到的是整个数组占内存的大小,而对指针求sizeof得到的是变量本身所占据的长度,通常为4。另外,如果将数组名作为函数参数,子函数内部对这个参数计算sizeof得到的依然是4,这是因为子函数已经把实参数组名转化为了一个指针,因此计算结果与sizeof其他指针变量相同。


4、字符串


(1)字符串的定义


        字符串是C语言的一种数据类型,由多个字符型数据组成。在C语言中,字符串原本都是常量,并且在程序运行时保存在专门的字符串常量区。在我们的代码中可以定义字符型的指针指向一个字符串常量,而后我们就可以在程序中使用该指针表示字符串常量。
int main(){  char * pStr = "hello world!" ;  printf ( "%s\n" , pStr );  return 0 ;}

        在这段代码中,如果视图对指针指向的内容进行修改,那么虽然编译可以顺利通过,但是运行时程序一定会崩溃,因为我们视图向非法的位置写入数据:

int main(){  char * pStr = "hello world" ;  pStr[0] = 'H';     //这行代码将导致程序崩溃  printf ( "%s\n" , pStr );  return 0 ;}

        如果我们希望获得一个我们可以修改的字符串变量,那么我们就必须将字符串赋给一个字符型数组中。然而字符串这一数据类型有其自身的特殊之处,所有字符串的末尾都自动会添加一个\0作为结束符。因此,在为字符串数组赋初值时需格外注意不要遗漏:
char str[12] = {'h','e','l','l','o',' ','w','o','r','l','d','\0'}; //正确,但是太繁琐char str[12] = {'h','e','l','l','o',' ','w','o','r','l','d'};       //正确,当数组长度大于初始化的数据长度时,末尾自动补0,但依旧太繁琐char str[11] = {'h','e','l','l','o',' ','w','o','r','l','d'};       //错误,数组没有留出结束符0的位置来,不是一个完整的字符串char str[12] = "hello world";                              //正确,直接用字符串初始化数组char str[] = "hello world";                                      //推荐最优写法,自动确定数组长度,并补齐结束符0

(2)处理字符串


        在将字符串保存到我们自己定义的数组中之后,处理字符串有多种方法。最基本的方法就是同其他类型的数组一样循环遍历处理,但是这样不但繁琐而且效率较低。对于字符串通常有其他更为方便快捷的方法。

        字符串的输入和输出:
        第一种方法是使用标准输入输出函数printf和scanf,将字符串整体输入和输出。表示字符串的格式说明符为%s:
printf("%s\n", "This is a string.");char str[20];scanf("%s", str);

        使用这种方法输入字符串时,必须注意要分配足够的内存空间保存输入的数据。另外,空格、回车都会被作为字符串结束符处理。
        第二种方法是使用字符串专用的输入和输出函数puts和gets:
puts("Input a string:\n");char str[20];gets(str);puts(str);

        这种方法通常比格式化输入和输出更为方便,而且输入数据时只认回车作为结束符,可以读入空格。
其他字符串处理:
        C语言中并没有对字符串这一类型定义整体的操作符,但是提供了多种字符串操作的库函数:
  • strcpy:字符串拷贝函数
  • strcmp:字符串比较函数
  • strlen:计算字符串长度函数
  • strcat:字符串拼接函数

        值得注意的是,strlen和sizeof的功能不同。sizeof用于计算某一个量在内存中占据的大小,而strlen用于计算字符串的长度。如果将二者对一字符串计算,得到的值可能完全不同。
char *pStr = "String";int string_len = strlen(pStr);          //string_len == 7,字符串中有7个字符int sizeof_pStr = sizeof(pStr);        // sizeof_pStr == 4,指针变量占据4个字节


0 0
原创粉丝点击