笔试常考--C/C++语言void及void指针深层探索

来源:互联网 发布:云南规培网络课程 编辑:程序博客网 时间:2024/04/30 04:07
1.概述

  许多初学者对C/C++语言中的void及void指针类型不甚理解,因此在使用上出现了一些错误。本文将对void关键字的深刻含义进行解说,并详述void及void指针类型的使用方法与技巧。

  2.void的含义

  void的字面意思是“无类型”,void *则为“无类型指针”,void *可以指向任何类型的数据。

  void几乎只有“注释”和限制程序的作用,因为从来没有人会定义一个void变量,让我们试着来定义:

void a;

  这行语句编译时会出错,提示“illegal use of type 'void'”。不过,即使void a的编译不会出错,它也没有任何实际意义。

  void真正发挥的作用在于:

  (1)对函数返回的限定;

  (2)对函数参数的限定。

  我们将在第三节对以上二点进行具体说明。

  众所周知,如果指针p1和p2的类型相同,那么我们可以直接在p1和p2间互相赋值;如果p1和p2指向不同的数据类型,则必须使用强制类型转换运算符把赋值运算符右边的指针类型转换为左边指针的类型。

  例如:

float *p1;
int *p2;
p1 = p2;

  其中p1 = p2语句会编译出错,提示“'=' : cannot convert from 'int *' to 'float *'”,必须改为:

p1 = (float *)p2;

  而void *则不同,任何类型的指针都可以直接赋值给它,无需进行强制类型转换:

void *p1;
int *p2;
p1 = p2;

  但这并不意味着,void *也可以无需强制类型转换地赋给其它类型的指针。因为“无类型”可以包容“有类型”,而“有类型”则不能包容“无类型”。道理很简单,我们可以说“男人和女人都是人”,但不能说“人是男人”或者“人是女人”。下面的语句编译出错:

void *p1;
int *p2;
p2 = p1;

  提示“'=' : cannot convert from 'void *' to 'int *'”。
3.void的使用

  下面给出void关键字的使用规则:

  规则一如果函数没有返回值,那么应声明为void类型

  在C语言中,凡不加返回值类型限定的函数,就会被编译器作为返回整型值处理。但是许多程序员却误以为其为void类型。例如:

add ( int a, int b )
{
return a + b;
}
int main(int argc, char* argv[])
{
printf ( "2 + 3 = %d", add ( 2, 3) );
}

  程序运行的结果为输出:

  2 + 3 = 5

  这说明不加返回值说明的函数的确为int函数。

  林锐博士《高质量C/C++编程》中提到:“C++语言有很严格的类型安全检查,不允许上述情况(指函数不加类型声明)发生”。可是编译器并不一定这么认定,譬如在Visual C++6.0中上述add函数的编译无错也无警告且运行正确,所以不能寄希望于编译器会做严格的类型检查。

  因此,为了避免混乱,我们在编写C/C++程序时,对于任何函数都必须一个不漏地指定其类型。如果函数没有返回值,一定要声明为void类型。这既是程序良好可读性的需要,也是编程规范性的要求。另外,加上void类型声明后,也可以发挥代码的“自注释”作用。代码的“自注释”即代码能自己注释自己。

  规则二如果函数无参数,那么应声明其参数为void

  在C++语言中声明一个这样的函数:

int function(void)
{
return 1;
}

  则进行下面的调用是不合法的:

function(2);

  因为在C++中,函数参数为void的意思是这个函数不接受任何参数。

  我们在Turbo C 2.0中编译:

#include "stdio.h"
fun()
{
return 1;
}
main()
{
printf("%d",fun(2));
getchar();
}

  编译正确且输出1,这说明,在C语言中,可以给无参数的函数传送任意类型的参数,但是在C++编译器中编译同样的代码则会出错。在C++中,不能向无参数的函数传送任何参数,出错提示“'fun' : function does not take 1 parameters”。

  所以,无论在C还是C++中,若函数不接受任何参数,一定要指明参数为void。

  规则三小心使用void指针类型

  按照ANSI(American National Standards Institute)标准,不能对void指针进行算法操作,即下列操作都是不合法的:

void * pvoid;
pvoid++; //ANSI:错误
pvoid += 1; //ANSI:错误
//ANSI标准之所以这样认定,是因为它坚持:进行算法操作的指针必须是确定知道其指向数据类型大小的。
//例如:
int *pint;
pint++; //ANSI:正确

  pint++的结果是使其增大sizeof(int)。

  但是大名鼎鼎的GNU(GNU's Not Unix的缩写)则不这么认定,它指定void *的算法操作与char *一致。

  因此下列语句在GNU编译器中皆正确:

pvoid++; //GNU:正确
pvoid += 1; //GNU:正确

  pvoid++的执行结果是其增大了1。

  在实际的程序设计中,为迎合ANSI标准,并提高程序的可移植性,我们可以这样编写实现同样功能的代码:

void * pvoid;
(char *)pvoid++; //ANSI:正确;GNU:正确
(char *)pvoid += 1; //ANSI:错误;GNU:正确

  GNU和ANSI还有一些区别,总体而言,GNU较ANSI更“开放”,提供了对更多语法的支持。但是我们在真实设计时,还是应该尽可能地迎合ANSI标准。

  规则四如果函数的参数可以是任意类型指针,那么应声明其参数为void *

  典型的如内存操作函数memcpy和memset的函数原型分别为:

void * memcpy(void *dest, const void *src, size_t len);
void * memset ( void * buffer, int c, size_t num );

  这样,任何类型的指针都可以传入memcpy和memset中,这也真实地体现了内存操作函数的意义,因为它操作的对象仅仅是一片内存,而不论这片内存是什么类型。如果memcpy和memset的参数类型不是void *,而是char *,那才叫真的奇怪了!这样的memcpy和memset明显不是一个“纯粹的,脱离低级趣味的”函数!

  下面的代码执行正确:

//示例:memset接受任意类型指针
int intarray[100];
memset ( intarray, 0, 100*sizeof(int) ); //将intarray清0
//示例:memcpy接受任意类型指针
int intarray1[100], intarray2[100];
memcpy ( intarray1, intarray2, 100*sizeof(int) ); //将intarray2拷贝给intarray1

  有趣的是,memcpy和memset函数返回的也是void *类型,标准库函数的编写者是多么地富有学问啊!

  规则五 void不能代表一个真实的变量

  下面代码都企图让void代表一个真实的变量,因此都是错误的代码:

void a; //错误
function(void a); //错误

  void体现了一种抽象,这个世界上的变量都是“有类型”的,譬如一个人不是男人就是女人(还有人妖?)。

  void的出现只是为了一种抽象的需要,如果你正确地理解了面向对象中“抽象基类”的概念,也很容易理解void数据类型。正如不能给抽象基类定义一个实例,我们也不能定义一个void(让我们类比的称void为“抽象数据类型”)变量。

  4.总结

  小小的void蕴藏着很丰富的设计哲学,作为一名程序设计人员,对问题进行深一个层次的思考必然使我们受益匪浅


发表于 @ 2006年10月04日 01:40:00 | 评论 (0)


C++启蒙之编写简单的C++程序


每个C++程序都包含一个或多个函数(function),其中的一个函数的名称必须是main。一个函数由一系列执行函数功能的语句(statement)组成。操作系统通过调用main函数来执行程序。这个函数执行它的组成语句并给操作系统返回一个值。

  下面是一个简单的main函数,它没有返回值:

int main()
{
return 0;
}

  操作系统利用main函数返回的值判断程序执行成功还是失败。返回0表明成功了。

  Main函数很特殊,其中最重要的是这个函数必须存在于每个C++程序中,而且它是操作系统明确调用的唯一一个函数。

  我们定义main函数的方式与定义其它函数是一样的。函数定义说明了四个部分:返回类型、函数名称、括号中带有的参数列表(可能为空)和函数主体。Main函数可能包含一组参数。在上面的定义中,参数列表是空的。

  上面的main函数需要一个int类型的返回类型,它表示整型。整型是内建的(built-in)类型,这意味着这种类型是语言所定义的。

  函数定义的最后一部分(函数主体),是一组以波浪括号(curly brace)开始,以波浪反括号结束的语句块:

{
return 0;
}

  我们的程序中的唯一一条语句是return,它是用于终止函数的语句。

  注意

  请注意return语句后面的分号。在C++中分号标志着大多数语句的结束。它们容易被忽略,如果忘记了可能导致难以理解的编译器错误信息。

  当return包含一个值(例如0)的时候,这个值就是函数的返回值。返回值的类型必须与函数的返回类型相同或者必须能够转换成那种类型。在例子中main的返回类型是整型,而值0也是整型的。

  在大多数系统中,main的返回值是状态标识。返回值为0表明main成功执行了。其它的返回值的意义由操作系统来定义。通常非0的返回值表明发生了错误。每个操作系统都由自身的、用于告诉用户main函数返回值的途径。

  1、编译和执行程序

  我们在编写程序之后需要编译它。编译程序的方法依赖于操作系统和编译器。如果你想了解编译器工作的细节信息,那么需要查看参考或者求助同事。

  很多基于PC的编译器都在集成开发环境(IDE)中运行,同时它还绑定了相关的建立和分析工具。这些环境对于开发复杂的程序有很大的帮助,但是需要我们花大量的时间来学习如何高效率地使用它们。很多环境都包含了鼠标指向和点击(point-and-click)界面,它允许程序员编写程序并使用多种菜单来编译和运行程序。本文没有介绍这一方面的内容。

  很多编译器(包括随着IDE发布的),提供了命令行接口。除非你对编译器IDE的使用非常熟悉,否则使用命令行接口更加容易使用编译器。使用命令行接口可以避免在学习某种语言之前需要先学习IDE的开销。

  程序源文件命名习惯

  无论使用命令行接口还是IDE,大多数编译器都希望被编译的程序存储在文件中。程序文件一般称为源文件。在大多数系统中,源文件的名称包含两个部分--文件名(例如prog1)和扩展名。按照习惯,扩展名表明该文件是一个程序。扩展名通常表明了程序是用哪种语言编写的,应该选择哪种编译器来运行。我们用来编译本文中的示例文件的系统把扩展名.CC作为C++程序,因此我们把程序保存为:prog1.cc

  C++程序文件的扩展名依赖于你所使用的编译器。其它一些命名习惯还包括:

prog1.cxx
prog1.cpp
prog1.cp
prog1.C

  调用GNU或微软编译器

  在不同的编译器和操作系统上,用来调用C++编译器的命令是不同的。大多数普通的编译器都是GNU编译器和微软Visual Studio编译器。在默认情况下,调用GNU编译器的命令是g++:

$ g++ prog1.cc -o prog1

  其中$是系统提示符。这个命令产生一个叫做prog1或者prog1.exe的可执行文件(依赖于操作系统)。在UNIX上,可执行文件没有后缀;在Windows上,后缀名是.exe。-o prog1是一个编译器参数,它指定了放置可执行文件的文件名称。如果忽略了这个参数,在Unix系统上,编译器生成一个叫做a.out的可执行文件,在Windows上生成a.exe。

  我们使用cl命令调用微软编译器:

C:/directory> cl -GX prog1.cpp

  其中是C:directory>系统提示符,directory是当前目录的名称。调用编译器的命令是cl,-GX是一个选项,使用命令行接口编译程序的时候需要这个选项。微软编译器自动地生成一个与源文件名对应的可执行文件。这个可执行文件的扩展名是.exe,名称与源文件的名称相同。在这种情况下可执行文件是prog1.exe。你可以查看编译器的用户手册找到更多信息。

  在命令行运行编译器

  如果我们使用命令行接口,那么典型情况下我们会在控制台窗口(例如UNIX系统中的shell窗口或Windows中的命令提示符窗口)中编译程序。假设我们的主程序的程序名称是prog1.cc,我们可以使用下面的命令来编译它:

$ CC prog1.cc

  其中CC调用编译器,$是系统提示符。它的输出是一个可执行文件,我们通过名字调用它。在我们的系统中,编译器生成的可执行文件的名称是a.exe。UNIX可能把它们的可执行文件叫做a.out。如果要运行一个可执行文件,只需要在命令行输入它的名称:

$ a.exe

  执行我们编译过的程序。在UNIX系统中,有时候即使某个文件在当前目录中,你也必须提供该文件所在的目录。在这种情况下,我们应该这样输入:

$ ./a.exe

  后面跟着斜线(/)的"."表明文件位于当前目录中。

  我们需要使用依赖系统的方式来访问Main的返回值。在UNIX和Windows系统中,在执行某个程序之后,你都必须提交适当的echo命令。在UNIX系统中,我们通过下面的命令来获取状态:

$ echo $?

  查看Windows系统中的状态,需要使用:

C:/directory> echo %ERRORLEVEL%

  练习1:

  查看你的编译器的文档,看看它所使用的命名习惯。编译和运行main程序。

  练习2:

  修改程序,使它返回-1。返回-1值通常表明程序执行失败了。但是,不同的系统报告main失败的情况有所不同。重新编译和运行该程序,看看系统如何处理main的失败标志。