extern详解

来源:互联网 发布:陈肇雄 网络强国 编辑:程序博客网 时间:2024/05/16 12:14

C++extern “C”含义深层探索

                                      

   

1.引言

 

C++语言的创建初衷是“a better C”,但是这并不意味着C++中类似C语言的全局变量和函数所采用的编译和连接方式与C语言完全相同。作为一种欲与C兼容的语言,C++保留了一部分过程式语言的特点(被世人称为不彻底地面向对象),因而它可以定义不属于任何类的全局变量和函数。但是,C++毕竟是一种面向对象的程序设计语言,为了支持函数的重载,C++对全局函数的处理方式与C有明显的不同。

 

2.从标准头文件说起

 

 

某企业曾经给出如下的一道面试题:

 

面试题:为什么标准头文件都有类似以下的结构?

 

#ifndef __INCvxWorksh

 

#define __INCvxWorksh

 

#ifdef __cplusplus

 

extern "C" {

 

#endif

 

/*...*/

 

#ifdef __cplusplus

 

}

 

#endif

 

#endif /* __INCvxWorksh */

 

分析

 

显然,头文件中的编译宏“#ifndef __INCvxWorksh#define __INCvxWorksh#endif” 的作用是防止该头文件被重复引用。

 

那么

 

#ifdef __cplusplus

 

extern "C" {

 

#endif

 

#ifdef __cplusplus

 

}

 

#endif

 

的作用又是什么呢?我们将在下文一一道来。

 

3.深层揭密extern "C"

 

 

 

extern "C" 包含双重含义,从字面上即可得到:首先,被它修饰的目标是“extern”的;其次,被它修饰的目标是“C”的。让我们来详细解读这两重含义。

 

extern "C"限定的函数或变量是extern类型的;

 

externC/C++语言中表明函数和全局变量作用范围(可见性)的关键字,该关键字告诉编译器,其声明的函数和变量可以在本模块或其它模块中使用。记住,下列语句:

 

extern int a;

 

仅仅是一个变量的声明,其并不是在定义变量a,并未为a分配内存空间。变量a在所有模块中作为一种全局变量只能被定义一次,否则会出现连接错误。

 

通常,在模块的头文件中对本模块提供给其它模块引用的函数和全局变量以关键字extern声明。例如,如果模块B欲引用该模块A中定义的全局变量和函数时只需包含模块A的头文件即可。这样,模块B中调用模块A中的函数时,在编译阶段,模块B虽然找不到该函数,但是并不会报错;它会在连接阶段中从模块A编译生成的目标代码中找到此函数。

 

extern对应的关键字是static,被它修饰的全局变量和函数只能在本模块中使用。因此,一个函数或变量只可能被本模块使用时,其不可能被extern “C”修饰。

 

extern "C"修饰的变量和函数是按照C语言方式编译和连接的;

 

未加extern “C”声明时的编译方式

 

首先看看C++中对类似C的函数是怎样编译的。

 

作为一种面向对象的语言,C++支持函数重载,而过程式语言C则不支持。函数被C++编译后在符号库中的名字与C语言的不同。例如,假设某个函数的原型为:

 

void foo( int x, int y );

 

该函数被C编译器编译后在符号库中的名字为_foo,而C++编译器则会产生像_foo_int_int之类的名字(不同的编译器可能生成的名字不同,但是都采用了相同的机制,生成的新名字称为“mangled name”)。

 

foo_int_int 这样的名字包含了函数名、函数参数数量及类型信息,C++就是靠这种机制来实现函数重载的。例如,在C++中,函数void foo( int x, int y )void foo( int x, float y )编译生成的符号是不相同的,后者为_foo_int_float

 

同样地,C++中的变量除支持局部变量外,还支持类成员变量和全局变量。用户所编写程序的类成员变量可能与全局变量同名,我们以"."来区分。而本质上,编译器在进行编译时,与函数的处理相似,也为类中的变量取了一个独一无二的名字,这个名字与用户程序中同名的全局变量名字不同。

 

未加extern "C"声明时的连接方式

 

假设在C++中,模块A的头文件如下:

 

// 模块A头文件 moduleA.h

 

#ifndef MODULE_A_H

 

#define MODULE_A_H

 

int foo( int x, int y );

 

#endif

 

在模块B中引用该函数:

 

// 模块B实现文件 moduleB.cpp

 

#include "moduleA.h"

 

foo(2,3);

 

实际上,在连接阶段,连接器会从模块A生成的目标文件moduleA.obj中寻找_foo_int_int这样的符号!

 

extern "C"声明后的编译和连接方式

 

extern "C"声明后,模块A的头文件变为:

 

// 模块A头文件 moduleA.h

 

#ifndef MODULE_A_H

 

#define MODULE_A_H

 

extern "C" int foo( int x, int y );

 

#endif

 

在模块B的实现文件中仍然调用foo( 2,3 ),其结果是:

 

1)模块A编译生成foo的目标代码时,没有对其名字进行特殊处理,采用了C语言的方式;

 

2)连接器在为模块B的目标代码寻找foo(2,3)调用时,寻找的是未经修改的符号名_foo

 

如果在模块A中函数声明了fooextern "C"类型,而模块B中包含的是extern int foo( int x, int y ) ,则模块B找不到模块A中的函数;反之亦然。

 

所以,可以用一句话概括extern “C”这个声明的真实目的(任何语言中的任何语法特性的诞生都不是随意而为的,来源于真实世界的需求驱动。我们在思考问题时,不能只停留在这个语言是怎么做的,还要问一问它为什么要这么做,动机是什么,这样我们可以更深入地理解许多问题):

 

实现C++C及其它语言的混合编程。

 

明白了C++extern "C"的设立动机,我们下面来具体分析extern "C"通常的使用技巧。

 

4.extern "C"的惯用法

 

1)在C++中引用C语言中的函数和变量,在包含C语言头文件(假设为cExample.h)时,需进行下列处理:

 

extern "C"

 

{

 

#include "cExample.h"

 

}

 

而在C语言的头文件中,对其外部函数只能指定为extern类型,C语言中不支持extern "C"声明,在.c文件中包含了extern "C"时会出现编译语法错误。

 

笔者编写的C++引用C函数例子工程中包含的三个文件的源代码如下:

 

/* c语言头文件:cExample.h */

 

#ifndef C_EXAMPLE_H

 

#define C_EXAMPLE_H

 

extern int add(int x,int y);

 

#endif

 

/* c语言实现文件:cExample.c */

 

#include "cExample.h"

 

int add( int x, int y )

 

{

 

return x + y;

 

}

 

// c++实现文件,调用addcppFile.cpp

 

extern "C"

 

{

 

#include "cExample.h"

 

}

 

int main(int argc, char* argv[])

 

{

 

add(2,3);

 

return 0;

 

}

 

如果C++调用一个C语言编写的.DLL时,当包括.DLL的头文件或声明接口函数时,应加extern "C" { }

 

2)在C中引用C++语言中的函数和变量时,C++的头文件需添加extern "C",但是在C语言中不能直接引用声明了extern "C"的该头文件,应该仅将C文件中将C++中定义的extern "C"函数声明为extern类型。

 

笔者编写的C引用C++函数例子工程中包含的三个文件的源代码如下:

 

//C++头文件 cppExample.h

 

#ifndef CPP_EXAMPLE_H

 

#define CPP_EXAMPLE_H

 

extern "C" int add( int x, int y );

 

#endif

 

//C++实现文件 cppExample.cpp

 

#include "cppExample.h"

 

int add( int x, int y )

 

{

 

return x + y;

 

}

 

/* C实现文件 cFile.c

 

/* 这样会编译出错:#include "cExample.h" */

 

extern int add( int x, int y );

 

int main( int argc, char* argv[] )

 

{

 

add( 2, 3 );

 

return 0;

 

}

 

在很多编码规则都有这样一条,变量与函数的声明放在头文件中,它们相应的定义放在源文件中。
可是很多人尤其是初学者对声明和定义分辨不清,觉得声明即是定义,定义即是声明。造成这种混淆
并不奇怪,因为变量在大多数情况下,声明的同时就定义了。
e.g.
//main1.c

int var; //声明的同时也对其定义了

int main(int argc, char **argv[])
{
 ...
}

而如下是纯粹的声明,没有包含定义
e.g.
//main2.c
extern int val; //
仅仅声明这是个外部变量,extern的具体作用在后面讲。
extern int val1 = 1; //
声明并定义外部变量

int main(int argc, char **argv[])
{
 ...
}

而函数的声明与定义也是类似的。而且要更容易区分。
e.g.
//main3.c
void func() //
即是声明也是定义
{
 ...
}

int main(int argc, char **argv[])
{
 ...
 func(); //
可以编译链接
 ...
}

仅仅对函数声明的话,就不需要写函数体,只要声明函数类型以及函数形参的信息就可以了。
e.g.
//main4.c
void func(char); //
仅仅是声明

int main(int argc, char **argv[])
{
 ...
 func(); //
编译可以顺利通过,如果后面没有函数定义的话链接将会失败
 ...
}

void func(char *str) //函数定义,如果此文件中没有这部分定义的话,main中可以编译,但不能链接
{
 ...
}

之所以函数的定义与声明比较好区分是因为函数必须得有函数体编译器才能给它分配空间,而变量仅仅需要要个名字和它的类型编译器就
可以分配空间给它。
所以可以这样说,声明只是告诉编译器声明的变量和函数是存在的,但并没有真正分配空间给它,所以当后面的代码
用到前面声明的变量或函数时,编译器在编译的时候不会报错,但是在链接的时候会报错,因为链接的时候编译器会去
寻找这些变量和函数的内存地址,因为只声明了但没定义,链接器当然找不到它们了,所以就报错了。而对它们进行定义
了的话编译器就会给它们分配空间,它们就有自己的地址了,这时就能链接了。
所以定义是要分配空间的,所以定义只能有一次。而声明不分配空间,你可以声明多次。

extern关键字
我今天写这边短文就是因为有人问我extern的用法,他们知道怎么样extern,但是对extern原理不清楚,知其然不知其所以然。
上面main2.c中的extern int val; 它的作用就是告诉编译器这个变量是在其他文件中定义的(是外援),要是在本文件中
看到它的名字千万别奇怪。编译器是相信自己人的,所以在编译的时候要是看到val变量时会认为它是存在,不会报错。只有在
链接的时候链接器才会去其它obj文件中寻找val变量的定义(地址),找到则顺利链接,否则报错。因为编译器只需要知道extern
声明变量的名字就可以了,所以extern int val 可以写成 extern val(即省略变量类型)
e.g.
//main2.c
extern int val; //
声明val是个外部变量,也可以写成extern val;
int main(int argc, char **argv[])
{
 val = 10;
 ...
}

//another.c
int val;
把这两个文件一起编译链接是没有问题的。
并不是所有的变量都能用extern声明,只有全局变量并且没有被static 声明的变量才能声明为extern.

所以如果你不想自己源文件中全局的变量被其他文件引用,你就可以给变量加上static声明
e.g.
extern val; //
链接的时候会报错,因为val被声明为static.
int main(int argc, char **argv[])
{
 val = 10;
 ...
}

//another.c
static int val;
这也是static全局变量和非static全局变量的唯一的一个区别。

原创粉丝点击