【c/c++】C语言main()函数详解

来源:互联网 发布:中世纪2优化9大百科 编辑:程序博客网 时间:2024/05/16 17:03

为什么程序一定要从main函数开始执行?

大多数脚本语言不需要标明程序开始执行的位置,例如Python、Lua。只需把程序语句直接写在源文件中,然后执行该文件。

然而,C与许多编译式语言分开了3个阶段:编译、链接、运行。每个编辑单元(例如多个.c源文件)是各自独立编译成目标文件(例如.o),最后由链接器把这些目标文件链接成可执行程序。

如果C容许在文件的全局域里写语句,若只有一个编译单元时问题不大。但对于多个编译单元,链接器便不知道应先执行哪一个编译单元的全局语句。

其中一种可行的解决办法,就是链接时只容许其中一个编译单元含有全局语句,超过一个就报错。但更简单的做法,是利用不能重复定义函数的机制,若链接时有超过1个main()函数就报错。

使用main()函数这种设计简单解决了上述的链接问题,而且不容许“全局语句”也令语言简单一点。

C++允许利用全局对象在main()执行之前调用构造函数,会造成上述链接器不知先执行哪一段代码的问题。在实际工程上也确实会造成问题,可能需要用singleton或其他方式解决。




简单来说,因为链接时需要用到。

实际上 gcc main.o -o main 是调用 ld 来做链接的,相当于以下的命令:

$ ld /usr/lib/crt1.o /usr/lib/crti.omain.o -o main -lc -dynamic-linker /lib/ld-linux.so.2

main.o 需要和 crt1.o,crti.o这两个目标文件链接在一起,从而生成可执行文件 main。你可以使用 readelf 命令来查看 crt1.o 文件的符号表,就会发现里面有一个 main 符号是未定义的,因此需要别的目标文件提供一个定义并且和 crt1.o 链接在一起(在 crt1.o 中要用到 main 这个符号所代表的地址,而 crt1.o 中的未定义符号 main 在 main.o 中定义了)

事实上,整个可执行程序真正的入口点是crt1.o 中的 _start,而 main 函数是被 _start 调用的。

你写的代码编译后要使用链接器进行链接,总得告诉链接器你的代码从哪里开始执行吧。

 

main函数就是这个约定好的用户代码默认入口。当然,只要你愿意,改成啥都行。比如你改成nomain,那么编译链接时就要指定入口了(同时指定不链接CRT的入口代码)。
P.S. 但是这么做就木有CRT替你做的初始化之类的事情了。P.S. 但是这么做就木有CRT替你做的初始化之类的事情了。

 

C的设计原则是把函数作为程序的构成模块。main()函数称之为主函数,一个C程序总是从main()函数开始执行的

一、main()函数的形式

在最新的 C99 标准中,只有以下两种定义方式是正确的:
int main( void )  /* 无参数形式 */
{
    ...
    return 0;
}

int main( int argc, char *argv[] ) /* 带参数形式 */
{
    ...
    return 0;
}
int指明了main()函数的返回类型,函数名后面的圆括号一般包含传递给函数的信息。void表示没有给函数传递参数。关于带参数的形式,我们等会讨论。
浏览老版本的C代码,将会发现程序常常以。
main()
这种形式开始。C90标准允许这种形式,但是C99标准不允许。因此即使你当前的编译器允许,也不要这么写。
你还可能看到过另一种形式。
void main()
有些编译器允许这种形式,但是还没有任何标准考虑接受它。C++ 之父 Bjarne Stroustrup 在他的主页上的 FAQ 中明确地表示:void main( ) 的定义从来就不存在于 C++ 或者 C 。所以,编译器不必接受这种形式,并且很多编译器也不允许这么写。
坚持使用标准的意义在于:当你把程序从一个编译器移到另一个编译器时,照样能正常运行。

二、main()函数的返回值

从前面我们知道main()函数的返回值类型是int型的,而程序最后的 return 0; 正与之遥相呼应,0就是main()函数的返回值。那么这个0返回到那里呢?返回给操作系统,表示程序正常退出。因为return语句通常写在程序的最后,不管返回什么值,只要到达这一步,说明程序已经运行完毕。而return的作用不仅在于返回一个值,还在于结束函数。

现在我们来做一个小试验(注意:本人的系统是Windows XP, 编译环境是TC)来观察main()函数的返回值。编写如下代码并编译运行:

//a.c
#include "stdio.h"
int main(void)
{
    printf("I love you.");
    return 0;
}
将这个文件保存为a.c,编译运行后会生成一个a.exe文件。现在打开命令提示符,在命令行里运行刚才编译好的可执行文件,然后输入   echo %ERRORLEVEL% ,回车,就可以看到程序返回 一个0 。如果把 return 0; 改为 return 99; ,那么很显然,再次执行上述步骤以后你可以看到程序返回99。要是你这样写 return 99.99; 那还是返回99,因为99.99被传给操作系统之前,被强制类型转换成整数类型了。
现在,我们把a.c改回原来的代码,然后再编写另一个程序b.c:
//b.c
#include "stdio.h"
int main(void)
{
    printf("I’m too.");
    return 0;
}
编译运行后打开命令提示符,在命令行里输入a&&b 回车,这样你就可以看到《人鬼情未了》里面经典的爱情对白:
I love you.
I’m too.
&& 的含义是:如果 && 前面的程序正常退出,则继续执行 && 后面的程序,否则不执行。所以,要是把a.c里面的 return 0; 删除或者改为 return 99; ,那么你只能看到 I love you. 。也就是说,程序b.c就不执行了。现在,大家该明白 return 0; 的作用了吧。

三、main()函数的参数

C编译器允许main()函数没有参数,或者有两个参数(有些实现允许更多的参数,但这只是对标准的扩展)。

这两个参数,一个是int类型,一个是字符串类型。

第一个参数是命令行中的字符串数。按照惯例(但不是必须的),这个int参数被称为argc(argumentcount)。大家或许现在才明白这个形参为什么要取这么个奇怪的名字吧,呵呵!至于英文的意思,自己查字典吧。

第二个参数是一个指向字符串的指针数组。命令行中的每个字符串被存储到内存中,并且分配一个指针指向它。按照惯例,这个指针数组被称为argv(argument value)。系统使用空格把各个字符串格开。一般情况下,把程序本身的名字赋值给argv[0],接着,把最后的第一个字符串赋给argv[1],等等。
现在我们来看一个例子:

//c.c
#include "stdio.h"
int main(int argc, char *argv[])
{
    int count;
    printf("The command line has %d arguments:
", argc - 1);
    for(count = 1; count < argc; count++)
        printf("%d: %s
", count, argv[count]);
    return 0;
}
编译运行,在命令行输入c I love you 回车,下面是从命令行运行该程序的结果:
The command line has 3 arguments:
1:I
2:love
3:you
从本例可以看出,程序从命令行中接受到4个字符串(包括程序名),并将它们存放在字符串数组中,其对应关系:
argv[0]  ------>    c(程序名)
argv[1]  ------>    I
argv[2]  ------>    love
argv[3]  ------>    you
至于argc的值,也即是参数的个数,程序在运行时会自动统计,不必我们操心。
这个例子中,每个字符串都时一个单词(字母),那既然是字符串,要把一句话当作参数赋给程序该怎么办?你可以在命令行里这样输入 c  "I love you."  "I’m too."。程序运行结果:
The command line has 2 arguments:
1:I love you.
2:I’m too.
其对应关系:
argv[0]  ------>    c(程序名)
argv[1]  ------>    I love you.
argv[2]  ------>    I’m too.
要注意的是,你在命令行的输入都将作为字符串形式存储于内存中。也就是说,如果你输入一个数字,那么要输出这个数字,你应该用%s格式而非%d或者其他。
再来看一个例子:
//d.c
#include "stdio.h"
int main(int argc, char *argv[])
{
    FILE *fp;
    fp = fopen(argv[1], "w");
    fputs("I love you.", fp);
    fclose(fp);
    return 0;
}

编译运行,打开命令行并输入d love.txt 回车。这样,打开d.c文件所在的目录,你会发现多了一个名为 love.txt 的文件,打开后里面的内容正是世界上说的最多的那句话。

当然,你可能会说我不需要使用命令行参数就可以做到这些。是的,你当然可以。使用命令行参数的理由或许就是练习命令行用法,以备以后需要编写基于命令行的程序。还有一个好处是,不需要C环境就可以运行已经编译好的程序。比如,你把上面那个程序编译后生成的d.exe发给你的女朋友,再告诉她怎么运行,这样,你的女朋友可以用另一种方式体会到你对她的浓情蜜意。

0 0
原创粉丝点击