进程环境

来源：互联网发布：电魂网络与阿里巴巴编辑：程序博客网时间：2024/05/16 01:16

1 main、exit、atexit

C程序总是从main函数开始执行。main函数的原型是：

int main(int argc, char *argv[] );

其中，argc是命令行参数的数目，argv是指向参数的各个指针所构成的数组。当内核起动C程序时(使用一个exec函数)，在调用main前先调用一个特殊的起动例程。可执行程序文件将此起动例程指定为程序的起始地址——这是由连接编辑程序设置的，而连接编辑程序则由C编译程序(通常是cc )调用。起动例程从内核取得命令行参数和环境变量值，然后为调用main函数作好安排。

exit和 _exit函数用于正常终止一个程序：_exit立即进入内核，exit则先执行一些清除处理(包括调用执行各终止处理程序，关闭所有标准I/O流等)，然后进入内核。

#include <stdlib.h>

void exit(int status) ;

#include <unistd.h>

void _exit (int status) ;

exit和 _exit都带一个整型参数，称之为终止状态（exit status）。大多数UNIX shell都提供检查一个进程终止状态的方法。如果(a)若调用这些exit函数时不带终止状态，或(b) main执行了一个无返回值的return语句，或(c) main执行隐式返回，则该进程的终止状态是末定义的。这就意味着，下列经典性的C语言程序：

#include <stdio.h>

main ()

{

printf ("hello, world \n");

}

是不完整的，因为main函数没有使用return语句返回(隐式返回)，它在返回到C的起动例程时并没有返回一个值(终止状态)。

另外，main函数返回一整型值与用该值调用exit是等价的。即在main函数中，exit(0) 等价于 return(0)。

atexit用来登记函数，一个进程可以登记多至32个函数，这些函数将由exit自动调用。我们称这些用atexit登记的函数为终止处理程序（exit handler），atexit的参数是一个函数地址，当调用此函数时无需向它传送任何参数。exit以登记这些函数的相反顺序调用它们。同一函数如若登记多次，则也被调用多次。高级编程的程序清单7-2说明了atexit的使用方法。

根据ANSI C和POSIX.1，exit首先调用各终止处理程序，然后按需多次调用fclose，关闭所有打开流。下图显示了一个C程序是如何起动的，以及它终止的各种方式。

注意，内核使程序执行的唯一方法是调用一个exec函数。进程自愿终止的唯一方法是显式或隐式地(调用exit)调用 _ exit。进程也可非自愿地由一个信号使其终止(图中没有显示)。

2 C程序的存储空间布局

由于历史原因，C程序一直由下列几部分组成：

正文段。这是由C P U执行的机器指令部分。通常，正文段是可共享的，所以即使是经常执行的程序(如文本编辑程序、C编译程序、shell等)在存储器中也只需有一个副本，另外，正文段常常是只读的，以防止程序由于意外事故而修改其自身的指令。

初始化数据段。通常将此段称为数据段，它包含了程序中需赋初值的变量。C程序中任何函数之外的说明：int maxcount = 99;使此变量以初值存放在初始化数据段中。

非初始化数据段。通常将此段称为bss段，这一名称来源于早期汇编程序的一个操作符，意思是“block started by symbol（由符号开始的块）”，在程序开始执行之前，内核将此段初始化为0。函数外的说明：long sum[1000] ;使此变量存放在非初始化数据段中。

栈。自动变量以及每次函数调用时所需保存的信息都存放在此段中。每次函数调用时，其返回地址、以及调用者的环境信息（例如某些机器寄存器）都存放在栈中。然后，新被调用的函数在栈上为其自动和临时变量分配存储空间。通过以这种方式使用栈， C函数可以递归调用。

堆。通常在堆中进行动态存储分配。如malloc就是从堆中分配空间。由于历史上形成的惯例，堆位于非初始化数据段顶和栈底之间。

下图显示了这些段的一种典型安排方式。这是程序的典型逻辑布局，虽然并不要求一个具体实现一定以这种方式安排其存储空间。要注意的是，下图的整个结构是一个进程的地址空间，进程的地址空间也是虚拟的。

从图中还可注意到末初始化数据段的内容并不存放在磁盘程序文件中。需要存放在磁盘程序文件中的段只有正文段和初始化数据段。

3 setjmp、longjmp

在C中，goto语句是不能跨越函数的。而执行这种跳转功能的是函数setjmp和longjmp。这两个函数对于处理发生在很深的嵌套函数调用中的出错情况非常有用。

#include <setjmp.h>

int setjmp(jmp_buf env) ;

返回：若直接调用则为0，若从longjmp返回则为非0

void longjmp(jmp_buf env , int val) ;

在希望返回到的位置调用setjmp， setjmp的参数env是一个特殊类型jmpbuf。这一数据类型是某种形式的数组，其中存放在调用longjmp时能用来恢复栈状态的所有信息。一般，env变量是个全局变量，因为需从另一个函数中引用它。longjmp有两个调用参数，第一个就是在调用setjmp时所用的env；第二个val，是个非0值，它成为从setjmp处返回的值。使用第二个参数的原因是对于一个setjmp可以有多个longjmp，可以通过不同的val值来区分这个setjmp是从那个longjmp返回的。而对于一个longjmp，若前面有几个setjmp，则它会跳转到最近的那个setjmp。

高级编程清单7-5说明了setjmp和longjmp的使用方法。在本例中，setjmp的调用位置在main函数中。因为我们直接调用该函数，所以其返回值为0。可以在cmd_add函数中以val为1调用longjmp，也可在get_token函数中以val为2调用longjmp。在main函数中，setjmp的返回值就会是1或2，通过测试返回值就可判断是从cmd_add还是从get_token来的longjmp。