从一道面试题谈linux下fork的运行机制

来源：互联网发布：unity3d ugui摇杆编辑：程序博客网时间：2024/05/16 05:58

今天一位朋友去一个不错的外企面试linux开发职位，面试官出了一个如下的题目：

给出如下C程序，在linux下使用gcc编译：

#include "stdio.h"#include "sys/types.h"#include "unistd.h"int main(){    pid_t pid1;    pid_t pid2;    pid1 = fork();    pid2 = fork();    printf("pid1:%d, pid2:%d\n", pid1, pid2);}

要求如下：

已知从这个程序执行到这个程序的所有进程结束这个时间段内，没有其它新进程执行。

1、请说出执行这个程序后，将一共运行几个进程。

2、如果其中一个进程的输出结果是“pid1:1001, pid2:1002”，写出其他进程的输出结果（不考虑进程执行顺序）。

明显这道题的目的是考察linux下fork的执行机制。下面我们通过分析这个题目，谈谈linux下fork的运行机制。

预备知识

这里先列出一些必要的预备知识，对linux下进程机制比较熟悉的朋友可以略过。

1、进程可以看做程序的一次执行过程。在linux下，每个进程有唯一的PID标识进程。PID是一个从1到32768的正整数，其中1一般是特殊进程init，其它进程从2开始依次编号。当用完32768后，从2重新开始。

2、linux中有一个叫进程表的结构用来存储当前正在运行的进程。可以使用“ps aux”命令查看所有正在运行的进程。

3、进程在linux中呈树状结构，init为根节点，其它进程均有父进程，某进程的父进程就是启动这个进程的进程，这个进程叫做父进程的子进程。

4、fork的作用是复制一个与当前进程一样的进程。新进程的所有数据（变量、环境变量、程序计数器等）数值都和原进程一致，但是是一个全新的进程，并作为原进程的子进程。

解题的关键

有了上面的预备知识，我们再来看看解题的关键。我认为，解题的关键就是要认识到fork将程序切成两段。看下图：

上图表示一个含有fork的程序，而fork语句可以看成将程序切为A、B两个部分。然后整个程序会如下运行：

step1、设由shell直接执行程序，生成了进程P。P执行完Part. A的所有代码。

step2、当执行到pid = fork();时，P启动一个进程Q，Q是P的子进程，和P是同一个程序的进程。Q继承P的所有变量、环境变量、程序计数器的当前值。

step3、在P进程中，fork()将Q的PID返回给变量pid，并继续执行Part. B的代码。

step4、在进程Q中，将0赋给pid，并继续执行Part. B的代码。

这里有三个点非常关键:

1、P执行了所有程序，而Q只执行了Part. B，即fork()后面的程序。（这是因为Q继承了P的PC-程序计数器）

2、Q继承了fork()语句执行时当前的环境，而不是程序的初始环境。

3、P中fork()语句启动子进程Q，并将Q的PID返回，而Q中的fork()语句不启动新进程，仅将0返回。

解题

下面利用上文阐述的知识进行解题。这里我把两个问题放在一起进行分析。

1、从shell中执行此程序，启动了一个进程，我们设这个进程为P0，设其PID为XXX（解题过程不需知道其PID）。

2、当执行到pid1 = fork();时，P0启动一个子进程P1，由题目知P1的PID为1001。我们暂且不管P1。

3、P0中的fork返回1001给pid1，继续执行到pid2 = fork();，此时启动另一个新进程，设为P2，由题目知P2的PID为1002。同样暂且不管P2。

4、P0中的第二个fork返回1002给pid2，继续执行完后续程序，结束。所以，P0的结果为“pid1:1001, pid2:1002”。

5、再看P2，P2生成时，P0中pid1=1001，所以P2中pid1继承P0的1001，而作为子进程pid2=0。P2从第二个fork后开始执行，结束后输出“pid1:1001, pid2:0”。

6、接着看P1，P1中第一条fork返回0给pid1，然后接着执行后面的语句。而后面接着的语句是pid2 = fork();执行到这里，P1又产生了一个新进程，设为P3。先不管P3。

7、P1中第二条fork将P3的PID返回给pid2，由预备知识知P3的PID为1003，所以P1的pid2=1003。P1继续执行后续程序，结束，输出“pid1:0, pid2:1003”。

8、P3作为P1的子进程，继承P1中pid1=0，并且第二条fork将0返回给pid2，所以P3最后输出“pid1:0, pid2:0”。

9、至此，整个执行过程完毕。

所得答案：

1、一共执行了四个进程。（P0, P1, P2, P3）

2、另外几个进程的输出分别为：

pid1:1001, pid2:0

pid1:0, pid2:1003

pid1:0, pid2:0

进一步可以给出一个以P0为根的进程树：

验证

下面我们去linux下实际执行这个程序，来验证我们的答案。

程序如下图：

用gcc编译、执行后结果如下：

由于我们不太可能刚巧碰上PID分配到1001的情况，所以具体数值可能和答案有所差别。不过将这里的2710看做基数的话，结果和我们上面的解答是一致的。

总结

应该说这不是一道特别难或特别刁钻的题目，但是由于fork函数运行机制的复杂性，造就了当两个fork并排时，问题就变得很复杂。解这个题的关键，一是要对linux下进程的机制有一定认识，二是抓住上文提到的几个关于fork的关键点。朋友说，这个题给的时间是5分钟，应该说时间还算充裕，但是在面试的场合下，还是很考验一个人对进程、fork的掌握程度和现场推理能力。

希望本文能帮助朋友们对fork的执行机制有一个明晰的认识。

转自博客：http://www.cnblogs.com/leoo2sk/archive/2009/12/11/talk-about-fork-in-linux.html

关于子进程和父进程几个需要注意的点：
1 在重定向父进程的标准输出时，子进程的标准输出也会被重定向；
2 子进程会继承父进程的很多属性，包括：
实际用户ID,实际组ID，有效用户ID，有效组ID
附加组ID，进程组ID，会话ID，控制终端
设置用户ID标识和设置组ID标志
当前工作目录
跟目录
文件模式创建屏蔽字
信号屏蔽和安排
针对任一打开i文件描述符的在执行关闭标识
环境链接的共享存储段
存储映射资源限制
3 子进程和父进程之间的区别：
1 fork的返回值，进程的ID不同；
2 父进程设置的文件锁不会被子进程继承
3 子进程的未处理的闹钟被清除
4 子进程的未处理信号集设置为空集
5 子进程的tms_utime,tms_stime,tms_cutime以及tms_ustime均被设置为0

图：子父进程对打开文件的共享

关于僵尸进程：

一个进程在调用exit命令结束自己的生命的时候，其实它并没有真正的被销毁，而是留下一个称为僵死进程（Zombie）的数据结构（系统调用exit，它的作用是使进程退出，但也仅仅限于将一个正常的进程变成一个僵死进程，并不能将其完全销毁）。

一、僵死进程的产生
在每个进程退出的时候，内核释放该进程所有的资源，包括打开的文件，占用的内存等，但是仍然为其保留一定的信息(包括进程号the process ID，退出状态the
termination status of the process，运行时间the amount of CPU time taken by the process等)，直到父进程通过wait/waitpid来取时才释放。此时该进程处于僵死状态，该进程成为僵死进程(Zombie Process)。这保证了父进程可以获取到子进程结束时的状态信息。
在Linux进程的状态中，僵死进程是非常特殊的一种，它已经放弃了几乎所有内存空间，没有任何可执行代码，也不能被调度，仅仅在进程列表中保留一个位置，记载该进程的退出状态等信息供其他进程收集，除此之外，僵死进程不再占有任何内存空间。它需要它的父进程来为它收尸，如果他的父进程没安装SIGCHLD信号处理函数调用wait或waitpid()等待子进程结束，又没有显式忽略该信号，那么它就一直保持僵死状态，如果这时父进程结束了，僵死的子进程成为"孤儿进程"，过继给1号进程init，init始终会负责清理僵死进程，它产生的所有僵死进程也跟着消失（每个进程结束的时候，系统都会扫描当前系统中所运行的所有进程，看有没有哪个进程是刚刚结束的这个进程的子进程，如果是的话，就由Init来接管他，成为他的父进程）。但是如果如果父进程是一个循环，不会结束，那么子进程就会一直保持僵死状态，这就是为什么系统中有时会有很多的僵死进程。怎么查看僵死进程，利用命令ps，可以看到有标记为Z的进程就是僵死进程。

二、僵死进程的危害
如果父进程不调用wait/waitpid的话，那么保留的那段信息就不会释放，其进程号会一定被占用，但是系统所能使用的进程号是有限的，如果产生了大量的僵死进程，将因为没有可用的进程号而导致系统不能产生新的进程。