【Linux】fork函数的理解

来源:互联网 发布:软件质量管理计划 编辑:程序博客网 时间:2024/06/07 22:10

         先给大家简单介绍下 fork 函数

1、函数原型:

       

  #include <unistd.h>       pid_t fork(void);

2、函数功能:

      创建一个子进程

3、返回值:

      若函数执行失败,返回 - 1;若执行成功:

      (1)、父进程返回子进程的ID(非负)

      (2)、子进程返回 0

 

      注:  (1)、pid_t 类型表示进程 id ,但为了表示 -1 ,它是有符号整型(0  不是有效进程,init 最小,为 -1)

               (2)、并不是 fork 函数有两个返回值,而是 fork 后,fork 函数变成两个, 父子进程各自有一个返回值。

 4、父子进程的深度理解:

     (1)、子进程是父进程的副本,它将获得父进程的数据空间、栈、堆等资源的副本。父子进程共享代码段,但是分别拥有自己的数据段和堆栈段。

               由于在创建进程时,会消耗大量的系统资源,所以为了可以避免拷贝大量根本就不会被使用的数据(地址空间里常常包含数十兆的数据)。由于 Unix/Linxu 强调进程快速执行的能力,这里就使用了写 实拷贝技术 ,优化系统资源的使用。


              此处先简要介绍下COW(Copy-on-write)机制,大致原理如下:


       在复制一个对象的时候并不是真正的把原先的对象复制到内存的另外一个位置上,而是在新对象的内存映射表中设置一个指针,指向源对象的位置,并把那块内存的
Copy-On-Write位设置为1.这样,在对新的对象执行读操作的时候,内存数据不发生任何变动,直接执行读操作;而在对新的对象执行写操作时,将真正的对象复制到新的内存地址中,并修改新对象的内存映射表指向这个新的位置,并在新的内存位置上执行写操作。(读时共享写实拷贝)。

     (2)、一般来说 fork 后的父进程先执行还是子进程先执行是不确定的。(进程运行的次序是不确定的,取决于内核对的调度算法)。可以使用getpid()和getppid()两个函数分别获取当前进程的进程 id 和父进程的 id。


     (3)、在Linux中存在缓冲问题。当写 printf 函,但是没有换行的话,它是不会输出的,而是现将要输出的内容放入缓冲区中,当碰到换行时,将缓冲去的内容再一起输出。所以 fork 后子进程会复制父进程的缓冲区。因此,也将待输出内容复制到自己与父进程独立的缓冲区中。因此,当子进程执行遇到换行,就将缓冲区的内容全都输出来。


5、示例代码1:

        

#include<unistd.h>#include<sys/types.h>#include<stdlib.h>#include<stdio.h>int main(void){pid_t pid;pid = fork();if( pid == -1 ){perror("fork");exit(1);}else if( pid == 0){  printf(" I am child,pid = %d, ppid = %d\n",getpid(),getppid());}else if( pid > 0 ){  printf(" I am parent,pid = %d, ppid = %d\n",getpid(),getppid());}return 0;}



   这里为什么会出现运行上面代码,输出会先输出  父进程,然后输出子进程,然后光标就在下面一行闪呢?而不是光标跟在   arrayli@ubuntu:~/sysCode/day01/fork/review$
后面呢?


   主要是因为当前终端是一个进程,而程序 test_fork1 是一个当前终端下的子进程;然而该子进程有一个子进程,这三个进程之间相互争夺 CPU 的使用权,所以会出现这种情况。父进程获取到 CPU 的使用权后,当前终端获取到了 CPU 的使用权,但是 终端没有运行完毕,时间片用完了。此时 子进程获取到了 CPU 的使用权,打印出了子进程的信息。然后当前终端获取到了 CPU 的使用权,终端继续向下运行,所以光标会出现这种情况。只是,输出格式有问题,其余还是和平常一样。大家可以看着下图再加以理解下哦哦。


  

                                                                                        shell 终端进程

6、示例代码2:

    

#include<unistd.h>#include<sys/types.h>#include<stdlib.h>#include<stdio.h>int main(void){pid_t pid;pid = fork();if( pid == -1 ){perror("fork");exit(1);}else if( pid == 0){  printf(" I am child,pid = %d, ppid = %d\n",getpid(),getppid());}else if( pid > 0 ){            sleep(1);      // 和程序1 不同的是这里添加上了 系统休眠  printf(" I am parent,pid = %d, ppid = %d\n",getpid(),getppid());}return 0;}

     

          本程序为什么输出格式正常呢?  

 因为在这里 当父进程获取到 CPU 的使用权后,我给它休眠了 1s 。此时 子进程就会获取 CPU 的使用权,执行程序。然后回到终端。


7、示例代码3:

  

#include<unistd.h>#include<sys/types.h>#include<stdlib.h>#include<stdio.h>int main(void){   pid_t pid;   int i;   for( i = 0; i < 2; i++ )   {   printf("-");   pid = fork();   }   return 0;}

       输出:--------

       8个中划线


分析:

         在整个执行周期内,一共会产生4个进程,由于是遍历,所以主进程会产生两个子进程。假设 i=0 时,fork 出的子进程记为: first ; i =1 时,fork 出的子进程记为 : second

first 进程在遍历的时候会再产生一个自己的子进程,记录为: third;而 second 进程, i 的值已经为 1 ,不会再继续执行下去,其他进程同理。


         主进程会输出2个中划线(总计:2个)


         first 进程会输出1个自己的中划线,此时考虑到从主进程缓冲区里面拷贝来的 1个中划线。即,printf 的缓冲区里面 还有一个 “-”的1个中划线(总计:2个)


         second 进程没有自己的中划线输出,考虑到从主进程缓冲区里拷贝过来的2个中划线(总计:2个)


         third  进程没有自己的中划线输出,考虑到会从 first 进程缓冲区里拷贝过来的2个中划线(总计:2个)


所以,一共会输出8个中划线。


8、示例代码4:

#include<unistd.h>#include<sys/types.h>#include<stdlib.h>#include<stdio.h>int main(void){   pid_t pid;   int i;   for( i = 0; i < 2; i++ )   {   pid = fork();   printf("-");   }   return 0;}

       输出:--------

       8个中划线


解析:

         虽然代码通代码4一样,也是输出8个中划线,但是内部的运行机制却相差很远,具体原因,见如下分析。

        

         主进程会输出2个中划线(总计:2个)


         first 进程会输出2个自己的中划线,无主进程缓冲区拷贝输出(总计:2个)


         second 进程会输出1个自己的中划线,考虑到会从主进程缓冲区里拷贝过来的1个中划线(总计:2个)


         third  进程会输出1个自己的中划线,考虑到会从first 进程的缓冲区里拷贝过来的1个中划线(总计:2个)


9、示例代码5:

#include<unistd.h>#include<sys/types.h>#include<stdlib.h>#include<stdio.h>int main(void){   pid_t pid;   int i;   for( i = 0; i < 2; i++ )   {   printf("-\n");   pid = fork();   }   return 0;}

     输出:  -

                  -

                  -

             3个中划线


解析:

          主进程会输出2个中划线(总计:2个)


          first 进程会输出1个自己的中划线,无主进程缓冲区拷贝输出(总计:1个)


          second 进程没有自己的中划线输出,无主进程缓冲区拷贝输出(总计:0个)


          third 进程没有自己的中画西安输出,无 first 进程缓冲区拷贝输出(总计:0个)


9、示例代码6:

#include<unistd.h>#include<sys/types.h>#include<stdlib.h>#include<stdio.h>int main(void){   pid_t pid;   int i;   for( i = 0; i < 2; i++ )   {   pid = fork();   printf("-\n");   }   return 0;}

     输出: -

                 -

                 -

                 -

                 -

                 -

       6个中划线


解析:

         主进程会输出2个中划线(总计:2个)


          first 进程会输出2个自己的中划线,无主进程缓冲区拷贝输出(总计:2个)


          second 进程会输出1个自己的中划线,无主进程缓冲区拷贝输出(总计:1个)


          third 会输出1个自己的中划线输出,无 first 进程缓冲区拷贝输出(总计:1个)


10、示例代码7:

#include<unistd.h>#include<sys/types.h>#include<stdlib.h>#include<stdio.h>int main(void){pid_t pid;pid = fork();if( pid == -1 ){perror("fork");exit(1);}else if( pid == 0){  printf(" I am child,pid = %d, ppid = %d\n",getpid(),getppid());}else if( pid > 0 ){sleep(1);  printf(" I am parent,pid = %d, ppid = %d\n",getpid(),getppid());}return 0;}

输出结果:


小结:

         在这里和大家分享了 fork 函数的理解,有不足之处的话,欢迎大家找我交流技术哦哦。