linux 多进程入门

来源：互联网发布：知乎那些有深度的网名编辑：程序博客网时间：2024/06/01 08:54

前言：
    本文章只是为了给广大和我一样的菜鸟一个指引。如果你是高手，或对编程毫无兴趣。建议请不要在此浪费时间。

　　多进程是一个非常有用的东西。记得我上次介绍的那个TCP connect扫描器么，是不是很慢？如果你使用多进程分段扫描端口，你会发现速度大大提升。下面我们就来看看怎么在Linux下进行多进程编程。
    首先，简单介绍一下我们要用的函数:fork()、wait()。
    fork()函数是一个很有意思的函数。他可以建立一个新进程，把当前的进程分为父进程和子进程。原来进程的所有页面在调用fork()函数时被分为相同的两份，所以父进程和子进程都使用相同的映像。该函数与普通函数的不同之处是函数如果调用成功会返回两次，在父进程中返回子进程的PID；在子进程中返回0。成功后，父进程和子进程都在fork()函数后继续执行。如果函数调用不成功，则返回一次，返回值为 -1。
    由于在进程运行时，如果子进程先退出，它不会从进程列表里清除。而要发一个SIGCHLD（或SIGCLD）信号给父进程，父进程确认后子进程才会退出。在等待父进程确认期间，子进程处于“zombie”状态。所以我们就需要使用wait()函数。如果调用wait()函数时已经有一个处于“zombie”状态的子进程，那么函数立即返回的同时该子进程从内存中清除出去；否则，主进程会被挂起，直到其中一个进程退出。直接调用wait()函数有个很明显的缺点就是父进程会被挂起而无法进行其他任务。解决办法就是拦截处理信号SIGCHLD（或SIGCLD），这我会在以后讲信号处理的文章中给大家简单的说说。

老规矩，通过源代码来学习多进程编程。

/*--------------------------fork.c------------------------------*/
/* mikespook */
/* exercise function fork() and wait()*/
/* 2002.5.28 */

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
#define FAC_N 65535

/* 子进程调用的函数，这里我为了模拟一个很大的后台操作用了一个循环。 */
void big_loop(int n);
/* 父进程调用的函数，其实不放到函数里也可以，不过为了程序的结构更好看还是放到函数里的好 */
void input_information();

int main()
{
  /* 进程号 */
  pid_t pid;
  /* 程序在这里“分叉”，新的进程创建了 */
  pid = fork();
  /* 通过fork()的返回值来判断是父进程还是子进程 */
  switch(pid){
    /* 返回 -1，很不幸，创建进程失败了。可能是没有足够的内存空间，也可能已经开起了太多的进程。 */
    case -1:
      perror("fork\n");
      break;
    /* 返回 0，现在是在子进程里运行，那就调用子进程的操作函数。 */
    case 0:
      /* 一个运行65535次的循环，如果你的机子太快，不能看清楚两个进程同时运行的效果，那就再加大循环次数。或用sleep()函数 */
      big_loop(FAC_N);
      /* 取得子进程的PID，你可以看清楚子进程和父进程的PID是不同的（子进程的PID比父进程的要大，因为是在父进程运行后才创建的）。*/
      printf("PID:%d\n", getpid());
      break;
    /* 哈哈，返回的即不是错误，又不是子进程，那就是父进程喽。*/
    default:
      /* 这里让用户输入了4个数 */
      input_information();
      /* 取得子进程的PID。*/
      printf("PID:%d\n", getpid());
      break;
  }
  /* 等着吧，子进程不退出，你父进程也不能退出的。 */
  wait();
  exit(0);
}

/*big_loop: 简单，一看就明白，不解释了。*/
void big_loop(int n)
{
  int i;
  for(i = 0; i < n; i++){
    switch(i % 4){
      case 0:
        putchar('-');
        break;
      case 1:
        putchar('/');
        break;
      case 2:
        putchar('|');
        break;
      case 3:
        putchar('\\');
        break;
    }
    putchar('\b');
  }
}

/*input_information: 简单，一看就明白，也不解释了。*/
void input_information()
{
  int n_table[4], i;

  for(i = 0; i < 4; i++){
    printf("Number %d:\t", i);
    scanf("%d", &n_table[i]);
  }

   printf("Number1\tNumber2\tNumber3\tNumber4\n");
   printf("%d\t%d\t%d\t%d\n", n_table[0], n_table[1], n_table[2], n_table[3]);
}
/*--------------------------fork.c------------------------------*/

　　同样，我再给大家补充几点，以供参考。
　　多进程的好处是同时并行的运行多个任务。由于各自使用独立的内存空间，所以不容易由于冲突而出错。但是这样就给进程间的通信带来了一定的麻烦。当然有很多办法，比如管道，消息等等可以解决这个问题。多进程还有一个问题就是内存空间的浪费。一个进程就是一个完整的内存映像，有一些数据重复放置，这样对内存空间浪费是很严重的（我想这也就是多线程比多进程要优越的原因，可惜我还没有完全搞明白linux下的多线程，要不然也和大家讨论讨论。过段时间吧！）。还有，我要提示的是上面这个例子我在最后用了wait()函数，这样父进程运行完后回等着子进程退出才退出。你可以试试把wait();这个语句去掉，看看什么效果？父进程运行完退出了，我们回到了[mikespook @ lazycat]$的提示符下，而子进程继续在运行。有时我们可以利用这个把一个进程放到后台去运行（比如木马……当然啦，我不是建议你做木马！）。
　　好啦，Linux下的多进程编程就怎么点内容，是不是很简单呢？其实，让两个进程独立运行很容易，关键的难点是父进程和子进程共享数据，进行通信。我会在以后的文章中慢慢和大家讨论的（其实关键是有一些东西还没有悟透，不敢拿出来丢人^%^）。