Linux系统编程（7）—— 进程之进程概述

来源：互联网发布：仿猪八戒源码编辑：程序博客网时间：2024/05/17 06:06

我们知道，每个进程在内核中都有一个进程控制块（PCB）来维护进程相关的信息，Linux内核的进程控制块是task_struct结构体。现在我们全面了解一下其中都有哪些信息。

进程id。系统中每个进程有唯一的id，在C语言中用pid_t类型表示，其实就是一个非负整数。

进程的状态，有运行、挂起、停止、僵尸等状态。

进程切换时需要保存和恢复的一些CPU寄存器。

描述虚拟地址空间的信息。

描述控制终端的信息。

当前工作目录（Current Working Directory）。

umask掩码。

文件描述符表，包含很多指向file结构体的指针。

和信号相关的信息。

用户id和组id。

控制终端、Session和进程组。

进程可以使用的资源上限（Resource Limit）。

目前读者并不需要理解这些信息的细节，在随后几章中讲到某一项时会再次提醒读者它是保存在PCB中的。

fork和exec是两个重要的系统调用。fork的作用是根据一个现有的进程复制出一个新进程，原来的进程称为父进程（Parent Process），新进程称为子进程（Child Process）。系统中同时运行着很多进程，这些进程都是从最初只有一个进程开始一个一个复制出来的。在Shell下输入命令可以运行一个程序，是因为Shell进程在读取用户输入的命令之后会调用fork复制出一个新的Shell进程，然后新的Shell进程调用exec执行新的程序。

我们知道一个程序可以多次加载到内存，成为同时运行的多个进程，例如可以同时开多个终端窗口运行/bin/bash，另一方面，一个进程在调用exec前后也可以分别执行两个不同的程序，例如在Shell提示符下输入命令ls，首先fork创建子进程，这时子进程仍在执行/bin/bash程序，然后子进程调用exec执行新的程序/bin/ls，如下图所示。

子进程的PCB是根据父进程复制而来的，所以其中的umask掩码也和父进程一样。同样道理，子进程的当前工作目录也和父进程一样，所以我们可以用cd命令改变Shell进程的当前目录，然后用ls命令列出那个目录下的文件，ls进程其实是在列自己的当前目录，而不是Shell进程的当前目录，只不过ls进程的当前目录正好和Shell进程相同。有一个例外，子进程PCB中的进程id和父进程是不同的。

先前讲过，exec系统调用执行新程序时会把命令行参数和环境变量表传递给main函数，它们在整个进程地址空间中的位置如下图所示。

和命令行参数argv类似，环境变量表也是一组字符串，如下图所示：

libc中定义的全局变量environ指向环境变量表，environ没有包含在任何头文件中，所以在使用时要用extern声明。下面是一个打印环境变量的例子：

#include <stdio.h> int main(void){         externchar **environ;         inti;         for(i=0;environ[i]!=NULL; i++)                   printf("%s\n",environ[i]);         return0;}

由于父进程在调用fork创建子进程时会把自己的环境变量表也复制给子进程，所以a.out打印的环境变量和Shell进程的环境变量是相同的。

按照惯例，环境变量字符串都是name=value这样的形式，大多数name由大写字母加下划线组成，一般把name的部分叫做环境变量，value的部分则是环境变量的值。环境变量定义了进程的运行环境，一些比较重要的环境变量的含义如下：

PATH

可执行文件的搜索路径。ls命令也是一个程序，执行它不需要提供完整的路径名/bin/ls，然而通常我们执行当前目录下的程序a.out却需要提供完整的路径名./a.out，这是因为PATH环境变量的值里面包含了ls命令所在的目录/bin，却不包含a.out所在的目录。PATH环境变量的值可以包含多个目录，用:号隔开。在Shell中用echo命令可以查看这个环境变量的值：

$ echo $PATH

SHELL

当前Shell，它的值通常是/bin/bash。

TERM

当前终端类型，在图形界面终端下它的值通常是xterm，终端类型决定了一些程序的输出显示方式，比如图形界面终端可以显示汉字，而字符终端一般不行。

LANG

语言和locale，决定了字符编码以及时间、货币等信息的显示格式。

HOME

当前用户主目录的路径，很多程序需要在主目录下保存配置文件，使得每个用户在运行该程序时都有自己的一套配置。

用environ指针可以查看所有环境变量字符串，但是不够方便，如果给出name要在环境变量表中查找它对应的value，可以用getenv函数。

#include <stdlib.h>char *getenv(const char *name);

getenv的返回值是指向value的指针，若未找到则为NULL。

修改环境变量可以用以下函数

#include <stdlib.h> int setenv(const char *name, const char*value, int rewrite);void unsetenv(const char *name);

putenv和setenv函数若成功则返回为0，若出错则返回非0。

setenv将环境变量name的值设置为value。如果已存在环境变量name，那么

若rewrite非0，则覆盖原来的定义；

若rewrite为0，则不覆盖原来的定义，也不返回错误。

unsetenv删除name的定义。即使name没有定义也不返回错误。

下面是一个修改环境变量的例子：

#include <stdlib.h>#include <stdio.h> int main(void){         printf("PATH=%s\n",getenv("PATH"));         setenv("PATH","hello", 1);         printf("PATH=%s\n",getenv("PATH"));         return0;}

父进程在创建子进程时会复制一份环境变量给子进程，但此后二者的环境变量互不影响。

1 0