Linux 进程与进程调度详解

来源：互联网发布：购买备案域名编辑：程序博客网时间：2024/06/15 23:58

1、引言

进程：是程序执行时的一个实例，可以看作充分描述程序已经执行到何种程度的数据结构的汇集。从内核观点看，进程的目的就是担当分配系统资源(CPU时间、内存等)的实体。
当一个进程创建时，它获得一个父进程地址空间的副本。共享正文段(代码段)，但并不执行一个父进程数据段、栈和堆的完全拷贝，而是采用写时复制技术。
Linux使用轻量级进程对多线程应用程序提供更好的支持，两个轻量级进程基本上可以共享一些资源，诸如地址空间、打开的文件等。

进程调度，用户进程数进程调度一般都多于处理机数、这将导致它们互相争夺处理机。另外，系统进程也同样需要使用处理机。

无论是在批处理系统还是分时系统中，用户进程数一般都多于处理机数、这将导致它们互相争夺处理机。另外，系统进程也同样需要使用处理机。这就要求进程调度程序按一定的策略，动态地把处理机分配给处于就绪队列中的某一个进程，以使之执行。　　

进程调度的的分级
高级、中级和低级调度作业从提交开始直到完成，往往要经历下述三级调度：

高级调度
(High-Level Scheduling)又称为作业调度，它决定把后备作业调入内存运行；
低级调度
(Low-Level Scheduling)又称为进程调度，它决定把就绪队列的某进程获得CPU；
中级调度
(Intermediate-Level Scheduling)又称为在虚拟存储器中引入，在内、外存对换区进行进程对换。

2、进程调度 - 进程调度的时机

进程调度发生在什么时机呢？这与引起进程调度的原因以及进程调度的方式有关。
引起进程调度的原因有以下几类，
(1)正在执行的进程执行完毕。这时，如果不选择新的就绪进程执行，将浪费处理机资源。
(2)执行中进程自己调用阻塞原语将白己阻塞起来进入睡眠等状态。
(3)执行中进程调用了P原语操作，从而因资源不足而被阻塞；或调用了v原语操作激活了等待资源的进程队列。
(4)执行中进程提出I/O请求后被阻塞。
(5)在分时系统中时间片已经用完。
(6)在执行完系统调用等系统程序后返回用户进程时，这时可看作系统进程执行完毕，从而可调度选择一新的用户进程执行。
以上都是在可剥夺方式下的引起进程调度的原因。在CPU执行方式是可剥夺时．还有
(7)就绪队列中的某进程的优先级变得高于当前执行进程的优先级，从而也将引发进程调度。

两种占用CPU的方式：
可剥夺式 (可抢占式 preemptive)：就绪队列中一旦有优先级高于当前执行进程优先级的进程存在时，便立即发生进程调度，转让处理机。
不可剥夺式 (不可抢占式 non_preemptive)：即使在就绪队列存在有优先级高与当前执行进程时，当前进程仍将占用处理机知道该进程自己因调用原语操作或等待I/O而进入阻塞、睡眠状态，或时间片用完时才重新发生调度让出处理机。　　

3、进程调度 - 进程调度算法

1.先进先出算法(FIFO)：按照进程进入就绪队列的先后次序来选择。即每当进入进程调度，总是把就绪队列的队首进程投入运行。
2. 时间片轮转算法(RR)：分时系统的一种调度算法。轮转的基本思想是，将CPU的处理时间划分成一个个的时间片，就绪队列中的进程轮流运行一个时间片。当时间片结束时，就强迫进程让出CPU，该进程进入就绪队列，等待下一次调度，同时，进程调度又去选择就绪队列中的一个进程，分配给它一个时间片，以投入运行。
3. 最高优先级算法(HPF)：进程调度每次将处理机分配给具有最高优先级的就绪进程。最高优先级算法可与不同的CPU方式结合形成可抢占式最高优先级算法和不可抢占式最高优先级算法。
4. 多级队列反馈法：几种调度算法的结合形式多级队列方式。

4、进程调度 - 进程的状态

这里写图片描述

task_struct中的state描述进程的当前状态。进程的状态一共有5种，而进程必然处于其中一种状态：

1）TASK_RUNNING（运行）——进程是可执行的，它或者正在执行，或者在运行队列中等待执行。这是进程在用户空间中执行唯一可能的状态；也可以应用到内核空间中正在执行的进程。

2）TASK_INTERRUPTIBLE（可中断）——进程正在睡眠（也就是说它被阻塞）等待某些条件的达成。一旦这些条件达成，内核就会把进程状态设置为运行，处于此状态的进程也会因为接收到信号而提前被唤醒并投入运行。

3）TASK_UNINTERRUPTIBLE（不可中断）——除了不会因为接收到信号而被唤醒从而投入运行外，这个状态与可打断状态相同。这个状态通常在进程必须在等待时不受干扰或等待事件很快就会发生时出现。由于处于此状态的任务对信号不作响应，所以较之可中断状态，使用得较少。

4）TASK_ZOMBIE（僵死）——该进程已经结束了，但是其父进程还没有调用wait4()系统调用。为了父进程能够获知它的消息，子进程的进程描述符仍然被保留着。一旦父进程调用了wait4()，进程描述符就会被释放。

5）TASK_STOPPED（停止）——进程停止执行，进程没有投入运行也不能投入运行。通常这种状态发生在接收到SIGSTOP，SIGTSTP，SIGTTIN，SIGTTOU等信号的时候。此外，在调试期间接收到任何信号，都会使进程进入这种状态。

需要调整进程的状态，最好使用set_task_state(task, state)函数，在必要的时候，它会设置内存屏障来强制其他处理器作重新排序（SMP）。

进程的各个状态之间的转化构成了进程的整个生命周期
http://www.linuxidc.com/Linux/2014-08/105366.htm
这里写图片描述

进程0和进程1

系统允许一个进程创建新进程，新进程即为子进程，子进程还可以创建新的子进程，形成进程树结构模型。整个linux系统的所有进程也是一个树形结构。树根是系统自动构造的，即在内核态下执行的0号进程，它是所有进程的祖先。由0号进程创建1号进程（内核态），1号负责执行内核的部分初始化工作及进行系统配置，并创建若干个用于高速缓存和虚拟主存管理的内核线程。随后，1号进程调用execve（）运行可执行程序init，并演变成用户态1号进程，即init进程。它按照配置文件/etc/initab的要求，完成系统启动工作，创建编号为1号、2号…的若干终端注册进程getty。

每个getty进程设置其进程组标识号，并监视配置到系统终端的接口线路。当检测到来自终端的连接信号时，getty进程将通过函数execve（）执行注册程序login，此时用户就可输入注册名和密码进入登录过程，如果成功，由login程序再通过函数execv（）执行shell，该shell进程接收getty进程的pid，取代原来的getty进程。再由shell直接或间接地产生其他进程。

上述过程可描述为：0号进程->1号内核进程->1号用户进程（init进程）->getty进程->shell进程

注意，上述过程描述中提到：1号内核进程调用执行init并演变成1号用户态进程（init进程），这里前者是init是函数，后者是进程。两者容易混淆，区别如下：

1.init（）函数在内核态运行，是内核代码

2.init进程是内核启动并运行的第一个用户进程，运行在用户态下。

3.一号内核进程调用execve（）从文件/etc/inittab中加载可执行程序init并执行，这个过程并没有使用调用do_fork()，因此两个进程都是1号进程。

进程0
所有进程的祖先叫做进程0 ，idle 进程或因为历史的原因叫做swapper 进程。它是在 linux 的初始化阶段从无到有的创建的一个内核线程。这个祖先进程使用静态分配的数据结构。
在多处理器系统中，每个CPU都有一个进程0，主要打开机器电源，计算机的BIOS就启动一个CPU，同时禁用其他CPU。运行的CPU 上的swapper进程初初始化内核数据结构，然后激活其他的并且使用copy_process()函数创建另外的swapper进程，把0 传递给新创建的swapper进程作为他们进程的PID.

进程1
由进程0创建的内核线程执行init() 函数，init() 一次完成内核的初始化。init()调用execve()系统调用装入可执行程序init ，结果，init 内核线程变成一个普通的进程，且拥有自己的每个进程内核数据结构。在系统关闭之前，init 进程一直存活，因为它创建和监控在操作系统外层执行的所有进程的活动。

0 0