进程池和线程池

来源:互联网 发布:multisim连线优化 编辑:程序博客网 时间:2024/06/10 03:23

池的概念

由于服务器的硬件资源“充裕”,那么提高服务器性能的一个很直接的方法就是以空间换时间,即“浪费”服务器的硬件资源,以换取其运行效率。这就是池的概念。池是一组资源的集合,这组资源在服务器启动之初就完全被创建并初始化,这称为静态资源分配。当服务器进入正是运行阶段,即开始处理客户请求的时候,如果它需要相关的资源,就可以直接从池中获取,无需动态分配。很显然,直接从池中取得所需资源比动态分配资源的速度要快得多,因为分配系统资源的系统调用都是很耗时的。当服务器处理完一个客户连接后,可以把相关的资源放回池中,无需执行系统调用来释放资源。从最终效果来看,池相当于服务器管理系统资源的应用设施,它避免了服务器对内核的频繁访问。

池可以分为多种,常见的有内存池、进程池、线程池和连接池。


文件并发:


当多个资源访问同一个线程,需要加锁。lock(object a) {code b}

线程切换非常消耗资源,Cpu在切换线程时,需要把当前线程执行的状态保持到寄存器里去。


创建也非常消耗资源,线程创建非常慢,占用大量的内存空间,每个线程里面最少1M内存开销。

线程池:提高了线程的利用率,非常适合工作任务非常小,而且又需要使用单独的线程来解决的问题。

 

  • 线程池中取出的线程都是后台线程。
  • 我们想手动关闭线程的话,就要手动创建线程。
  • 当要对线程池的线程优先级做设置的情景下,手动创建线程。
  • 如果执行的线程执行时间特别长,建议手动创建线程。

进程池和线程池概述

进程池和线程池相似,所以这里我们以进程池为例进行介绍。如没有特殊声明,下面对进程池的讨论完全是用于线程池。

进程池是由服务器预先创建的一组子进程,这些子进程的数目在 3~10 个之间(当然这只是典型情况)。线程池中的线程数量应该和 CPU 数量差不多。

进程池中的所有子进程都运行着相同的代码,并具有相同的属性,比如优先级、 PGID 等。

当有新的任务来到时,主进程将通过某种方式选择进程池中的某一个子进程来为之服务。相比于动态创建子进程,选择一个已经存在的子进程的代价显得小得多。至于主进程选择哪个子进程来为新任务服务,则有两种方法:

  1. 主进程使用某种算法来主动选择子进程。最简单、最常用的算法是随机算法和 Round Robin (轮流算法)。

  2. 主进程和所有子进程通过一个共享的工作队列来同步,子进程都睡眠在该工作队列上。当有新的任务到来时,主进程将任务添加到工作队列中。这将唤醒正在等待任务的子进程,不过只有一个子进程将获得新任务的“接管权”,它可以从工作队列中取出任务并执行之,而其他子进程将继续睡眠在工作队列上。

当选择好子进程后,主进程还需要使用某种通知机制来告诉目标子进程有新任务需要处理,并传递必要的数据。最简单的方式是,在父进程和子进程之间预先建立好一条管道,然后通过管道来实现所有的进程间通信。在父线程和子线程之间传递数据就要简单得多,因为我们可以把这些数据定义为全局,那么它们本身就是被所有线程共享的。

综上所述,进程池的一般模型如下所示:

处理多客户

在使用进程池处理多客户任务时,首先要考虑的一个问题是:监听 socket 和连接 socket 是否都由进程统一管理这两种 socket 。这可以一下介绍的并发模式解决。服务器主要有两种并发编程模式:半同步 半异步模式和领导者 追随者模式。

其次,在设计进程池时还需要考虑:一个客户连接上的所有任务是否始终由一个子进程来处理。如果说客户任务是无状态的,那么我们可以考虑使用不同的子进程来为该客户的不同请求服务。但如果客户是存在上下文关系的,则最好一直用同一个子进程来为之服务,否则实现起来比较麻烦,因为我们不得不在各子进程之间传递上下文数据。 epoll 的 EPOLLONESHOT 事件能够确保一个客户连接在整个生命周期中仅被一个线程处理。

半同步 半异步模式

在并发模式中,同步指的是程序完全按照代码序列的顺序执行;异步指的是程序的执行需要由系统事件来驱动。常见的系统事件包括中断、信号等。如下描述了同步的读操作和异步的读操作。

按照同步方式运行的线程称为同步线程,按照异步方式运行的线程称为异步线程。显然,异步线程的执行效率高,实时性强,但编程相对复杂,难于调试和扩展,不适合大量的并发。二同步线程则相反,虽然效率较低,实时性较差,但逻辑简单。因此,对于像服务器这种既要求较好的实时性,又要求能处理多个客户请求的应用程序,我们就应该同时使用同步线程和异步线程来实现,即采用半同步 半异步模式实现。

半同步 半异步模式中,同步线程用于处理客户逻辑,异步线程用于处理 I/O 时间。异步线程监听到客户请求后,就将其封装成请求对象并插入请求队列中。请求队列将通知某个工作在同步模式的工作线程来读取并处理请求对象。具体选择哪个工作线程来为新的客户请求服务,则取决于请求队列的设计。比如简单的轮流选取工作线程的 Round Robin 算法,也可以通过条件变量或信号量来随机地选择一个工作线程。

半同步 半反应堆( half-sync/half-reactive )模式

上图中异步线程只有一个,由主线程来充当。它负责监听所有 socket 上的事件。如果监听 socket 上有可读事件发生,即有新的连接请求到来,主线程就接受之以得到新的连接 socket ,然后往 epoll 内核事件表中注册该 socket 上的读写事件。如果连接 socket 上有读写事件发生,即由新的客户请求到来或者有数据发送至客户端,主线程就将该连接 socket 插入请求队列中。所有工作线程都睡眠在请求队列上,当有任务到来时,它们通过竞争获得任务的接管权。这种竞争机制使得空闲的工作线程才有机会来处理新任务,这是很合理的。

主线程插入请求队列中的任务是就绪的连接 socket 。这说明该图所示的半同步 半反应堆模式采用的时间处理模式是 Reactor 模式。它要求工作线程自己从 socket 上读取客户请求和往socket 写入服务器应答。这就是该模式的名称中 half-reactive 的含义。实际上,也可以使用 Proactor 时间处理模式,即由主线程来完成数据的读写。在这种请求下,主线程一般会将应用程序数据、任务类型等信息封装为一个任务对象,然后将其插入请求队列。工作线程从请求队列中取得任务对象中之后,即可直接处理之,而无须执行读写操作了。

半同步 半反应堆存在如下缺点:

  1. 主线程和工作线程共享请求队列。主线程往请求队列中添加任务,或者工作线程从请求队列中取出任务,都需要对请求队列加锁保护,从而浪费 CPU 时间。

  2. 每个工作线程在同一时间只能处理一个客户请求。如果客户数量较多,而工作线程较少,则请求队列中将堆积很多任务对象,客户端的响应速度将越来越慢。如果通过增加工作线程来解决这一问题,则工作线程的切换也将耗费大量 CPU 时间。

高效的半同步 半异步模式

上图中,。主线程只管理监听 socket ,连接 socket 由工作线程来管理。当有新的连接到来时,主线程就接受之并将新返回的连接 socket 派发给某个工作线程,此后该新 socket 上的任何 I/O 操作都被选中的工作线程处理,知道客户关闭连接。主线程向工作线程派发 socket 的最简单的方式,是往它和工作线程之间的管道里写数据。工作线程检测到管道上有数据可读时,就分析是否是一个新的客户连接请求到来,如果是,则把该新的 socket 上的读写事件注册到自己的 epoll 内核事件表中。

每个线程都维持自己的时间循环,他们各自独立地监听不同的时间。因此,在这种高效的半同步 半异步模式中,每个线程都工作在异步模式,所有它并非严格意义上的半同步 半异步模式。

领导者 追随者模式

领导者 追随者模式是多个工作线程轮流获得事件源集合,轮流监听、分发并处理事件的一种模式。在任意时间点,程序都仅有一个领导者线程,它负责监听 I/O 时间。而其他线程则都是追随者,他们休眠在线程池中等待成为新的领导者。当前的领导者如果检测到 I/O 事件,首先要从线程池中推选出新的领导者线程,然后处理 I/O 事件。此时,新的领导者等待新的 I/O事件,二者实现了并发。

多个子进程。

原创粉丝点击