浅谈UNIX下Apache的MPM及httpd.conf配置文件中相关参数配置

来源:互联网 发布:淘宝团扇 编辑:程序博客网 时间:2024/06/06 09:37

主要讲解了Apache下的prefork和work模式的原理及httpd.conf中于此相关的配置调优。

为什么要并发处理

以Apache为代表的web服务器中,如果不支持并发,则在一个客户端连接的时候,如果该客户端的任务没有处理完,其他连接的客户端将会一直处于等待状态,这事不可想象的,好像没有为什么要不要这一说,是必须有的。

常用的集中并发处理模式

  • 通过生成多个进程
  • 不通过进程,使用线程
  • 监控输入事件,在事件发生时进行切换处理,即可以使用单线程进行并发处理,这是事件驱动的处理模式

Apache的并发处理模块

Apache以模块化的方式组合了多种功能,并发处理的核心部分也是以模块化的方式来出现,通常称为MPM(Multi Processing Module)。根据选择的MDM的不公,用户可以配置不同的并发处理模式。UNIX环境下主要由两个:

  • prefork:提取生成(prefork)多个进程供客户端连接的多进程模式
  • worker:多线程和多进程的混合型模式

一般是在通过源码编译Apache的时候就通过configure 指令来指定了哪种模式,但是在Red Hat Enterprise Linux 和基于Red Hat的Cent OS Linux 上,同时安装了两种模式,默认使用prefork模式,想切换到worker模式的话,可以在通过/etc/sysconfig/httpd 这个文件来更改,如图:
/etc/sysconfig/httpd配置

prefork 和worker,进程和线程

prefork是多进程模式,worker是多线程和多进程的混合模式。后者占得内存更小,适合在高并发环境下使用。
多线程和多进程的差异:

  • 多个进程中不存在进程间直接共享内存,内存孔氏是独立且安全的
  • 在多线程中,多个线程间共享内存空间,需要注意不能发生资源冲突,这是多线程编程比较复杂的原因。

优缺点如下:

  • profork:稳定性和向后兼容性较高
  • worker:可扩展性更强

从性能角度来看下多进程/多线程的差异

基于以下两点原因后者更轻更快:

  • 多进程使用独立的内存空间,无法共享;而多线程使用共享的内存空间,内存消耗少(其实也不是绝对的,因为写时复制技术,父子进程间也能共享一些内存)
  • 因为多线程共享内存空间,所以线程切换的成本低于多进程

下面解释两个概念:写时复制和上下文切换

写时复制

写时复制和进程间的通信有点像,进程间通信原理图:
虚拟内存示意图
当某个进程需要内存是,像内核申请,内核返回给进程一个内存地址,这个地址不是实际的物理内存地址,而是虚拟内存,映射的是实际的物理内存地址,存再多个进程映射同一块物理内存这种可能,这就实现了进程间的通信,写时复制的示意图如下:
写时复制示意图
/proc/<pid>/smaps文件

上下文切换

什么是上下文切换:在多任务操作系统中,一个逻辑cpu不可能真正的实时处理多个请求,必须轮着来,这就是上下文切换,可以通过sar -c命令来查询。

httpd.conf 中两个模式相关参数说明

在centos上查看httpd.conf的配置如下:

[root@localhost www]# cat /etc/httpd/conf/httpd.conf | grep -v "#"ServerTokens OSServerRoot "/etc/httpd"PidFile run/httpd.pidTimeout 60KeepAlive OffMaxKeepAliveRequests 100KeepAliveTimeout 15<IfModule prefork.c>StartServers       8MinSpareServers    5MaxSpareServers   20ServerLimit      256     #服务器数量,即进程数的上限,一般配置两个值相同MaxClients       256     #这个值比较关键,能同时连接客户端数量的上限MaxRequestsPerChild  4000 #这里设置的是,每个进程处理4000个请求,该进程处理完第4000个请求后会自动结束,通过合理配置这个参数,可以避免使用mod_perl和mod_php模块运行的应用程序引起的内存泄露。在会接收到大量请求的大型服务器中,如果这个参数配置的值太小,就就会频繁的重复进行进程的建立和结束。因为基于写时复制的内存共享,共享率会越来越低,最终会导致大部分内存将被持续挤占而不能共享,必须根据实际情况合理设置该值。</IfModule>##这是工作在work模式下的配置,work模式是多进程和多线程的混合型模式<IfModule worker.c>StartServers         4MaxClients         300MinSpareThreads     25MaxSpareThreads     75ThreadsPerChild     25MaxRequestsPerChild  0</IfModule>Listen 80#以下配置省略......

profork模式

在profork模式中配置比较简单,只关注 Server和MaxClients这两个参数即可,一般配置二者相等。

如何来设定这两个值呢?

一般根据服务器的物理可用内存和每个进程平均消耗的内存来确定。物理内存可用用free等指令查看,那么怎么看每个进程占用的内存大小呢,通过ps和top命令能得到部分信息,但是从/proc文件系统可以看的更详细,一般在/proc/< pid >/status这个文件中看进程的内存使用详情。如下:

linux-qvvt:/var/log # ps -ef | grep httpdroot       2188      1  0 14:04 ?        00:00:00 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DZABBIX -D SYSTEMD -DFOREGROUND -k startwwwrun     2915   2188  0 14:04 ?        00:00:00 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DZABBIX -D SYSTEMD -DFOREGROUND -k startwwwrun     2916   2188  0 14:04 ?        00:00:00 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DZABBIX -D SYSTEMD -DFOREGROUND -k startwwwrun     2919   2188  0 14:04 ?        00:00:01 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DZABBIX -D SYSTEMD -DFOREGROUND -k startwwwrun     2920   2188  0 14:04 ?        00:00:01 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DZABBIX -D SYSTEMD -DFOREGROUND -k startwwwrun     2921   2188  0 14:04 ?        00:00:01 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DZABBIX -D SYSTEMD -DFOREGROUND -k startwwwrun     3151   2188  0 14:07 ?        00:00:00 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DZABBIX -D SYSTEMD -DFOREGROUND -k startroot       8442   2936  0 14:52 pts/0    00:00:00 grep httpdlinux-qvvt:/var/log # more /proc/2915/statusName:     httpd2-preforkState:     S (sleeping)Tgid:     2915Pid:     2915PPid:     2188TracerPid:     0Uid:     30     30     30     30Gid:     8     8     8     8FDSize:     64Groups:     8VmPeak:       182972 kBVmSize:       181688 kBVmLck:            0 kBVmPin:            0 kBVmHWM:        17840 kB     #实际使用物理内存的大小VmRSS:        16732 kBVmData:        11064 kBVmStk:          136 kBVmExe:          528 kBVmLib:        21616 kBVmPTE:          348 kBVmSwap:            0 kBThreads:     1SigQ:     0/3679SigPnd:     0000000000000000ShdPnd:     0000000000000000SigBlk:     0000000000000000SigIgn:     0000000001001000SigCgt:     000000018c0046ebCapInh:     0000000000000000CapPrm:     0000000000000000CapEff:     0000000000000000CapBnd:     0000001fffffffffSeccomp:     0Cpus_allowed:     ffffffff,ffffffff,ffffffff,ffffffffCpus_allowed_list:     0-127Mems_allowed:     00000000,00000000,00000000,00000000,00000000,00000000,00000000,00000000,00000000,00000000,00000000,00000000,00000000,00000000,00000000,00000001Mems_allowed_list:     0voluntary_ctxt_switches:     258nonvoluntary_ctxt_switches:     1195

在这个例子中,实际使用了17.4M的内存,要多看几个例子,得出一个平均值值,如果内存为4GB,则留给操作系统1GB,剩余3GB,3×1024/18=1723 ,考虑到父进程和子进程间还共享了一部分内存还可以给的宽裕点。

还有一个参数如 MaxRequestsPerChild 4000 ,这里设置的是,每个进程处理4000个请求,该进程处理完第4000个请求后会自动结束,通过合理配置这个参数,可以避免使用mod_perl和mod_php模块运行的应用程序引起的内存泄露。在会接收到大量请求的大型服务器中,如果这个参数配置的值太小,就就会频繁的重复进行进程的建立和结束。因为基于写时复制的内存共享,共享率会越来越低,最终会导致大部分内存将被持续挤占而不能共享,必须根据实际情况合理设置该值。

worker模式

worker模式下多进程+多线程组合的方式。

  • 生成多个进程
  • 在一个进程中生成多个线程,一个客户端的请求交由一个线程进行处理

因此支持的并发数为:进程数 x 每个进程的线程数;因此进程数可以像profork模式进行优化,在优化线程数的时候考虑两个点:

  • 线程共享全部内存空间,不用考虑写时复制的情况
  • 每个线程最大不能超过8M 的内存做为栈空间

因此有下面几个参数:

  • MaxClients : 最大连接数,即进程数*线程数
  • ServerLimit : 最大进程数
  • ThreadLimit: 每个进程的最大线程数
  • TheadPerChild: 每个进程的最大线程数,和ThreadLimit基本相同

一般先确定 MaxClients再确定TheadPerChild后就可以确定ServerLimit了,如下面这个配置,StartServers=MaxClients / MaxSpareThreads
StartServers 4
MaxClients 300
MinSpareThreads 25
MaxSpareThreads 75
ThreadsPerChild 25
MaxRequestsPerChild 0
要看系统中运行了多少线程,在ps 命令上加上 -L参数就可以看了。

最后,系统超载的情况下,修改MaxClients需要了解

当业务比较繁忙的时候,在服务器应用日志中可能会报MaxClient有关的错误,并提示要求调整这个参数,有的时候这只是个表象,当一个请求过来后将输出提交给ap服务器处理,ap服务器提交数据库查询,然后这个请求一直等待输出数据库的返回结果,当数据库查询较慢或者数据库hang住的时候,该进程/线程也是会表现为阻塞的状态,长时间得不到释放,当后面同样的请求过来后,同样被阻塞,这样服务器不断生成新的线程/进程,而之前的进程/线程因为等待输出,得不到释放,最终会导致达到最大进程/进程数,导致服务器报错。

0 0
原创粉丝点击