ngnix笔记

来源：互联网发布：恒宝充电器淘宝店编辑：程序博客网时间：2024/05/16 18:32

Nginx是当前最流行的HTTP Server之一，根据W3Techs的统计，目前世界排名（根据Alexa）前100万的网站中，Nginx的占有率为6.8%。与Apache相比，Nginx在高并发情况下具有巨大的性能优势。

Nginx属于典型的微内核设计，其内核非常简洁和优雅，同时具有非常高的可扩展性。Nginx最初仅仅主要被用于做反向代理，后来随着HTTP核心的成熟和各种HTTP扩展模块的丰富，Nginx越来越多被用来取代Apache而单独承担HTTP Server的责任，例如目前淘宝内各个部门正越来越多使用Nginx取代Apache，据笔者了解，在腾讯和新浪等公司也存在类似情况。

反向代理（reverse proxy）是指以代理服务器来接受web请求，然后将请求转发给真正的web服务器（比如tomcat），并将从服务器上得到的结果返回给web上请求连接的客户端，此时代理服务器对外就表现为一个服务器角色。

反向代理是和正向代理（或者叫代理）相反的，代理大家定听过吧，为了更方便的访问B资源，通过A资源间接的访问B资源，特点就是用户知道自己最终要访问的网站是什么，但是反向代理用户是不知道代理服务器后边做了什么处理的，反向代理中服务真正的处理服务器放在内网，对外网而言只可以访问反向代理服务器，这也大大提高了安全性。

nginx是一个开源的高性能web服务器系统，事件驱动的请求处理方式和极其苛刻的资源使用方式，使得nginx成为名副其实的高性能服务器。nginx的源码质量也相当高，作者“家酿”了许多代码，自造了不少轮子，诸如内存池、缓冲区、字符串、链表、红黑树等经典数据结构，事件驱动模型，http解析，各种子处理模块，甚至是自动编译脚本都是作者根据自己的理解写出来的，也正因为这样，才使得nginx比其他的web服务器更加高效。

nignx的特点：

跨平台：Nginx 可以在大多数 Unix like OS编译运行，而且也有Windows的移植版本。
配置异常简单，非常容易上手。配置风格跟程序开发一样，神一般的配置
非阻塞、高并发连接：数据复制时，磁盘I/O的第一阶段是非阻塞的。官方测试能够支撑5万并发连接，在实际生产环境中跑到2～3万并发连接数.(这得益于Nginx使用了最新的epoll模型)

事件驱动：通信机制采用epoll模型，支持更大的并发连接

master/worker结构：一个master进程，生成一个或多个worker进程
内存消耗小：处理大并发的请求内存消耗非常小。在3万并发连接下，开启的10个Nginx进程才消耗150M内存（15M*10=150M）成本低廉：Nginx为开源软件，可以免费使用。而购买F5 BIG-IP、NetScaler等硬件负载均衡交换机则需要十多万至几十万人民币
内置的健康检查功能：如果NginxProxy后端的某台 Web 服务器宕机了，不会影响前端访问。
节省带宽：支持GZIP 压缩，可以添加浏览器本地缓存的 Header头。
稳定性高：用于反向代理，宕机的概率微乎其微
- nginx代理和后端web服务器间无需长连接；
- 接收用户请求是异步的，即先将用户请求全部接收下来，再一次性发送后后端web服务器，极大的减轻后端web服务器的压力
- 发送响应报文时，是边接收来自后端web服务器的数据，边发送给客户端的
- 网络依赖型低。NGINX对网络的依赖程度非常低，理论上讲，只要能够ping通就可以实施负载均衡，而且可以有效区分内网和外网流量
- 支持服务器检测。NGINX能够根据应用服务器处理页面返回的状态码、超时信息等检测服务器是否出现故障，并及时返回错误的请求重新提交到其它节点上

正向代理的概念

正向代理,也就是传说中的代理,他的工作原理就像一个跳板,
简单的说,
我是一个用户,我访问不了某网站,但是我能访问一个代理服务器
这个代理服务器呢,他能访问那个我不能访问的网站
于是我先连上代理服务器,告诉他我需要那个无法访问网站的内容
代理服务器去取回来,然后返回给我

从网站的角度,只在代理服务器来取内容的时候有一次记录
有时候并不知道是用户的请求,也隐藏了用户的资料,这取决于代理告不告诉网站

结论就是正向代理是一个位于客户端和原始服务器(origin server)之间的服务器，为了从原始服务器取得内容，客户端向代理发送一个请求并指定目标(原始服务器)，然后代理向原始服务器转交请求并将获得的内容返回给客户端。客户端必须要进行一些特别的设置才能使用正向代理。

反向代理的概念

继续举例:
例用户访问 http://ooxx.me/readme
但ooxx.me上并不存在readme页面
他是偷偷从另外一台服务器上取回来,然后作为自己的内容吐给用户

但用户并不知情
这很正常,用户一般都很笨

这里所提到的 ooxx.me 这个域名对应的服务器就设置了反向代理功能

结论就是反向代理正好相反，对于客户端而言它就像是原始服务器，并且客户端不需要进行任何特别的设置。客户端向反向代理的命名空间(name-space)中的内容发送普通请求，接着反向代理将判断向何处(原始服务器)转交请求，并将获得的内容返回给客户端，就像这些内容原本就是它自己的一样。

两者区别

从用途上来讲：

正向代理的典型用途是为在防火墙内的局域网客户端提供访问Internet的途径。正向代理还可以使用缓冲特性减少网络使用率。反向代理的典型用途是将防火墙后面的服务器提供给Internet用户访问。反向代理还可以为后端的多台服务器提供负载平衡，或为后端较慢的服务器提供缓冲服务。

另外，反向代理还可以启用高级URL策略和管理技术，从而使处于不同web服务器系统的web页面同时存在于同一个URL空间下。

从安全性 来讲：

正向代理允许客户端通过它访问任意网站并且隐藏客户端自身，因此你必须采取安全措施以确保仅为经过授权的客户端提供服务。

反向代理对外都是透明的，访问者并不知道自己访问的是一个代理。

5. 在Linux下的安装与运行

使用Nginx的第一步是下载Nginx源码包，例如1.0.0的下载地址为http://nginx.org/download/nginx-1.0.0.tar.gz。下载完后用tar命令解压缩，进入目录后安装过程与Linux下通常步骤无异，例如我想将Nginx安装到/usr/local/nginx下，则执行如下命令：

./configure --prefix=/usr/local/nginx

make

make install

安装完成后可以直接使用下面命令启动Nginx：/usr/local/nginx/sbin/nginx。

Nginx默认以Deamon进程启动，输入下列命令：curl -i http://localhost/，就可以检测Nginx是否已经成功运行；或者也可以在浏览器中输入http://localhost/，应该可以看到Nginx的欢迎页面了。

启动后如果想停止Nginx可以使用：/usr/local/nginx/sbin/nginx -s stop。

6. 配置文件基本结构

配置文件可以看做是Nginx的灵魂，Nginx服务在启动时会读入配置文件，而后续几乎一切动作行为都是按照配置文件中的指令进行的，因此如果将Nginx本身看做一个计算机，那么Nginx的配置文件可以看成是全部的程序指令。

下面是一个Nginx配置文件的实例：

#user nobody;

worker_processes 8;

error_log logs/error.log;

pid logs/nginx.pid;

events {

worker_connections 1024;

}

http {

include mime.types;

default_type application/octet-stream;

sendfile on;

#tcp_nopush on;

keepalive_timeout 65;

#gzip on;

server {

listen 80;

server_name localhost;

location / {

root /home/yefeng/www;

index index.html index.htm;

}

#error_page 404 /404.html;

# redirect server error pages to the static page /50x.html

error_page 500 502 503 504 /50x.html;

location = /50x.html {

root html;

}

Nginx配置文件是纯文本文件，你可以用任何文本编辑器如vim或emacs打开它，通常它会在nginx安装目录的conf下，如我的nginx安装在/usr/local/nginx，主配置文件默认放在/usr/local/nginx/conf/nginx.conf。

其中“#”表示此行是注释，由于笔者为了学习扩展开发安装了一个纯净的Nginx，因此配置文件没有经过太多改动。

Nginx的配置文件是以block的形式组织的，一个block通常使用大括号“{}”表示。block分为几个层级，整个配置文件为main层级，这是最大的层级；在main层级下可以有event、http等层级，而http中又会有server block，server block中可以包含location block。

每个层级可以有自己的指令（Directive），例如worker_processes是一个main层级指令，它指定Nginx服务的Worker进程数量。有的指令只能在一个层级中配置，如worker_processes只能存在于main中，而有的指令可以存在于多个层级，在这种情况下，子block会继承父block的配置，同时如果子block配置了与父block不同的指令，则会覆盖掉父block的配置。指令的格式是“指令名参数1 参数2 … 参数N;”，注意参数间可用任意数量空格分隔，最后要加分号。

在开发Nginx HTTP扩展模块过程中，需要特别注意的是main、server和location三个层级，因为扩展模块通常允许指定新的配置指令在这三个层级中。

最后要提到的是配置文件是可以包含的，如上面配置文件中“include mime.types”就包含了mine.types这个配置文件，此文件指定了各种HTTP Content-type。

一般来说，一个server block表示一个Host，而里面的一个location则代表一个路由映射规则，这两个block可以说是HTTP配置的核心。

下图是Nginx配置文件通常结构图示。

Nginx配置文件主要分成四部分：main（全局设置）、server（主机设置）、upstream（上游服务器设置）和 location（URL匹配特定位置后的设置）。每部分包含若干个指令。main部分设置的指令将影响其它所有设置；server部分的指令主要用于指定主机和端口；upstream的指令用于设置一系列的后端服务器；location部分用于匹配网页位置（比如，根目录“/”,“/images”,等等）。他们之间的关系式：server继承main，location继承server；upstream既不会继承指令也不会被继承。它有自己的特殊指令，不需要在其他地方的应用。

启动和停止Nginx

Nginx目前只支持命令行操作，操作前先进入Dos命令环境，并进入Nginx部署目录。

1) 启动Nginx：start nginx

2) 停止Nginx：nginx -s stop

3) 修改配置后重启：nginx -s reload

这三个命令可分别做成bat文件，放在部署目录下，方便后续操作。

start nginx.bat文件内容：start nginx

stop nginx.bat文件内容：nginx -s stop

reload nginx.bat文件内容：nginx -s reload

nginx配置负载均衡

这里配置的时候只需要修改http{}之间的内容就行了，修改的第一个地方就是设置服务器组，在http节点之间添加

upstream myServer{

server www.88181.com:80; #这里是你自己要做负载均衡的服务器地址1

server www.linux.com:8080; #这里是要参与负载均衡的地址2

}

nginx中的upstream支持下面几种方式：轮询（默认，按照时间顺序对所有服务器一个一个的访问，如果有服务器宕机，会自动剔除）、weight（服务器的方位几率和weight成正比，这个可以在服务器配置不均的时候进行配置）、ip_hash（对每个请求的ip进行hash计算，并按照一定的规则分配对应的服务器）、fair（按照每台服务器的响应时间（rt）来分配请求，rt晓得优先分配）、url_hash（按照访问url的hash值来分配请求），我这里使用了默认的轮训方式。

将请求指向myServer

location / {

proxy_pass http://myServer;

}

完整的文件（删除注释）如下：

worker_processes 1;
events {
worker_connections 1024;
}
http {
include      mime.types;
default_type application/octet-stream;
sendfile        on;
keepalive_timeout 65;
upstream myServer{
server www.linux.com:80;
server www.88181.com:8080;
}
server {
listen      80;
server_name my22;
location / {
proxy_pass http://myServer;
}
}

}

看看效果

等所有都ok之后可硬通过浏览器访问看看效果

忘了说了，nginx代理服务器的地址为http://192.168.1.113，

浏览器输入http://192.168.1.113/index.php之后，不停的刷新，你会发现，会在

I'm the 88181、I'm the linux

这两个页面之间来回交换，view会没刷新两下增加一次，这也证明了前面所说的默认是轮训的方式，但这里又有一个比较常见的问题了，当用户访问网站时，未做处理的情况下，session会保存在不同的服务器上（我这里用两个不同的文件夹模拟两台服务器），session数据可能出现多套，这个问题怎么解决呢，下篇文章说说这个问题，其实也很简单。

nginx如何处理一个请求：

首先，nginx在启动时，会解析配置文件，得到需要监听的端口与ip地址，然后在nginx的master进程里面，先初始化好这个监控的socket(创建socket，设置addrreuse等选项，绑定到指定的ip地址端口，再listen)，然后再fork(一个现有进程可以调用fork函数创建一个新进程。由fork创建的新进程被称为子进程)出多个子进程出来，然后子进程会竞争accept新的连接。此时，客户端就可以向nginx发起连接了。当客户端与nginx进行三次握手，与nginx建立好一个连接后，此时，某一个子进程会accept成功，得到这个建立好的连接的socket，然后创建nginx对连接的封装，即ngx_connection_t结构体。接着，设置读写事件处理函数并添加读写事件来与客户端进行数据的交换。最后，nginx或客户端来主动关掉连接，到此，一个连接就寿终正寝了。

当然，nginx也是可以作为客户端来请求其它server的数据的（如upstream模块），此时，与其它server创建的连接，也封装在ngx_connection_t中。作为客户端，nginx先获取一个ngx_connection_t结构体，然后创建socket，并设置socket的属性（比如非阻塞）。然后再通过添加读写事件，调用connect/read/write来调用连接，最后关掉连接，并释放ngx_connection_t。

0 0