nginx基础入门

来源:互联网 发布:淘宝软妹服装店铺 编辑:程序博客网 时间:2024/06/04 19:11
nginx基础入门
一、什么是nginx?
Nginx (engine x) 是一款轻量级的Web 服务器 、反向代理服务器及电子邮件(IMAP/POP3)代理服务器。 Nginx是目前比较主流的HTTP反向代理服务器(其企业版提供了基于TCP层的反向代理插件),对于构建大型分布式web应用,具有举足轻重的作用。简单来说,nginx有2个主要的功能:动/静态资源分离、负载均衡。
1、动/静态资源分离:nginx支持正则表达式以区分静态资源或者动态资源,其中动态资源可以进一步转发给后端的代理 server,而静态资源则可以在nginx层面使用本地缓存策略或者重定向(类CDN)到其他nginx上。
2、负载均衡:对于动态资源而言,如果有多个代理 server,那么nginx将会根据一定的算法选择合适的server,并转发请求,最终将客户端request相对均衡的分发给多个server。
Nginx作为“单点”,面向客户端请求,并将请求转发给后端的某个server,因为server可以有多个,那么从整体而言,提升了站点的“资源整合”能力,提升了站点的整体吞吐能力;但因为受限于nginx本身的IO模型,并没有“降低”对物理资源的消耗(即性能开支);通常nginx作为整个站点的“避雷针”和导流通道,它应该被架设在物理资源较为优越的机器上,比如8U物理机,32核心,64G内存,对磁盘要求相对较低,对CPU、内存、网卡带宽有较高的要求,因为nginx不仅需要和客户端请求建立链接,而且还需要与后端proxy server建立链接并且负责流量输入、输出(这和LVS、Haproxy有本质区别),这种双倍的链接建立,就要求机器具有较高的内存和CPU,如果你的nginx还有大量的“静态资源”cache,还需要使用高速、高容量的磁盘。因为nginx节点最终为所有proxy server流量的总和,那么它应该具有更高的网卡带宽。
为了避免资源竞争,应该避免nginx和web server部署在同一个节点上,因为web server通常为CPU和内存高耗型,这会大大降低nginx的代理能力。
1) 在中小型应用中(PV在KW级别,单一垂直web应用),通常一个nginx代理多个(组)server即可。
2)对于大中型应用,一个nginx将无法支撑全部的流量,我们将会采用多个nginx代理,并在nginx前端继续构建高性能的分流设备,比如LVS、Haproxy等更低层的软/硬件负载均衡器,这种负载均衡器通常只是“转发”,而不涉及到流量的输出,所以转发效率将会更高,承载能力更强。
3)无论何时,我们也不希望nginx存在单点故障问题,那么通常我们还需要使用keepalived(其他同类型技术,VIP)来提高nginx节点的可用性,即Master-backup模式。
4)当有多个nginx时,为了提升后端server的代理能力,通常还会让多个nginx之间交叉重叠代理后端的server。


二、什么是反向代理?
首先,我们常说的代理实际上是正向代理,它隐藏了真实的请求客户端,服务端不知道真实的客户端是谁,客户端请求的服务都被代理服务器代替来请求。科学上网工具 Shadowsocks 扮演的就是典型的正向代理角色。在国内用浏览器访问 www.google.com 时会被无情的墙掉,要想冲破这堵墙,你可以在国外用 Shadowsocks 来搭建一台代理服务器,让代理帮我们去请求 www.google.com,代理再把请求响应结果再返回给我。
反向代理方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个反向代理服务器。反向代理隐藏了真实的服务端,当我们访问 www.baidu.com 的时候,背后可能有成千上万台服务器为我们服务。但具体是哪一台,你不知道,也不需要知道,你只需要知道反向代理服务器是谁就好了。www.baidu.com 就是我们的反向代理服务器,反向代理服务器会帮我们把请求转发到提供真实计算的服务器那里去。Nginx 就是性能非常好的反向代理服务器,它可以用来做负载均衡。


三、nginx的安装与常用命令
1、安装
在nginx官网下载。发布版本分为Linux和windows版本。也可以下载源码,编译后运行。
这里只介绍Windows版本下的安装
为了安装Nginx/Win32,需先下载它。然后解压之,然后运行即可。下面以C盘根目录为例说明下:
cd C:
cd C:\nginx-0.8.54   start nginx
Nginx/Win32是运行在一个控制台程序,而非windows服务方式的。
2、常用命令
nginx的使用比较简单,就是几条命令。
常用到的命令如下:
nginx -s stop       快速关闭Nginx,可能不保存相关信息,并迅速终止web服务。
nginx -s quit       平稳关闭Nginx,保存相关信息,有安排的结束web服务。
nginx -s reload     因改变了Nginx相关配置,需要重新加载配置而重载。
nginx -s reopen     重新打开日志文件。
nginx -c filename   为 Nginx 指定一个配置文件,来代替缺省的。
nginx -t            不运行,而仅仅测试配置文件。nginx 将检查配置文件的语法的正确性,并尝试打开配置文件中所引用到的文件。
nginx -v            显示 nginx 的版本。
nginx -V            显示 nginx 的版本,编译器版本和配置参数。


四、nginx常用配置详解
首先来看一个常规配置样例:
#user  nobody;  worker_processes  2;  worker_rlimit_core 256m;  worker_rlimit_nofile 65535;    error_log  logs/error.log  info;    #pid        logs/nginx.pid;    daemon on;  worker_priority 0;    events {      #use epoll;      use kqueue;#linux 请使用epoll      accept_mutex on;      accept_mutex_delay 500ms;      worker_connections  65535;  }      http {      include       mime.types;      default_type  application/octet-stream;        log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '                        '$status $body_bytes_sent "$http_referer" '                        '"$http_user_agent" "$http_x_forwarded_for"';        sendfile        on;      #tcp_nopush     on;      keepalive_timeout  65;        server {          listen       80;          server_name  localhost;          access_log  logs/localhost.access.log  main;            location / {              root   html;              index  index.html index.htm;          }            error_page  404              /404.html;          error_page   500 502 503 504  /50x.html;          location = /50x.html {              root   html;          }        include vhosts/*.conf;  }  
上面的配置信息应该是最基本的,基本上nginx能够对静态页面做代理,下文中所有的模块都基于这个配置模板。
1、静态文件代理
nginx一个重要的能力就是静态文件的代理(或cache),包括html、images等,这些静态文件通常放置在本地,比如:/data/www(一些html文件,css,js等),/data/images(图片文件)。相关配置如下:
location / {      root   html;      #index  index.html index.htm;  }    location /images {      root /data;  }  
“root”表示文件所在的本地路径,最终请求的uri将会被添加到root路径之后,形成完整的文件路径,比如“127.0.0.1/images/header.jpg”,其uri为“images/header.jpg”,那么最终将会访问本地的“/data/images/header.jpg”(如果本地文件没有访问权限,将会抛出“Permission denied”)。此处还涉及到location的匹配优先级的问题,就像“/images/header.jpg”对于location为“/”和“/images”都匹配,在这种情况下,nginx将会选择“最长前缀”的哪一个,即“/images”;此外,location还能支持正则表达式,所以匹配的规则将会比较复杂。

2、动态文件代理
对于动态代理,需要配置一个(或一组,通过upstream模块支持)web server,nginx接收客户端请求(可以对header进行修改),然后传递给web server,并等待接收proxy server的响应内容,然后再把response发送给客户端(可以对response的内容或者header进行修改),在此过程中,nginx需要与客户端、web server均要建立链接,nginx就像一个“转发桥”,只是负责将请求,根据location或者其他规则,匹配到一个合适的web server上。相关配置如下:
server {      listen 80 default_server;      server_name localhost;      location / {          proxy_pass http://127.0.0.1:8080;      }  }  

对于动态代理,需要配置一个(或一组,通过upstream模块支持)web server,nginx接收客户端请求(可以对header进行修改),然后传递给web server,并等待接收proxy server的响应内容,然后再把response发送给客户端(可以对response的内容或者header进行修改),在此过程中,nginx需要与客户端、web server均要建立链接,nginx就像一个“转发桥”,只是负责将请求,根据location或者其他规则,匹配到一个合适的web server上。相关配置如下:

server {      listen 80;      server_name example.org www.example.org;  }  server {      listen 80;      server_name *.example.org;  }  server {      listen 80;      server_name mail.*;  }  server {      listen 80;      server_name ~^(?<name>.+)\.example\.net$;  }  
对于指定的请求,nginx从header中host值,将按照如下顺序进行匹配:

1)精确的全限定名:比如server_name为“www.exmaple.org”,“example.org”。
2)以“*”开头的最长的通配名称:比如server_name为“*.exmaple.org”。
3)以“*”结束的最长的通配名称:比如server_name为“mail.*”。
4)首个匹配的正则表达式。nginx中正则表达式以“~”或者“~*”开头。
注意,在nginx中,通配表达式和正则表达式被认为是不同的,通配表达式必须以“*”开头或者结束,且“*”不能在字符串的中间出现,比如“www.*.example.org”是不合法的;否则应该在正则表达式中使用“*”,比如“~^w.*\.exmaple\.org$”,注意如果在正则表达式中使用字符串“.”,应该需要转义为“\.”,否则“.”是被作为正则表达式中特殊模式(即匹配任意字符串);通配表达式,“*”可以匹配任意多个部分,比如“*.example.org”可以匹配“www.exmaple.org”、“www.sub.exmaple.org”;那么对于“.example.org”这种格式被认为是一种特殊的正则表达式,它可以匹配“exmaple.org”、“*.example.org”。
nginx中正则表达式必须以“~”开头(或者~*开头,表示字符大小写敏感)、“^”、“$”结尾,这三个特殊符号构成nginx(或者说是PCRE)正则表达式,否则被认为是普通的“全限定名”。如果你了解过正则表达式,其实这些还是非常容易理解的,不过如果正则表达式中包括“{”、“}”表示匹配次数区间,那么整个表达式都需要用引号包含,否则会编译错误。

假如有如下配置:
server {      listen 80 default_server;      server_name _;  }  
如上述例子所示,“default_server”表示为如果没有任何匹配的server_name时,将选择此server来处理。其中server_name如果配置为“_”,则表示此server匹配所有的“Host”,这些Host仅为那些不能通过“精确全限定名”、“通配表达式”、“正则表达式”匹配的。根据server侦听的端口号,将会把“精确匹配”、“以*开头的通配表达式”、“以*结尾的通配表达式”保存在三个hashtable中(cache),这个hashtable的大小可以通过配置文件调整;针对一个host,将会首先使用“精确匹配”,如果没有找到相应的server_name,将会从“以*开头的通配表达式”中查找,然后再从“已*结尾的通配表达式”中查找;从“通配表达式”的hashtable中查找,要慢于“精确匹配”,不过对于“.example.org”这种格式会被保存在“通配表达式”的hashtable中,而不是保存在“精确匹配”的hashtable中。对于“正则表达式”时最慢的一种方式,也是最后参与匹配的,将会根据它们在配置文件中的顺序,依次去匹配。基于这些原因,比较好的办法就是尽可能的使用“精确全限定名”,比如:
server {      server_name example.org www.example.org *.example.org;  }  server {      server_name sub.example.org;  }
而不要使用如下配置:
server {      server_name .example.org;  }  
如果你定义了较多的server配置或者较长的server_name字符串,那么就需要通过“server_names_hash_max_size”(会影响server_name的个数)、“server_names_hash_bucket_size”(影响server_name的字符串长度)来调整配置,否则会抛出错误。当然我们不需要贸然去调整这两个参数,除非它出错。

3、负载均衡
使用nginx,其实还对其“负载均衡”的特性比较看重。通常我们有多个web server对等部署,nginx将会通过“负载均衡”模块将请求转发给合适的web server,最终提升了web站点的整体吞吐能力,同时也提高了可用性。需要注意,nginx目前是Http层面的负载均衡器,在1.9V之后将提供TCP层面的负载均衡支持。如下为nginx内置的负载均衡算法:
1)round-robin:轮询,request将会依次有序的分发给web server。one by one!默认使用此算法。
2)least-connected:最小连接数,请求将会被分发给当前链接数最小的server。配置名“least_conn”。
3)ip-hash:根据请求的客户端IP作为hashing key,来判定选择哪个server。配置名“ip_hash”。
配置样例:
http {      upstream backend {          ##least_conn;          server 192.168.1.110 weight=3;          server 192.168.1.120;      }      server {          listen 80 default_server;          #          server_name _;          location / {              proxy_pass http://backend;          }      }  }  
上述配置,就是一个简单的“负载均衡”的样例,首先在一个“upstream”区块中声明server列表,然后在proxy_pass指令中使用它;如果没有声明“负载均衡”算法,那么默认就是用“round-robin”,其他可选值为“least_conn”、“ip_hash”,“负载均衡”算法需要在upstream区块的首行声明。
“least_conn”算法可以让全局的性能开支,在多个server之间趋于平衡,因为不同的server可能在物理性能上就有差距,而且不同的request处理耗时也不尽相同;如果希望处理比较快的server能够尽可能的接收更多的请求,那些负载较高的server也能稳步推进(后续我们会提到流量控制)那么“least_conn”算法将非常适合。通常我们在production环境中,均采用此算法。
“least_conn”和“round-robin”算法,将会把一个客户端(来自同一个IP)的请求分发给不同的server上,这在某些情况下并不妥,比如“粘性session”,同一个客户端的请求应该被转发给同一个server(除非此server失效后,才会被转发到其他server),否则session会话中的数据将会丢失。那么“ip_hash”算法将比较适合。不过基于残酷的现实,粘性session的设计方案并不通用。能够影响负载均衡策略的还有一个重要的参数:权重;“权重”用来标记某个server承载请求的“优先级”,通常权重越高的server将优先获得客户端请求,事实上“权重”也是表示一个server“承载”能力的大小,我们通常可以对硬件配置较高的server给予较高的权重,这有点像粗颗粒的“虚拟化”,如果一个server的硬件配置是另一个的2倍,那么可以将权重值设置为其2倍。默认upstream中所有的server权重都一样,那么“负载均衡”算法将平等对待它们。
五、nginx配置示例
1、http反向代理配置
nginx.conf配置文件如下:
注:conf/nginx.conf是nginx的默认配置文件。你也可以使用nginx -c指定你的配置文件
#运行用户#user somebody;#启动进程,通常设置成和cpu的数量相等worker_processes  1;#全局错误日志error_log  D:/Tools/nginx-1.10.1/logs/error.log;error_log  D:/Tools/nginx-1.10.1/logs/notice.log  notice;error_log  D:/Tools/nginx-1.10.1/logs/info.log  info;#PID文件,记录当前启动的nginx的进程IDpid        D:/Tools/nginx-1.10.1/logs/nginx.pid;#工作模式及连接数上限events {    worker_connections 1024;    #单个后台worker process进程的最大并发链接数}#设定http服务器,利用它的反向代理功能提供负载均衡支持http {    #设定mime类型(邮件支持类型),类型由mime.types文件定义    include       D:/Tools/nginx-1.10.1/conf/mime.types;    default_type  application/octet-stream;        #设定日志    log_format  main  '[$remote_addr] - [$remote_user] [$time_local] "$request" '                      '$status $body_bytes_sent "$http_referer" '                      '"$http_user_agent" "$http_x_forwarded_for"';                          access_log    D:/Tools/nginx-1.10.1/logs/access.log main;    rewrite_log     on;        #sendfile 指令指定 nginx 是否调用 sendfile 函数(zero copy 方式)来输出文件,对于普通应用,    #必须设为 on,如果用来进行下载等应用磁盘IO重负载应用,可设置为 off,以平衡磁盘与网络I/O处理速度,降低系统的uptime.    sendfile        on;    #tcp_nopush     on;    #连接超时时间    keepalive_timeout  120;    tcp_nodelay        on;        #gzip压缩开关    #gzip  on;     #设定实际的服务器列表     upstream zp_server1{        server 127.0.0.1:8089;    }    #HTTP服务器    server {        #监听80端口,80端口是知名端口号,用于HTTP协议        listen       80;                #定义使用www.xx.com访问        server_name  www.helloworld.com;                #首页        index index.html                #指向webapp的目录        root D:\Workspace\Project\src\main\webapp;                #编码格式        charset utf-8;                #代理配置参数        proxy_connect_timeout 180;        proxy_send_timeout 180;        proxy_read_timeout 180;        proxy_set_header Host $host;        proxy_set_header X-Forwarder-For $remote_addr;        #反向代理的路径(和upstream绑定),location 后面设置映射的路径        location / {            proxy_pass http://zp_server1;        }         #静态文件,nginx自己处理        location ~ ^/(images|javascript|js|css|flash|media|static)/ {            root D:\Workspace\Project\src\main\webapp\views;            #过期30天,静态文件不怎么更新,过期可以设大一点,如果频繁更新,则可以设置得小一点。            expires 30d;        }            #设定查看Nginx状态的地址        location /NginxStatus {            stub_status           on;            access_log            on;            auth_basic            "NginxStatus";            auth_basic_user_file  conf/htpasswd;        }            #禁止访问 .htxxx 文件        location ~ /\.ht {            deny all;        }                #错误处理页面(可选择性配置)        #error_page   404              /404.html;        #error_page   500 502 503 504  /50x.html;        #location = /50x.html {        #    root   html;        #}    }}
启动webapp,注意启动绑定的端口要和nginx中的upstream设置的端口保持一致。
更改host:在C:\Windows\System32\drivers\etc目录下的host文件中添加一条DNS记录
127.0.0.1 www.helloworld.com
通过start nginx.exe命令启动nginx。
在浏览器中访问www.helloworld.com,不出意外,已经可以访问了。

2、负载均衡配置
上一个例子中,代理仅仅指向一个服务器。但是,网站在实际运营过程中,多半都是有多台服务器运行着同样的app,这时需要使用负载均衡来分流。nginx也可以实现简单的负载均衡功能。
假设这样一个应用场景:将应用部署在192.168.1.11:80、192.168.1.12:80、192.168.1.13:80三台linux环境的服务器上。网站域名叫www.helloworld.com,公网IP为192.168.1.11。在公网IP所在的服务器上部署nginx,对所有请求做负载均衡处理。
nginx.conf配置如下:
http {     #设定mime类型,类型由mime.type文件定义    include       /etc/nginx/mime.types;    default_type  application/octet-stream;    #设定日志格式    access_log    /var/log/nginx/access.log;    #设定负载均衡的服务器列表    upstream load_balance_server {        #weigth参数表示权值,权值越高被分配到的几率越大        server 192.168.1.11:80   weight=5;        server 192.168.1.12:80   weight=1;        server 192.168.1.13:80   weight=6;    }   #HTTP服务器   server {        #侦听80端口        listen       80;                #定义使用www.xx.com访问        server_name  www.helloworld.com;        #对所有请求进行负载均衡请求        location / {            root        /root;                 #定义服务器的默认网站根目录位置            index       index.html index.htm;  #定义首页索引文件的名称            proxy_pass  http://load_balance_server ;#请求转向load_balance_server 定义的服务器列表            #以下是一些反向代理的配置(可选择性配置)            #proxy_redirect off;            proxy_set_header Host $host;            proxy_set_header X-Real-IP $remote_addr;            #后端的Web服务器可以通过X-Forwarded-For获取用户真实IP            proxy_set_header X-Forwarded-For $remote_addr;            proxy_connect_timeout 90;          #nginx跟后端服务器连接超时时间(代理连接超时)            proxy_send_timeout 90;             #后端服务器数据回传时间(代理发送超时)            proxy_read_timeout 90;             #连接成功后,后端服务器响应时间(代理接收超时)            proxy_buffer_size 4k;              #设置代理服务器(nginx)保存用户头信息的缓冲区大小            proxy_buffers 4 32k;               #proxy_buffers缓冲区,网页平均在32k以下的话,这样设置            proxy_busy_buffers_size 64k;       #高负荷下缓冲大小(proxy_buffers*2)            proxy_temp_file_write_size 64k;    #设定缓存文件夹大小,大于这个值,将从upstream服务器传                        client_max_body_size 10m;          #允许客户端请求的最大单文件字节数            client_body_buffer_size 128k;      #缓冲区代理缓冲用户端请求的最大字节数        }    }}

3、基于nginx缓存的配置
upstream static_backend {      server 192.168.1.198:8080;      server 127.0.0.1:8080;  }  #设置Web缓存区名称为cache_one,内存缓存空间大小为256MB,1天没有被访问的内容自动清除,硬盘缓存空间大小为30GB。  proxy_temp_path   /home/proxy_temp_dir;  proxy_cache_path  /home/proxy_cache_path levels=1:2 keys_zone=cache_one:256m inactive=1d max_size=30g;    server {      listen       80;      server_name static.example.org;      location / {              proxy_next_upstream http_502 http_504 error timeout invalid_header;              proxy_cache cache_one;#nginx本地cache开启              proxy_cache_valid 200 304 30d;              proxy_cache_valid 301 302 404 1m;              proxy_cache_valid any 1m;              proxy_cache_key $host$request_uri;            add_header X-Proxy-Cache $upstream_cache_status;              proxy_set_header  Host $host;              proxy_set_header  X-Real-IP  $remote_addr;              proxy_set_header  X-Forwarded-For $proxy_add_x_forwarded_for;              proxy_set_header X-Forwarded-For $remote_addr;              proxy_set_header If-Modified-Since $http_if_modified_since;            expires 30d;#客户端缓存,在header中增加“Expires”          add_header Cache-Control public;          proxy_pass http://static_backend;              if_modified_since before;          }      #location ~ /purge(/.*) {          # allow 127.0.0.1;          # allow 192.168.1.0/24;          # deny  all;          # proxy_cache_purge cache_one $host$1$is_args$args;      # }      #https://github.com/FRiCKLE/ngx_cache_purge/      access_log  /home/wwwlogs/static.example.org.log  access;  }  
4、网站有多个webapp的配置
当一个网站功能越来越丰富时,往往需要将一些功能相对独立的模块剥离出来,独立维护。这样的话,通常,会有多个webapp。举个例子:假如www.helloworld.com站点有好几个webapp,finance(金融)、product(产品)、admin(用户中心)。访问这些应用的方式通过上下文(context)来进行区分:
www.helloworld.com/finance/
www.helloworld.com/product/
www.helloworld.com/admin/
我们知道,http的默认端口号是80,如果在一台服务器上同时启动这3个webapp应用,都用80端口,肯定是不成的。所以,这三个应用需要分别绑定不同的端口号。
那么,问题来了,用户在实际访问www.helloworld.com站点时,访问不同webapp,总不会还带着对应的端口号去访问吧。所以,你再次需要用到反向代理来做处理。
http {    #此处省略一些基本配置        upstream product_server{        server www.helloworld.com:8081;    }        upstream admin_server{        server www.helloworld.com:8082;    }        upstream finance_server{        server www.helloworld.com:8083;    }    server {        #此处省略一些基本配置        #默认指向product的server        location / {            proxy_pass http://product_server;        }        location /product/{            proxy_pass http://product_server;        }        location /admin/ {            proxy_pass http://admin_server;        }                location /finance/ {            proxy_pass http://finance_server;        }    }}
5、https反向代理配置
一些对安全性要求比较高的站点,可能会使用HTTPS(一种使用ssl通信标准的安全HTTP协议)。使用nginx配置https需要知道几点:
HTTPS的固定端口号是443,不同于HTTP的80端口。
SSL标准需要引入安全证书,所以在nginx.conf中你需要指定证书和它对应的key。
其他和http反向代理基本一样,只是在Server部分配置有些不同。

  #HTTP服务器  server {      #监听443端口。443为知名端口号,主要用于HTTPS协议      listen       443 ssl;      #定义使用www.xx.com访问      server_name  www.helloworld.com;      #ssl证书文件位置(常见证书文件格式为:crt/pem)      ssl_certificate      cert.pem;      #ssl证书key位置      ssl_certificate_key  cert.key;      #ssl配置参数(选择性配置)      ssl_session_cache    shared:SSL:1m;      ssl_session_timeout  5m;      #数字签名,此处使用MD5      ssl_ciphers  HIGH:!aNULL:!MD5;      ssl_prefer_server_ciphers  on;      location / {          root   /root;          index  index.html index.htm;      }  }


0 0
原创粉丝点击