Nginx反向代理和负载均衡

来源:互联网 发布:美国农业部报告 数据 编辑:程序博客网 时间:2024/05/21 10:17

代理服务器英文全称是(Proxy Server),其功能就是代理网络用户去取得网络信息。形象的说:它是网络信息的中转站。代理服务器就好象一个大的Cache,这样就能显著提高浏览速度和效率。更重要的是:Proxy Server(代理服务器)是Internet链路级网关所提供的一种重要的安全功能,主要的功能有:
1. 突破自身IP访问限制,访问国外站点www.google.com。
2. 网络用户可以通过代理访问国外网站。
3. 访问一些单位或团体内部资源,如某大学FTP(前提是该代理地址在该资源 的允许访问范围之内),使用教育网内地址段免费代理服务器,就可以用于对教育网开放的各类FTP下载上传,以及各类资料查询共享等服务。
4. 突破中国电信的IP封锁:中国电信用户有很多网站是被限制访问的,这种限制是人为的,不同Serve对地址的封锁是不同的。所以不能访问时可以换一个国外的代理服务器试试。
5. 隐藏真实IP:上网者也可以通过这种方法隐藏自己的IP,免受攻击。
鉴于上述原因,代理服务器大多被用来连接INTERNET都是独立的大型(国际互联网)和INTRANET(局域网)。
测试:浏览器设置http代理访问www.google.com

什么是反向代理CDN?
反向代理CDN的全称是Content Delivery Network,即内容分发网络。是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个反向代理服务器。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳定。通过在网络各处放置反向代理节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,CDN系统能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。其目的是使用户可就近取得所需内容,解决 Internet网络拥挤的状况,提高用户访问网站的响应速度。
CDN

Nginx反向代理的配置,Nginx 作为 web 服务器一个重要的功能就是反向代理。

在配置nginx反向代理之间我们得先准备两台测试服务器,Web1与Web2。
安装LAMP服务器(192.168.1.252和192.168.1.253),命令如下:

1
yum install -y httpd* php* mysql*

提供测试页面:index.html(内容:192.168.1.252 index.html)
启动httpd服务

1
service httpd start

下面是配置 Nginx 作为 Apache 的反向代理的设置:

1234
[root@nginx nginx]# vi nginx.conflocation / {proxy_pass      http://192.168.1.252;}

指令说明:proxy_pass
语法:proxy_pass URL
默认值:no
使用字段:location, location中的if字段
这个指令设置被代理服务器的地址和被映射的URI,地址可以使用主机名或IP加端口号的形式,例如:proxy_pass http://localhost:8000/uri/;

重新启动nginx,浏览器访问nginx反向代理服务器:http://192.168.1.245
看到的结果是:192.168.1.252 index.html ,代理成功!
查看192.168.1.252中Apache的访问日志,内容如下:
……………..省略
192.168.1.245 – – [15/Jan/2015:07:38:50 +0800] “GET / HTTP/1.0″ 200 25 “-” “Mozilla/5.0 (Windows NT 6.1; WOW64; rv:35.0) Gecko/20100101 Firefox/35.0″
192.168.1.245 – – [15/Jan/2015:07:38:53 +0800] “GET / HTTP/1.0″ 200 25 “-” “Mozilla/5.0 (Windows NT 6.1; WOW64; rv:35.0) Gecko/20100101 Firefox/35.0″
192.168.1.245 – – [15/Jan/2015:07:38:59 +0800] “GET / HTTP/1.0″ 304 – “-” “Mozilla/5.0 (Windows NT 6.1; WOW64; rv:35.0) Gecko/20100101 Firefox/35.0″
全部的访问都是245代理服务器发起的,但是我们想记录每个客户端的IP,如何设置?

1234
location / {proxy_pass      http://192.168.1.252;proxy_set_header  X-Real-IP  $remote_addr; //将访问代理服务器的客户端的ip赋值给X-Real-IP}

这个时候Apache日志中记录的就是真实的客户端IP

如果有多台Apache服务器怎么办?
Nginx可以配置负载均衡,根据不同的策略(默认轮询),分发请求到不同的服务器上
配置nginx负载均衡,具体内容如下:

123456789101112131415161718192021222324252627
[root@nginx ~]# vi nginx.confUpstream  Apache_servers {      server 192.168.1.252  weight=1 max_fails=2 fail_timeout=2;      server 192.168.1.253  weight=1 max_fails=2 fail_timeout=2;      server 192.168.1.251  backup;  //252和253失败后访问backup}server {      listen       80;      server_name  localhost;  ………………      location / {              proxy_pass      http://Apache_servers;              proxy_set_header  X-Real-IP  $remote_addr;  //其他的服务器变量雷同              #proxy_set_header Host $http_host;              #proxy_set_header X-Scheme $scheme;               #proxy_next_upstream error timeout invalid_header http_500 http_502 http_503 http_504;              #proxy_max_temp_file_size 0;              #proxy_connect_timeout90;              #proxy_send_timeout90;              #proxy_read_timeout90;              #proxy_buffer_size4k;              #proxy_buffers4 32k;              #proxy_busy_buffers_size64k;              #proxy_temp_file_write_size64k;      }}

注,upstream是定义在server{ }之外的,不能定义在server{ }内部。定义好upstream之后,用proxy_pass引用一下即可。Upstream之后的名字自定义即可,upstream是Nginx的HTTP Upstream模块,这个模块通过一个简单的调度算法来实现客户端IP到后端服务器的负载均衡。在上面的设定中,通过upstream指令指定了一个负载均衡器的名称Apache_servers。这个名称可以任意指定,在后面需要用到的地方直接调用即可。

upstream 支持的负载均衡算法
Nginx的负载均衡模块目前支持4种调度算法,下面进行分别介绍,其中后两项属于第三方调度算法。
轮询(默认)。每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某台服务器宕机,故障系统被自动剔除,使用户访问不受影响。Weight 指定轮询权值,Weight值越大,分配到的访问机率越高,主要用于后端每个服务器性能不均的情况下。
ip_hash。每个请求按访问IP的hash结果分配,这样来自同一个IP的访客固定访问一个后端服务器,有效解决了动态网页存在的session共享问题。
fair。这是比上面两个更加智能的负载均衡算法。此种算法可以依据页面大小和加载时间长短智能地进行负载均衡,也就是根据后端服务器的响应时间来分配请求,响应时间短的优先分配。Nginx本身是不支持fair的,如果需要使用这种调度算法,必须下载Nginx的upstream_fair模块。
url_hash。此方法按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率。Nginx本身是不支持url_hash的,如果需要使用这种调度算法,必须安装Nginx 的hash软件包。

upstream 支持的状态参数
在HTTP Upstream模块中,可以通过server指令指定后端服务器的IP地址和端口,同时还可以设定每个后端服务器在负载均衡调度中的状态。常用的状态有:
down,表示当前的server暂时不参与负载均衡。
backup,预留的备份机器。当其他所有的非backup机器出现故障或者忙的时候,才会请求backup机器,因此这台机器的压力最轻。
max_fails,允许请求失败的次数,默认为1。当超过最大次数时,返回proxy_next_upstream 模块定义的错误。
fail_timeout,在经历了max_fails次失败后,暂停服务的时间。max_fails可以和fail_timeout一起使用。
注,当负载调度算法为ip_hash时,后端服务器在负载均衡调度中的状态不能是weight和backup。

配置ip_hash负载均衡

123456
upstream Apache_servers {        ip_hash;  //设置调度算法        server 192.168.1.252 weight=1 max_fails=2 fail_timeout=2;        server 192.168.1.253 weight=1 max_fails=2 fail_timeout=2;        #server 192.168.1.251:80 backup;  //ip_hash不能启用备份服务器}
0 0