正向代理与反向代理

来源:互联网 发布:excel单元格重复数据 编辑:程序博客网 时间:2024/06/14 06:10

以下内容收集整理自知乎,感谢原作者,有知乎账号的同学们可以去点点赞 https://www.zhihu.com/question/24723688


先说正向代理 forward  proxy

A同学在大众创业、万众创新的大时代背景下开启他的创业之路,目前他遇到的最大的一个问题就是启动资金,于是他决定去找马云爸爸借钱,可想而知,最后碰一鼻子灰回来了,情急之下,他想到一个办法,找关系开后门,经过一番消息打探,原来A同学的大学老师王老师是马云的同学,于是A同学找到王老师,托王老师帮忙去马云那借500万过来,当然最后事成了。不过马云并不知道这钱是A同学借的,马云是借给王老师的,最后由王老师转交给A同学。这里的王老师在这个过程中扮演了一个非常关键的角色,就是代理,也可以说是正向代理,王老师代替A同学办这件事,这个过程中,真正借钱的人是谁,马云是不知道的,这点非常关键。   我们常说的代理也就是只正向代理,正向代理的过程,它隐藏了真实的请求客户端,服务端不知道真实的客户端是谁,客户端请求的服务都被代理服务器代替来请求,某些科学上网工具扮演的就是典型的正向代理角色。用浏览器访问 http://www.google.com 时,被残忍的block,于是你可以在国外搭建一台代理服务器,让代理帮我去请求google.com,代理把请求返回的相应结构再返回给我。

反向代理  reverse proxy

大家都有过这样的经历,拨打10086客服电话,可能一个地区的10086客服有几个或者几十个,你永远都不需要关心在电话那头的是哪一个,叫什么,男的,还是女的,漂亮的还是帅气的,你都不关心,你关心的是你的问题能不能得到专业的解答,你只需要拨通了10086的总机号码,电话那头总会有人会回答你,只是有时慢有时快而已。那么这里的10086总机号码就是我们说的反向代理。客户不知道真正提供服务人的是谁。   

反向代理隐藏了真实的服务端,当我们请求 www.baidu.com 的时候,就像拨打10086一样,背后可能有成千上万台服务器为我们服务,但具体是哪一台,你不知道,也不需要知道,你只需要知道反向代理服务器是谁就好了,www.baidu.com 就是我们的反向代理服务器,反向代理服务器会帮我们把请求转发到真实的服务器那里去。多个服务器来共同分担成千上万的用户请求,这些服务器提供相同的服务,对于用户来说,根本感觉不到任何差别。Nginx就是性能非常好的反向代理服务器,用来做负载均衡。



使用正向代理的过程如下 

1,客户端连接代理。 

2,代理连接服务器。 

3,服务器将结果发给代理。 

4,代理将结果发给客户端。 


反向代理的过程如下: 

1,客户端连接服务器,其实连接的是反向代理服务器,但是客户端不知道。 

2,反向代理将请求转发给相应的服务器。 

3,服务器将结果发给反向代理。 

4,方向代理将结果发给客户端。 

流程基本一样,主要是反向代理是和服务器部署在一起,如nginx,haproxy,但客户端不知道反向代理的存在。反向代理知道服务器集群的情况,知道怎么转发请求给具体的服务器。而正向代理只能转发给相应的域名对应的服务器。反向代理因为和服务器部署在一起,所以可以用来做负载均衡,对客户端请求进行各种处理(如统计连接数,拒绝连接等)等等。 

主要记住,反向代理是和服务器集群在一起的,并且知道集群的内部情况。



简言而之:

正向代理,在客户端配置, 藏真实客户端, 服务端不知道实际发起请求的客户端.

反向代理,在服务端配置, 隐藏真实服务端, 客户端不知道实际提供服务的服务端.

多说一句,反向代理不只是负载均衡,还可以用来处理一些服务器和客户端不能直连的场景。把反向代理叫成负载均衡器就好像把代理叫成翻墙器一样。

反向代理的实现

1)需要有一个负载均衡设备来分发用户请求,将用户请求分发到空闲的服务器上

2)服务器返回自己的服务到负载均衡设备

3)负载均衡将服务器的服务返回用户

以上的潜台词是:用户和负载均衡设备直接通信,也意味着用户做服务器域名解析时,解析得到的IP其实是负载均衡的IP,而不是服务器的IP,这样有一个好处是,当新加入/移走服务器时,仅仅需要修改负载均衡的服务器列表,而不会影响现有的服务。


使用反向代理访问baidu.com的话,我们本地根本就不用配置,因为啊,这个反向代理其实是服务器端的配置。而且其实我们一直都是用反向代理访问大多数网站的。
我们访问的baidu.com,然后从这个服务器拿到的资源,其实可能这些资源并不是从这个服务器里拿出来的,而是这个服务器作为反向代理,从别的服务器拿过来的。
你以为你是这样访问百度的

而实际上你是这么访问百度的
<img src="https://pic1.zhimg.com/v2-8b39ecf03c72f6b30cf4fd3e25aa5150_b.jpg" data-rawwidth="730" data-rawheight="192" class="origin_image zh-lightbox-thumb" width="730" data-original="https://pic1.zhimg.com/v2-8b39ecf03c72f6b30cf4fd3e25aa5150_r.jpg">而实际上你是这么访问百度的<img src="https://pic3.zhimg.com/v2-3ef0905e6342500107ce72c2de7b254a_b.jpg" data-rawwidth="1031" data-rawheight="374" class="origin_image zh-lightbox-thumb" width="1031" data-original="https://pic3.zhimg.com/v2-3ef0905e6342500107ce72c2de7b254a_r.jpg">所以我们用反向代理,这个反向代理就相当于一个统筹资源的作用