Web 请求过程

来源：互联网发布：洛枳扮演者晁然淘宝店编辑：程序博客网时间：2024/05/17 22:35

随着Web2.0时代的到来，互联网的网络架构已经从传统的C/S架构转变为更加方便、快捷的B/S架构。
B/S架构2方便的好处：
客户端使用统一的浏览器（Browser）。【IE、Firefox、GoogleChrome……】
服务端（Server）基于统一的HTTP。【Apache、ISS、Nginx、Tomcat、JBoss、Jetty……】

一、B/S网络架构
B/S网络架构从前端到后端都得到了简化，都基于统一的应用层协议HTTP来交互数据。
传统的C/S互联网应用程序采用的是长连接的交互模式。
HTTP采用的是无状态的短连接的通信方式，通常，一次请求就完成了一次数据交互，通常也对应一个业务逻辑，然后这次通信连接就断开了。
采用这种方式能同时服务更多的用户，现在互联网每天都会处理上亿的用户请求，不可能每个用户访问一次之后就一直保持这个连接。

二、一次http的请求过程：
1、浏览器输入www.csdn.net这个URL（统一资源定位符）
2、请求DNS服务器把这个域名解析成IP
3、根据IP找到互联网上对应的服务器
4、向这个服务器发起一个GET请求
5、服务器返回数据资源给用户
服务器端其实有很多复杂的业务逻辑：服务器有很多台，需要一个负载均衡设备来分发用户的请求；请求的数据存储在分布式缓存里还是一个静态文件中，或者在数据库里；
6、客户端浏览器解析数据
解析发现还有一些静态资源（如JS、CSS或者图片），浏览器又会发起HTTP请求，通常会请求到CDN服务器，CDN服务器将静态资源返回给用户。

发起HTTP请求和建立一个Socket连接区别不大。其实发起一个HTTP连接本质上就是建立一个Socket连接。

模拟HTTP请求

三、HTTP报文：
HTTP报文是面向文本的，报文中的每一个字段都是一些ASCII码串，各个字段的长度是不确定的。
HTTP有两类报文：请求报文和响应报文。

1）HTTP请求报文：
HTTP请求报文由3部分组成（请求行+请求头+请求体）：

一个实际的请求报文：

① 是请求方法，GET和POST是最常见的HTTP方法，除此以外还包括DELETE、HEAD、OPTIONS、PUT、TRACE。不过，当前的大多数浏览器只支持GET和POST，Spring 3.0提供了一个HiddenHttpMethodFilter，允许你通过“_method”的表单参数指定这些特殊的HTTP方法（实际上还是通过POST提交表单）。服务端配置了HiddenHttpMethodFilter后，Spring会根据_method参数指定的值模拟出相应的HTTP方法，这样，就可以使用这些HTTP方法对处理方法进行映射了。

② 为请求对应的URL地址，它和报文头的Host属性组成完整的请求URL，

③是协议名称及版本号。

④ 是HTTP的报文头，报文头包含若干个属性，格式为“属性名:属性值”，服务端据此获取客户端的信息。
⑤ 是报文体，它将一个页面表单中的组件值通过param1=value1&param2=value2的键值对形式编码成一个格式化串，它承载多个请求参数的数据。不但报文体可以传递请求参数，请求URL也可以通过类似于“/chapter15/user.html? param1=value1&param2=value2”的方式传递请求参数。

对照上面的请求报文，我们把它进一步分解，你可以看到一幅更详细的结构图：

所以也可以说：HTTP请求报文由请求行（request line）、请求头（header）、空行和请求数据4个部分组成

2）HTTP请求报文头属性：
Accept

请求报文可通过一个 Accept 报文头属性告诉服务端，客户端接受什么类型的响应。

Accept:text/plain 客户端能够接受的响应类型仅为纯文本数据

Cookie:skin=blue; jsessionid=5F4771183629C9834F8382E23BE13C4C
服务端是怎么知道客户端的多个请求是属于一个Session的，原来就是通过HTTP请求报文头的Cookie属性的jsessionid的值关联起来的！
（当然也可以通过重写URL的方式将会话ID附带在每个URL的后后面哦）。

Referer
表示这个请求是从哪个URL过来的，假如你通过google搜索出一个商家的广告页面，你对这个广告页面感兴趣，鼠标一点发送一个请求报文到商家的网站，这个请求报文的Referer报文头属性值就是 http://www.google.com。

Cache-Control
对缓存进行控制，如一个请求希望响应返回的内容在客户端要被缓存一年，或不希望被缓存就可以通过这个报文头达到目的。
【Ctrl + F5】Cache-Control: no-cache 不使用本地缓存，强制服务端返回最新结果

3）如何访问请求报文头

由于请求报文头是客户端发过来的，服务端当然只能读取了，以下是 HttpServletRequest 一些用于读取请求报文头的API：

//获取请求报文中的属性名称java.util.Enumeration<java.lang.String> getHeaderNames();//获取指定名称的报文头属性的值java.lang.String getHeader(java.lang.String name)

由于一些请求报文头属性“太著名”了，因此HttpServletRequest为它们提供了VIP的API：

//获取报文头中的Cookie(读取Cookie的报文头属性） Cookie[]   getCookies() ;//获取客户端本地化信息（读取 Accept-Language 的报文头属性）java.util.Locale    getLocale()//获取请求报文体的长度（读取Content-Length的报文头属性）int getContentLength();

HttpServletRequest可以通过 HttpSession getSession()
获取请求所关联的HttpSession,其内部的机理是通过读取请求报文头中Cookie属性的JSESSIONID的值，在服务端的一个会话Map中，根据这个JSESSIONID获取对应的HttpSession的对象。

4）HTTP响应报文：
HTTP的响应报文也由三部分组成（响应行+响应头+响应体）：

以下是一个实际的HTTP响应报文：

① 报文协议及版本；
② 状态码及状态描述；
③ 响应报文头，也是由多个属性组成；
④ 响应报文体，即我们真正要的“干货”

响应状态码：【加入书上的一部分】

HTTP的响应状态码由5段组成：

1xx 消息，一般是告诉客户端，请求已经收到了，正在处理，别急...
2xx 处理成功，一般表示：请求收悉、我明白你要的、请求已受理、已经处理完成等信息.
3xx 重定向到其它地方。它让客户端再发起一个请求以完成整个处理。
4xx 处理发生错误，责任在客户端，如客户端的请求一个不存在的资源，客户端未被授权，禁止访问等。
5xx 处理发生错误，责任在服务端，如服务端抛出异常，路由出错，HTTP版本不支持等。

200 OK

你最希望看到的，即处理成功！

303 See Other
我把你redirect到其它的页面，目标的URL通过响应报文头的Location告诉你。

304 Not Modified
告诉客户端，你请求的这个资源至你上次取得后，并没有更改，你直接用你本地的缓存吧，我很忙哦，你能不能少来烦我啊！

404 Not Found
你最不希望看到的，即找不到页面。如你在google上找到一个页面，点击这个链接返回404，表示这个页面已经被网站删除了，google那边的记录只是美好的回忆。

500 Internal Server Error
看到这个错误，你就应该查查服务端的日志了，肯定抛出了一堆异常，别睡了，起来改BUG去吧！

有些响应码，Web应用服务器会自动给生成。你可以通过HttpServletResponse的API设置状态码：

//设置状态码，状态码在HttpServletResponse中通过一系列的常量预定义了，如SC_ACCEPTED，SC_OKvoid    setStatus(int sc)

5）HTTP响应报文头属性：
Cache-Control
响应输出到客户端后，服务端通过该报文头属告诉客户端如何控制响应内容的缓存。
Cache-Control: max-age=3600 设置让客户端对响应内容缓存3600秒，也即在3600秒内，如果客户再次访问该资源，直接从客户端的缓存中返回内容给客户，不要再从服务端获取（当然，这个功能是靠客户端实现的，服务端只是通过这个属性提示客户端“应该这么做”，做不做，还是决定于客户端，如果是自己宣称支持HTTP的客户端，则就应该这样实现）。

ETag
ETag: "737060cd8c284d8af7ad3082f209582d"
一个代表响应服务端资源（如页面）版本的报文头属性，如果某个服务端资源发生变化了，这个ETag就会相应发生变化。可以减少请求和响应的交互。

Location

我们在JSP中让页面Redirect到一个某个A页面中，其实是让客户端再发一个请求到A页面，这个需要Redirect的A页面的URL，其实就是通过响应报文头的Location属性告知客户端的。

如下的报文头属性，将使客户端redirect到iteye的首页中：

Location: http://www.iteye.com/

Set-Cookie
Set-Cookie: UserID=Jack; Max-Age=3600; Version=1
服务端可以设置客户端的Cookie，其原理就是通过这个响应报文头属性实现的。

在服务端可以通过HttpServletResponse的API写响应报文头的属性：

//添加一个响应报文头属性void    setHeader(String name, String value)

像Cookie，Location这些响应头是有福之人，HttpServletResponse为它们都提供了VIP（非API 哈）：

//添加Cookie报文头属性void addCookie(Cookie cookie)//不但会设置Location的响应报文头，还会生成303的状态码呢，两者天仙配呢void    sendRedirect(String location)

参考链接：https://yq.aliyun.com/articles/44672

cookie和session 相关网址：http://blog.csdn.net/tangkuntktk/article/details/51992490

6）DNS解析：
1、检查浏览器缓存中是否有域名对应的IP
2、浏览器查找操作系统缓存中是否有域名对应的DNS解析结果，即本地DNS解析
3、操作系统把域名发送到本地区的域名服务器（LDNS:Local DNS Server）
4、LDNS没有命中，请求到Root Server 根域名服务器解析
5、Root Server 返回给 Local DNS Server 一个所有查询域的主域名服务器（gTLD Server）地址。gTLD是国际顶级域名服务器，如.com、.cn、.org等
6、Local DNS Server 再向 gTLD Server 发送请求
7、gTLD Server 查找并返回此域名对应的 Name Server域名服务器的地址（Name Server 通常就是你注册的域名服务器，例如你在某个域名服务提供商申请的域名，那么这个域名解析任务就由这个域名提供商的服务器来完成）
8、Name Server 域名服务器会查询此域名和IP的映射关系表，查询到IP，连同一个TTL值返回给 Local DNS Server
9、Local DNS Server 会缓存这个域名和IP的对应关系，缓存时间由TTL值决定
10、Local DNS Server 把解析结果返回给用户，用户根据TTL值缓存在本地系统缓存中。

7）CDN动态加速技术：
技术原理就是在CDN的DNS解析中通过动态的链路探测来寻找回源最好的一条路径，然后通过DNS的调度将所有请求调度到选定的这条路径上回源，从而加速用户的访问效率。

阅读全文

0 0