Web 请求过程

来源:互联网 发布:洛枳扮演者晁然淘宝店 编辑:程序博客网 时间:2024/05/17 22:35
随着Web2.0时代的到来,互联网的网络架构已经从传统的C/S架构转变为更加方便、快捷的B/S架构。
B/S架构2方便的好处:
客户端使用统一的浏览器(Browser)。【IE、Firefox、GoogleChrome……】
服务端(Server)基于统一的HTTP。【Apache、ISS、Nginx、Tomcat、JBoss、Jetty……】

一、B/S网络架构
B/S网络架构从前端到后端都得到了简化,都基于统一的应用层协议HTTP来交互数据。
传统的C/S互联网应用程序采用的是长连接的交互模式。
HTTP采用的是无状态的短连接的通信方式,通常,一次请求就完成了一次数据交互,通常也对应一个业务逻辑,然后这次通信连接就断开了。
采用这种方式能同时服务更多的用户,现在互联网每天都会处理上亿的用户请求,不可能每个用户访问一次之后就一直保持这个连接。

二、一次http的请求过程:
1、浏览器输入www.csdn.net这个URL统一资源定位符
2、请求DNS服务器把这个域名解析成IP
3、根据IP找到互联网上对应的服务器
4、向这个服务器发起一个GET请求
5、服务器返回数据资源给用户
服务器端其实有很多复杂的业务逻辑:服务器有很多台,需要一个负载均衡设备来分发用户的请求;请求的数据存储在分布式缓存里还是一个静态文件中,或者在数据库里;
6、客户端浏览器解析数据
解析发现还有一些静态资源(如JS、CSS或者图片),浏览器又会发起HTTP请求,通常会请求到CDN服务器,CDN服务器将静态资源返回给用户。

发起HTTP请求和建立一个Socket连接区别不大。其实发起一个HTTP连接本质上就是建立一个Socket连接。

模拟HTTP请求


三、HTTP报文:
HTTP报文是面向文本的,报文中的每一个字段都是一些ASCII码串,各个字段的长度是不确定的。
HTTP有两类报文:请求报文响应报文

1)HTTP请求报文:
HTTP请求报文由3部分组成(请求行+请求头+请求体):

一个实际的请求报文:


① 是请求方法,GETPOST是最常见的HTTP方法,除此以外还包括DELETEHEADOPTIONSPUTTRACE。不过,当前的大多数浏览器只支持GET和POST,Spring 3.0提供了一个HiddenHttpMethodFilter,允许你通过“_method”的表单参数指定这些特殊的HTTP方法(实际上还是通过POST提交表单)。服务端配置了HiddenHttpMethodFilter后,Spring会根据_method参数指定的值模拟出相应的HTTP方法,这样,就可以使用这些HTTP方法对处理方法进行映射了。

② 为请求对应的URL地址,它和报文头的Host属性组成完整的请求URL

③是协议名称及版本号。

④ 是HTTP的报文头,报文头包含若干个属性,格式为“属性名:属性值”,服务端据此获取客户端的信息。
⑤ 是报文体,它将一个页面表单中的组件值通过param1=value1&param2=value2的键值对形式编码成一个格式化串,它承载多个请求参数的数据。不但报文体可以传递请求参数,请求URL也可以通过类似于“/chapter15/user.html? param1=value1&param2=value2”的方式传递请求参数。

对照上面的请求报文,我们把它进一步分解,你可以看到一幅更详细的结构图:

所以也可以说:HTTP请求报文由请求行(request line)、请求头(header)、空行请求数据4个部分组成


2)HTTP请求报文头属性:
Accept

请求报文可通过一个 Accept 报文头属性告诉服务端,客户端接受什么类型的响应

Accept:text/plain 客户端能够接受的响应类型仅为纯文本数据


Cookie

Cookie:skin=blue; jsessionid=5F4771183629C9834F8382E23BE13C4C
服务端是怎么知道客户端的多个请求是属于一个Session的,原来就是通过HTTP请求报文头的Cookie属性的jsessionid的值关联起来的!
(当然也可以通过重写URL的方式将会话ID附带在每个URL的后后面哦)。

Referer
表示这个请求是从哪个URL过来的,假如你通过google搜索出一个商家的广告页面,你对这个广告页面感兴趣,鼠标一点发送一个请求报文到商家的网站,这个请求报文的Referer报文头属性值就是 http://www.google.com。

Cache-Control
对缓存进行控制,如一个请求希望响应返回的内容在客户端要被缓存一年,或不希望被缓存就可以通过这个报文头达到目的。
【Ctrl + F5】Cache-Control: no-cache 不使用本地缓存,强制服务端返回最新结果

3)如何访问请求报文头

由于请求报文头是客户端发过来的,服务端当然只能读取了,以下是 HttpServletRequest 一些用于读取请求报文头的API:

//获取请求报文中的属性名称java.util.Enumeration<java.lang.String> getHeaderNames();//获取指定名称的报文头属性的值java.lang.String getHeader(java.lang.String name)


由于一些请求报文头属性“太著名”了,因此HttpServletRequest为它们提供了VIP的API:

//获取报文头中的Cookie(读取Cookie的报文头属性) Cookie[]   getCookies() ;//获取客户端本地化信息(读取 Accept-Language 的报文头属性)java.util.Locale    getLocale()//获取请求报文体的长度(读取Content-Length的报文头属性)int getContentLength();

HttpServletRequest可以通过 HttpSession getSession()
获取请求所关联的HttpSession,其内部的机理是通过读取请求报文头中Cookie属性的JSESSIONID的值,在服务端的一个会话Map中,根据这个JSESSIONID获取对应的HttpSession的对象。

4)HTTP响应报文:
HTTP的响应报文也由三部分组成(响应行+响应头+响应体):

以下是一个实际的HTTP响应报文:

① 报文协议及版本;
② 状态码及状态描述;
③ 响应报文头,也是由多个属性组成;
④ 响应报文体,即我们真正要的“干货”

响应状态码:【加入书上的一部分】


HTTP的响应状态码由5段组成:

1xx 消息,一般是告诉客户端,请求已经收到了,正在处理,别急...
2xx 处理成功,一般表示:请求收悉、我明白你要的、请求已受理、已经处理完成等信息.
3xx 重定向到其它地方。它让客户端再发起一个请求以完成整个处理。
4xx 处理发生错误,责任在客户端,如客户端的请求一个不存在的资源,客户端未被授权,禁止访问等。
5xx 处理发生错误,责任在服务端,如服务端抛出异常,路由出错,HTTP版本不支持等。

200 OK

你最希望看到的,即处理成功!

303 See Other
我把你redirect到其它的页面,目标的URL通过响应报文头的Location告诉你。

304 Not Modified
告诉客户端,你请求的这个资源至你上次取得后,并没有更改,你直接用你本地的缓存吧,我很忙哦,你能不能少来烦我啊!

404 Not Found
你最不希望看到的,即找不到页面。如你在google上找到一个页面,点击这个链接返回404,表示这个页面已经被网站删除了,google那边的记录只是美好的回忆。

500 Internal Server Error
看到这个错误,你就应该查查服务端的日志了,肯定抛出了一堆异常,别睡了,起来改BUG去吧!

有些响应码,Web应用服务器会自动给生成。你可以通过HttpServletResponse的API设置状态码:
//设置状态码,状态码在HttpServletResponse中通过一系列的常量预定义了,如SC_ACCEPTED,SC_OKvoid    setStatus(int sc) 

5)HTTP响应报文头属性:
Cache-Control
响应输出到客户端后,服务端通过该报文头属告诉客户端如何控制响应内容的缓存。
Cache-Control: max-age=3600 设置让客户端对响应内容缓存3600秒,也即在3600秒内,如果客户再次访问该资源,直接从客户端的缓存中返回内容给客户,不要再从服务端获取(当然,这个功能是靠客户端实现的,服务端只是通过这个属性提示客户端“应该这么做”,做不做,还是决定于客户端,如果是自己宣称支持HTTP的客户端,则就应该这样实现)。

ETag
ETag: "737060cd8c284d8af7ad3082f209582d"
一个代表响应服务端资源(如页面)版本的报文头属性,如果某个服务端资源发生变化了,这个ETag就会相应发生变化。可以减少请求和响应的交互。

Location

我们在JSP中让页面Redirect到一个某个A页面中,其实是让客户端再发一个请求到A页面,这个需要Redirect的A页面的URL,其实就是通过响应报文头的Location属性告知客户端的。

如下的报文头属性,将使客户端redirect到iteye的首页中:

Location: http://www.iteye.com/


Set-Cookie
Set-Cookie: UserID=Jack; Max-Age=3600; Version=1
服务端可以设置客户端的Cookie,其原理就是通过这个响应报文头属性实现的。

在服务端可以通过HttpServletResponse的API写响应报文头的属性:
//添加一个响应报文头属性void    setHeader(String name, String value) 

像Cookie,Location这些响应头是有福之人,HttpServletResponse为它们都提供了VIP(非API 哈):
//添加Cookie报文头属性void addCookie(Cookie cookie)//不但会设置Location的响应报文头,还会生成303的状态码呢,两者天仙配呢void    sendRedirect(String location) 


参考链接:https://yq.aliyun.com/articles/44672

cookie和session 相关网址:http://blog.csdn.net/tangkuntktk/article/details/51992490

6)DNS解析:
1、检查浏览器缓存中是否有域名对应的IP
2、浏览器查找操作系统缓存中是否有域名对应的DNS解析结果,即本地DNS解析
3、操作系统把域名发送到本地区的域名服务器LDNS:Local DNS Server
4、LDNS没有命中,请求到Root Server 根域名服务器解析
5、Root Server 返回给 Local DNS Server 一个所有查询域的主域名服务器gTLD Server地址gTLD国际顶级域名服务器,如.com.cn.org
6、Local DNS Server 再向 gTLD Server 发送请求
7、gTLD Server 查找并返回此域名对应的 Name Server域名服务器的地址(Name Server 通常就是你注册的域名服务器,例如你在某个域名服务提供商申请的域名,那么这个域名解析任务就由这个域名提供商的服务器来完成)
8、Name Server 域名服务器会查询此域名和IP的映射关系表,查询到IP,连同一个TTL值返回给 Local DNS Server
9、Local DNS Server 会缓存这个域名和IP的对应关系,缓存时间由TTL值决定
10、Local DNS Server 把解析结果返回给用户,用户根据TTL值缓存在本地系统缓存中。

7)CDN动态加速技术:
技术原理就是在CDN的DNS解析中通过动态的链路探测寻找回源最好的一条路径,然后通过DNS的调度将所有请求调度到选定的这条路径上回源,从而加速用户的访问效率