HTTP协议研究

来源:互联网 发布:openstack是什么知乎 编辑:程序博客网 时间:2024/05/16 05:12

百度百科
超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。1960年美国人Ted Nelson构思了一种通过计算机处理文本信息的方法,并称之为超文本(hypertext),这成为了HTTP超文本传输协议标准架构的发展根基。Ted Nelson组织协调万维网协会(World Wide Web Consortium)和互联网工程工作小组(Internet Engineering Task Force )共同合作研究,最终发布了一系列的RFC,其中著名的RFC 2616定义了HTTP 1.1。

事务简单流程
获取一个IP—->dns域名解析—–>三次握手(SYN+ACK这两个搞,好像做C的对于这些非常了解)—>得到资源(浏览器一次连接好像会请求4-6个资源,请求不完要等下波)—–>浏览器获得资源渲染(例如html)—->四次放手(。。。。)事务流程相关

HTTP协议包含
通用头域、请求消息、响应消息和主体信息

HTTP常用头域(头域相当多,简单的列举几个,C端处理的时候会加上非常多的头域来进行交互)
1. Accept:告诉WEB服务器自己接受什么介质类型,/ 表示任何类型,type/* 表示该类型下的所有子类型,type/sub-type。

  1. Accept-Charset: 浏览器申明自己接收的字符集
    Accept-Encoding: 浏览器申明自己接收的编码方法,通常指定压缩方法,是否支持压缩,支持什么压缩方法(gzip,deflate)
    Accept-Language::浏览器申明自己接收的语言
    语言跟字符集的区别:中文是语言,中文有多种字符集,比如big5,gb2312,gbk等等。

  2. Age:当代理服务器用自己缓存的实体去响应请求时,用该头部表明该实体从产生到现在经过多长时间了。

  3. Cache-Control:请求:no-cache(不要缓存的实体,要求现在从WEB服务器去取)
    max-age:(只接受 Age 值小于 max-age 值,并且没有过期的对象)
    max-stale:(可以接受过去的对象,但是过期时间必须小于 max-stale 值)
    min-fresh:(接受其新鲜生命期大于其当前 Age 跟 min-fresh 值之和的缓存对象)
    响应:public(可以用 Cached 内容回应任何用户)
    private(只能用缓存内容回应先前请求该内容的那个用户)
    no-cache(可以缓存,但是只有在跟WEB服务器验证了其有效后,才能返回给客户端)
    max-age:(本响应包含的对象的过期时间)
    ALL: no-store(不允许缓存)

  4. Connection:请求:close(告诉WEB服务器或者代理服务器,在完成本次请求的响应后,断开连接,不要等待本次连接的后续请求了)。
    keepalive(告诉WEB服务器或者代理服务器,在完成本次请求的响应后,保持连接,等待本次连接的后续请求)。
    响应:close(连接已经关闭)。
    keepalive(连接保持着,在等待本次连接的后续请求)。
    Keep-Alive:如果浏览器请求保持连接,则该头部表明希望 WEB 服务器保持连接多长时间(秒)。
    例如:Keep-Alive:300

  5. ETag:就是一个对象(比如URL)的标志值,就一个对象而言,比如一个 html 文件,如果被修改了,其 Etag 也会别修改,
    所以,ETag 的作用跟 Last-Modified 的作用差不多,主要供 WEB 服务器判断一个对象是否改变了。
    比如前一次请求某个 html 文件时,获得了其 ETag,当这次又请求这个文件时,浏览器就会把先前获得的 ETag 值发送给
    WEB 服务器,然后 WEB 服务器会把这个 ETag 跟该文件的当前 ETag 进行对比,然后就知道这个文件有没有改变了。

  6. Expired:WEB服务器表明该实体将在什么时候过期,对于过期了的对象,只有在跟WEB服务器验证了其有效性后,才能用来响应客户请求。
    例如:Expires: Thu, 31 Dec 2037 23:55:55 GMT

  7. If-Modified-Since:如果请求的对象在该头部指定的时间之后修改了,才执行请求的动作(比如返回对象),否则返回代码304,告诉浏览器该对象没有修改。
    例如:If-Modified-Since:Thu, 10 Apr 2008 09:14:42 GMT
    If-Unmodified-Since:如果请求的对象在该头部指定的时间之后没修改过,才执行请求的动作(比如返回对象)。

  8. Last-Modified:WEB 服务器认为对象的最后修改时间,比如文件的最后修改时间,动态页面的最后产生时间等等。
    例如:Last-Modified:Mon, 23 May 2016 01:37:48 GMT

  9. Pramga:主要使用 Pramga: no-cache,相当于 Cache-Control: no-cache。
    例如:Pragma:no-cache

  10. Server: WEB 服务器表明自己是什么软件及版本等信息。
    例如:Server:nginx/1.8.0

  11. User-Agent: 浏览器表明自己的身份(是哪种浏览器)。
    例如:User-Agent:Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.8.1.14) Gecko/20080404 Firefox/2.0.0.14

  12. Via: 列出从客户端到 OCS 或者相反方向的响应经过了哪些代理服务器,他们用什么协议(和版本)发送的请求。

0 0