Http学习<二>

来源:互联网 发布:陈江华的体测数据 编辑:程序博客网 时间:2024/05/21 22:41

 HTTP 报文内的 HTTP信息

HTTP 通信过程包括从客户端发往服务器端的请求及从服务器端返回
客户端的响应。本章就让我们来了解一下请求和响应是怎样运作的。

HTTP 报文

用于 HTTP 协议交互的信息被称为 HTTP 报文。请求端(客户端)的
HTTP 报文叫做请求报文,响应端(服务器端)的叫做响应报文。
HTTP 报文本身是由多行(用 CR+LF 作换行符)数据构成的字符串文
本。
HTTP 报文大致可分为报文首部和报文主体两块。两者由最初出现的
空行(CR+LF)来划分。通常,并不一定要有报文主体。

请求报文及响应报文的结构

这里写图片描述

这里写图片描述

请求报文和响应报文的首部内容由以下数据组成。现在出现的各种首
部字段及状态码稍后会进行阐述。
请求行
包含用于请求的方法,请求 URI 和 HTTP 版本。
状态行
包含表明响应结果的状态码,原因短语和 HTTP 版本。
首部字段
包含表示请求和响应的各种条件和属性的各类首部。

一般有 4 种首部,分别是:通用首部、请求首部、响应首部和实体首
部。
其他
可能包含 HTTP 的 RFC 里未定义的首部(Cookie 等)。

 编码提升传输速率

HTTP 在传输数据时可以按照数据原貌直接传输,但也可以在传输过
程中通过编码提升传输速率。通过在传输时编码,能有效地处理大量
的访问请求。但是,编码的操作需要计算机来完成,因此会消耗更多
的 CPU 等资源。

  • 报文(message)
    是 HTTP 通信中的基本单位,由 8 位组字节流(octet sequence,
    其中 octet 为 8 个比特)组成,通过 HTTP 通信传输。
  • 实体(entity)
    作为请求或响应的有效载荷数据(补充项)被传输,其内容由实
    体首部和实体主体组成。
    HTTP 报文的主体用于传输请求或响应的实体主体。
    通常,报文主体等于实体主体。只有当传输中进行编码操作时,实体
    主体的内容发生变化,才导致它和报文主体产生差异。
    报文和实体这两个术语在之后会经常出现,请事先理解两者的差异。

 压缩传输的内容编码

向待发送邮件内增加附件时,为了使邮件容量变小,我们会先用 ZIP
压缩文件之后再添加附件发送。HTTP 协议中有一种被称为内容编码
的功能也能进行类似的操作。
内容编码指明应用在实体内容上的编码格式,并保持实体信息原样压
缩。内容编码后的实体由客户端接收并负责解码。

发送多种数据的多部分对象集合

HTTP 协议中也采纳了多部分对象集合,发送的一份报文主
体内可含有多类型实体。通常是在图片或文本文件等上传时使用

  • multipart/form-data

    在 Web 表单文件上传时使用。

  • multipart/byteranges

状态码 206(Partial Content,部分内容)响应报文包含了多个范
围的内容时使用。

在 HTTP 报文中使用多部分对象集合时,需要在首部字段里加上
Content-type。

返回结果的 HTTP 状态码

HTTP 状态码负责表示客户端 HTTP 请求的返回结果、标记服务器端
的处理是否正常、通知出现的错误等工作。

状态码的职责是当客户端向服务器端发送请求时,描述返回的请求结
果。借助状态码,用户可以知道服务器端是正常处理了请求,还是出
现了错误。

通信数据转发程序 :代理、网关、隧道

  •  代理

这里写图片描述
图:每次通过代理服务器转发请求或响应时,会追加写入 Via 首
部信息
在 HTTP 通信过程中,可级联多台代理服务器。请求和响应的转发会
经过数台类似锁链一样连接起来的代理服务器。转发时,需要附加
Via 首部字段以标记出经过的主机信息。

使用代理服务器的理由有:利用缓存技术(稍后讲解)减少网络带宽
的流量,组织内部针对特定网站的访问控制,以获取访问日志为主要
目的,等等。
代理有多种使用方法,按两种基准分类。一种是是否使用缓存,另一
种是是否会修改报文。
缓存代理
代理转发响应时,缓存代理(Caching Proxy)会预先将资源的副本
(缓存)保存在代理服务器上。
当代理再次接收到对相同资源的请求时,就可以不从源服务器那里获
取资源,而是将之前缓存的资源作为响应返回。
透明代理
转发请求或响应时,不对报文做任何加工的代理类型被称为透明代理
(Transparent Proxy)。反之,对报文内容进行加工的代理被称为非
透明代理。

 网关

这里写图片描述

图:利用网关可以由 HTTP 请求转化为其他协议通信
网关的工作机制和代理十分相似。而网关能使通信线路上的服务器提
供非 HTTP 协议服务。
利用网关能提高通信的安全性,因为可以在客户端与网关之间的通信
线路上加密以确保连接的安全。比如,网关可以连接数据库,使用
SQL 语句查询数据。另外,在 Web 购物网站上进行信用卡结算时,
网关可以和信用卡结算系统联动。

 隧道

隧道可按要求建立起一条与其他服务器的通信线路,届时使用 SSL 等
加密手段进行通信。隧道的目的是确保客户端能与服务器进行安全的
通信。
隧道本身不会去解析 HTTP 请求。也就是说,请求保持原样中转给之
后的服务器。隧道会在通信双方断开连接时结束。

 保存资源的缓存

可减少对源服务器的访问,因此也就节省了通信流量和通信时间。
缓存服务器是代理服务器的一种,并归类在缓存代理类型中。换句话
说,当代理转发从服务器返回的响应时,代理服务器将会保存一份资
源的副本。

这里写图片描述

缓存的有效期限

即便缓存服务器内有缓存,也不能保证每次都会返回对同资源的请
求。因为这关系到被缓存资源的有效性问题。
当遇上源服务器上的资源更新时,如果还是使用不变的缓存,那就会
演变成返回更新前的“旧”资源了。
即使存在缓存,也会因为客户端的要求、缓存的有效期等因素,向源
服务器确认资源的有效性。若判断缓存失效,缓存服务器将会再次从
源服务器上获取“新”资源。

0 0
原创粉丝点击