图解http学习笔记6.HTTP首部(一)

来源:互联网 发布:万方数据库期刊检索页 编辑:程序博客网 时间:2024/06/06 08:29

HTTP首部(一)

  • HTTP首部一
    • 报文首部
      • HTTP请求报文
      • HTTP响应报文
    • HTTP首部字段
      • HTTP首部字段结构
      • 4种HTTP首部字段类型
        • 通用首部字段General Header Fields
        • 请求首部字段Request Header Fields
        • 响应首部字段Response Header Fields
        • 实体首部字段Entity Header Fields
      • HTTP11首部字段一览
        • 表一通用首部字段
        • 表二请求首部字段
        • 表三响应首部字段
        • 表四实体首部字段
      • 非HTTP11首部字段
      • End-to-end首部和Hop-by-hop首部
        • 端到端首部End-to-end Header
        • 逐跳首部Hop-by-hop Header
    • HTTP11 通用首部字段
      • Cache-Control
        • 表示是否能缓存的指令
        • 控制可执行缓存的对象的指令
        • 指定缓存期限和认证的指令
        • Cache-Control扩展
      • Connection
      • Date
      • Pragma
      • Trailer

报文首部

HTTP协议的请求和响应报文中必定包含HTTP首部。首部内容为客户端和服务器端分别处理请求和响应提供所需要的信息。对于客户端,这些信息不必查看。

报文首部由几个字段构成。

HTTP请求报文

请求报文中,HTTP报文由方法、URI、HTTP版本、HTTP首部字段构成。

HTTP响应报文

HTTP报文由HTTP版本、状态码(数字和原因短语)、HTTP首部字段构成。


HTTP首部字段包含的信息最为丰富。首部字段同时存在于请求和响应报文中,并涵盖HTTP报文相关的内容信息。

HTTP首部字段

HTTP首部字段是构成HTTP报文的要素之一。在客户端与服务器之间以HTTP协议进行通信的过程,起到传递额外重要的信息的作用。

使用首部字段是了给浏览器和服务器提供报文主体大小、所用的语言、认证信息等内容。

HTTP首部字段结构

HTTP首部字段是由首部字段名和字段值构成的,中间用冒号。

首部字段名: 字段值Content-Type: text/htmlKeep-Alive: timeout=15, max=100

Content-Type表示报文主体的对象类型。

字段值对应单个HTTP首部字段可以有多个值。

当首部字段重复时,根据浏览器内部处理逻辑不同,结果并不一致。

4种HTTP首部字段类型

通用首部字段(General Header Fields)

请求报文和响应报文两方都会使用的首部。

请求首部字段(Request Header Fields)

从客户端想服务器端发送请求报文时使用的首部。补充了请求的附加内容、客户端信息、响应内容相关优先级等信息。

响应首部字段(Response Header Fields)

。。补充了响应的附加内容,也会要求客户端附加额外的内容信息。

实体首部字段(Entity Header Fields)

针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新事件等与实体有关的信息。

HTTP/1.1首部字段一览

表一:通用首部字段

首部字段名 说明 Cache-Control 控制缓存的行为 Connection 逐跳首部、连接的管理 Date 创建报文的日期时间 Pragma 报文指令 Trailer 报文末端的首部一览 Transfer-Encoding 指定报文主体的传输编码方式 Upgrade 升级为其他协议 Via 代理服务器的相关信息 Warning 错误通知

表二:请求首部字段

首部字段名 说明 Accept 用户代理可处理的每题类型 Accept-Charset 优先的字符集 Accept-Encoding 优先的内容编码 Accept-Language 优先的语言(自然语言) Authorization Web认证信息 Expect 期待服务器的特定行为 From 用户的电子邮箱地址 Host 请求资源所在服务器 If-Match 比较实体标记 If-Modified-Since 比较资源的更新时间 If-None-Match 比较实体标记(与If-Match相反) If-Range 资源未更新时发送实体Byte的范围请求 If-Unmodified-Since 比较资源的更新事件(与If-Modified-Since相反) Max-Forwards 最大传输逐跳数 Proxy-Authorization 代理服务器要求客户端的认证信息 Range 实体的字节范围请求 Referer 对请求中URI的原始获取方 TE 传输编码的优先级 User-Agent HTTP客户端程序的信息

表三:响应首部字段

首部字段名 说明 Accept-Ranges 是否接受字节范围请求 Age 推算资源创建经过时间 ETag 资源的匹配信息 Location 令客户端重定向至指定URI Proxy-Authenticate 代理服务器对客户端的认证信息 Retry-After 对再次发起请求的时机要求 Server HTTP服务器的安装信息 Vary 代理服务器缓存的管理信息 WWWW-Authenticate 服务器对客户端的认证信息

表四:实体首部字段

首部字段名 说明 Allow 资源可支持的HTTP方法 Content-Encoding 实体主体适用的编码方式 Content-Language 实体主体的自然语言 Content-Length 实体主体的大小(单位:字节) Content-Location 替代对应资源的URI Content-MD5 实体主体的报文摘要 Content-Range 实体主体的位置范围 Content-Type 实体主体的媒体类型 Expires 实体主体过期的日期时间 Last-Modified 资源最后修改的日期时间

非HTTP/1.1首部字段

不限于上述47种,还有Cookie,Set-Cookie和Content-Disposition等。。。。

归纳在RFC4229HTTP Header Field Registrations

End-to-end首部和Hop-by-hop首部

HTTP首部字段将定义成缓存代理和非缓存代理的行为,分为2种类型

端到端首部(End-to-end Header)

分在此类别中的首部会转发给请求/响应对应的最终接受目标,且必须保存在由缓存生成的响应中,另外规定它必须被转发。

逐跳首部(Hop-by-hop Header)

分在此类别的首部只对单词转发有效,会因通过缓存或代理而不再转发。HTTP/1.1版本之后需要提供Connection首部字段才能使用。

除了下面8个首部字段属于逐跳首部,其他都输端到端首部。

  • Connection
  • Keep-Alive
  • Proxy-Authenticate
  • Proxy-Authorization
  • Trailer
  • TE
  • Transfer-Encoding
  • Upgrade

HTTP/1.1 通用首部字段

Cache-Control

通过Cache-Control的指令,就能操作缓存的工作机制。

参数可选,多个指定通过,分隔。首部字段的指令可用于请求及响应时。

Cache-Control: private, max-age=0, no-cache

缓存请求指令

指令 参数 说明 no-cache 无 强制向源服务器再次验证 no-store 无 不缓存请求或响应的任何内容 max-age=[秒] 必须 响应的最大Age值 max-stale( = [秒]) 可省略 接受已过期的响应 min-fresh = [秒] 必需 期望在指定时间内的响应仍然有效 no-transform 无 代理不可更改媒体类型 only-if-cached 无 从缓存获取资源 cache-extension - 新指令标记(token)

缓存响应指令

指令 参数 说明 public 无 可向任一方提供响应的缓存 private 可省略 仅向特定用户返回响应 no-cache 可省略 缓存前必须确认其有效性 no-store 无 不缓存请求或响应的任何内容 no-transform 无 代理不可更改媒体类型 must-revalidate 无 可缓存但必须再向源服务器进行确认 proxy-revalidate 无 要求中间缓存服务器对缓存的响应有效性在进行确认 max-age=[秒] 必需 响应的最大Age值 s-maxage = [秒] 必需 公共缓存服务器响应的最大Age值 cache-extension - 新指令标记(token)

表示是否能缓存的指令

public指令

Cache-Control: public

明确表明其他用户可利用缓存

private指令

Cache-Control: private

响应只以特定的用户作为对象。缓存服务器对该特定用户提供资源缓存的服务。

no-cache指令

Cache-Control: no-cache

目的:防止从缓存中返回过期的资源

客户端请求中包含no-cache指令,则缓存服务器必须把请求转发给源服务器。(缓存服务器可以询问是否可以缓存)

服务器返回的指令中包含no-cache指令,则缓存服务器不能对资源进行缓存。也不再将对缓存服务器请求提出的资源有效性进行确认,且禁止其对响应资源进行缓存操作。

Cache-Control: no-cache=Location

服务端返回响应中指定参数值,客户端接收到这个指定参数值的首部字段对应的响应报文后,就不能使用缓存。(无参数值的首部字段可以使用缓存),只能在响应指令中指定该参数。

控制可执行缓存的对象的指令

no-store指令

Cache-Control: no-store

暗示请求(和相对的响应)或响应中包含机密信息。

规定缓存不能在本地存储请求或响应的任一部分。

指定缓存期限和认证的指令

s-maxage指令

Cache-Control: s-maxage=604800

单位(s)

s-maxage和max-age指令的功能相同。不同点是s-maxage指令适用于供对位用户使用的公共缓存服务器(代理)。对向同一用户重复返回响应的服务器来说,无作用。

s-maxage指令忽略对Expires首部字段及max-age指令的处理。

max-age指令

Cache-Control: max-age=604800

客户端发送的请求包含max-age指令时,如果缓存数值比指定事件小,则接受,否则将请求转发给源服务器。

服务器返回的响应中包含max-age指令时,缓存服务器将不对资源有效性确认,而max-age数值代表了资源保存为缓存的最长时间。

HTTP/1.1中 缓存服务器遇到同时存在Expires首部字段的情况时,优先处理max-age指令,忽略Expires首部字段。

HTTP/1.0中相反,忽略max-age指令。

min-fresh指令

Cache-Control: min-fresh=60

要求缓存服务器返回至少还未过指定时间的缓存资源。

如上:过了60s的资源都不能作为响应返回。

max-stale指令

Cache-Control: max-stale=3600

可指示缓存资源,过期也照常接收。

未指定参数时,即为+∞,只要在时间内,无论资源过期与否都接受。

only-if-cached指令

Cache-Control: only-if-cached

表示客户端仅在缓存服务器本地缓存目标资源的情况下才会要求其返回。

要求缓存服务器不重新加载资源,也不会再次确认资源有效性。若请求缓存服务器的本地缓存无响应,返回504Gateway Timeout。

must-revalidate指令

Cache-Control: must-revalidate

代理会向源服务器再次验证即将返回的响应缓存目前是否仍然有效。

若代理无法连通服务器再次获取有效源码,则向客户端返回504状态码。

使用此指令会忽略max-stale指令。

proxy-revalidate指令

Cache-Control: proxy-revalidate

要求所有的缓存服务器在接收到客户端带有该指令的请求返回响应之前,必须再次验证缓存的有效性。

no-transform指令

Cache-Control: no-transform

规定无论请求还是响应中,缓存都不能改变实体主体的媒体类型。

防止缓存或代理压缩图片。

Cache-Control扩展

cache-extension token

Cache-Control: private, community="UCI"

由此可以扩展Cache-Control首部字段内的指令。

首部字段本身没有community指令,借助extensions token实现了这个指令的添加。如果缓存服务器无法理解,则忽略。

故extensions只对理解它的缓存服务器有意义。

Connection

作用:

  • 控制不再转发给代理的首部字段
  • 管理持久连接

控制不再转发给代理的首部字段

Connection: 不再转发的首部字段名

发送请求或返回响应,可控制不再转发的首部字段。(Hop-by-hop首部)

管理持久连接

Connection: close

HTTP/1.1默认连接是持久连接。客户端会在持久连接上连续发送请求。当想明确断开连接时。则指定Connection首部字段的值为close。

Connection: Keep-Alive

HTTP/1.1之前的HTTP版本默认都是非持久连接。↑实现持续连接。

如图,客户端发送请求给服务器时,服务器也会加上首部字段Keep-Alive和首部字段Connection返回响应。

Date

首部字段Date表明创建HTTP报文的日期和时间。

HTTP/1.1使用在RFC1123规定下的日期时间格式:

Date: Tue, 03 Jul 2012 04:40:59 GMT

之前的HTTP协议版本RFC850中定义的格式:

Date: Tue, 03-Jul-12 04:40:59 GMT

还有一种与C标准库内的asctime()函数的输出格式一致。

Date: Tue Jul 03 04:40:59 2012

Pragma

历史遗留字段,作为HTTP/1.0的向后兼容而定义。

Pragma: no-cache

通用首部字段,但只用在客户端发送的请求中,会要求中间服务器不返回缓存的资源。

中间服务器如果都以HTTP/1.1为基准,直接采用Cache-Control: no-cache指定缓存的处理方式是最为理想的。但要整体掌握全部中间服务器不现实。一般同时含有下面两个。

Cache-Control: no-cachePragma:  no-cache

Trailer

Trailer事先说明在报文主体后记录了哪些首部字段,该首部字段应用在HTTP/1.1版本分块传输编码时。

指定首部字段Trailer的值为Expires。主体后出现了。

原创粉丝点击