HTTP协议简介

来源:互联网 发布:征途手游升星辅助软件 编辑:程序博客网 时间:2024/05/01 02:52

什么是HTTP协议

HTTP 协议定义服务器端和客户端之间文件传输的沟通方式。目前HTTP协议的版本是Http1.1。RFC 2616描述了HTTP协议的具体信息。

这个协议已经成为浏览器和Web站点之间的标准。

当我上网的时候底层是如何进行交互的?

当访问者点击一个超链接的时候,将会给浏览器提交一个URL地址。通过这个URL地址,浏览器便知道去链接那个网站并去取得具体的页面文件(也可能是一张图片,一个pdf文件)。

HTTP工作的基础就是,连接一个服务器并开始传输文件到浏览器。

HTTP传输的基本过程

在http传输的过程中,被称为客户端的请求者向服务器请求一个文件。

最基本的过程是:

1 客户端连接一个主机;

2 服务器接收连接,

3 客户端请求一个文件,

4 服务器发送一个应答.

实例

我们看几个典型的过程

首先,我们想访问本页面。在浏览器上敲入“http://www.maketop.net/resource/rs_041112_02.php”.浏览器将连接www.maketop.net然后发送:

>> GET /resource/rs_041112_02.php Http1.1

>> Host: www.maketop.net

>> Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg,

>> Accept-Language: en

>> Accept-Encoding: gzip, deflate

>> User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; rv:1.7.3) Gecko/20040913 Firefox/0.10

>> Connection: Keep-Alive

>>

解 释:浏览器请求页面“/resource/rs_041112_02.php”。并使用HTTP1.1协议。并告诉服务器你的浏览器是 Firefox0.10。操作系统是Windows XP。 浏览器希望保持与www.maketop.net之间的连接,并请求获得多的文件,包括网页中的图片。翻译成语言上面是:

>> 用HTTP1.1协议获得 /resource/rs_041112_02.php

>> 访问的主机是: www.maketop.net

>> 接收的文件包括了: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg,

>> 使用的语言是: en

>> 接收的编码方式(浏览器能够解释的)是: gzip, deflate

>> 用户的浏览器信息:Windows XP的操作系统 Firefox/0.10的浏览器

>> 保持连接: 还要去图片

>>

www.maketop.net的服务器发出响应:

<< HTTP/1.1 200 OK

<< Date: Mon, 12 Mar 2004 19:12:16 GMT

<< Server: Apache/1.3.31 (Unix) mod_throttle/3.1.2

<< Last-Modified: Fri, 22 Sep 2004 14:16:18

<< ETag: "dd7b6e-d29-39cb69b2"

<< Accept-Ranges: bytes

<< Content-Length: 3369

<< Connection: close

<< Content-Type: text/html

<<

<< File content goes here

浏览器并从服务器的响应中获得服务器的信息:比如运行在Apache。

上面翻译成翻译成语言上面就是RFC 2616

<< HTTP1.1协议方式有效

<< 当前时间是: Mon, 12 Mar 2004 19:12:16 GMT

<< 服务器是: Apache/1.3.31 (Unix) mod_throttle/3.1.2

<< 最后一次修改: Fri, 22 Sep 2004 14:16:18

<< ETag: "dd7b6e-d29-39cb69b2"

<< Accept-Ranges: bytes

<< Content-Length: 3369

<< Connection: close

<< Content-Type: text/html

<<

<< File content goes here

上面例子就是最简单的交互过程描述,需要对HTTP协议中具体的命令了解,就需要阅读

HTTP请求包括三部分:请求行(RequestLine),头部(Headers)和数据体(Body)。其中,请求行由请求方法(method),请求网址Request-URI和协议(Protocol)构成,而请求头包括多个属性,数据体则可以被认为是附加在请求之后的文本或二进制文件。

  下面这个例子显示了一个HTTP请求的Header内容,这些数据是真正以网络HTTP协议从IE浏览器传递到Apache服务器上的。

GET /qingdao.html HTTP/1.1

Accept:text/html, */*

Accept-Language:zh-cn

Accept-Encoding:gzip,deflate

User-Agent:Mozilla/4.0(compatible;MSIE 5.01;Windows NT 5.0;DigExt)

Host: www.6book.net

Referer: http://www.6book.net/beijing.html

Connection:Keep-Alive

这段程序使用了6个Header,还有一些Header没有出现。我们参考这个例子具体解释HTTP请求格式。

1.HTTP请求行:请求行格式为Method Request-URI Protocol。在上面这个例子里,"GET / HTTP/1.1"是请求行。

2.Accept:指浏览器或其他客户可以接爱的MIME文件格式。可以根据它判断并返回适当的文件格式。

3.Accept-Charset:指出浏览器可以接受的字符编码。英文浏览器的默认值是ISO-8859-1.

4.Accept-Language:指出浏览器可以接受的语言种类,如en或en-us,指英语。

5.Accept-Encoding:指出浏览器可以接受的编码方式。编码方式不同于文件格式,它是为了压缩文件并加速文件传递速度。浏览器在接收到Web响应之后先解码,然后再检查文件格式。

6.Authorization:当使用密码机制时用来标识浏览器。

7.Cache-Control:设置关于请求被代理服务器存储的相关选项。一般用不到。

8.Connection:用来告诉服务器是否可以维持固定的HTTP连接。HTTP/1.1使用Keep-Alive为默值,这样,当浏览器需要多个文件时(比如一个HTML文件和相关的图形文件),不需要每次都建立连接。

9.Content-Type:用来表名request的内容类型。可以用HttpServletRequest的getContentType()方法取得。

10.Cookie:浏览器用这个属性向服务器发送Cookie。Cookie是在浏览器中寄存的小型数据体,它可以记载和服务器相关的用户信息,也可以用来实现会话功能。

11.Expect:表时客户预期的响应状态。

12.From:给出客户端HTTP请求负责人的email地址。

13.Host:对应网址URL中的Web名称和端口号。

14.If-Match:供PUT方法使用。

15.If-Modified-Since:客户使用这个属性表明它只需要在指定日期之后更改过的网页。因为浏览器可以使用其存储的文件而不必从服务器请求,这样节省了Web资源。由于Servlet是动态生成的网页,一般不需要使用这个属性。

16.If-None-Match:和If-Match相反的操作,供PUT方法使用。

17.If-Unmodified-Since:和If-Match-Since相反。

18.Pragma:这个属性只有一种值,即Pragma:no-cache,表明如果servlet充当代理服务器,即使其有已经存储的网页,也要将请求传递给目的服务器。

19.Proxy-Authorization:代理服务器使用这个属性,一般用不到。

20.Range:如果客户有部分网页,这个属性可以请求剩余部分。

21.Referer:表明产生请求的网页URL。

比如从网页/beijing.html中点击一个链接到网页/qingdao.html,在向服务器发送的GET /beijing.html中的请求中,Referer是http://www.6book.net/qingdao.html 。这个属性可以用来跟踪Web请求是从什么网站来的。

22.Upgrage:客户通过这个属性设定可以使用与HTTP/1.1不同的协议。

23.User-Agent:是客户浏览器名称。

24.Via:用来记录Web请求经过的代理服务器或Web通道。

25.Warning:用来由客户声明传递或存储(cache)错误。