HTTP详解

来源:互联网 发布:冯绍峰双龙出洞 知乎 编辑:程序博客网 时间:2024/05/30 23:04
面试被问到HTTP过程,虽然大体明白,但说出来总是一团乱,特此铭记。
本文详解HTTP过程。
图1给出了HTTP请求的示意图。

       
图1
图2,图3给出了请求和响应的格式:

  request message                                       response message
HTTP概念
HTTP(超文本传输协议)是一个基于请求与响应模式的无状态的、应用层的协议,常基于TCP的连接方式。
无状态是指Web浏览器和Web服务器之间不需要建立持久的连接,这意味着当一个客户端向服务器端发出请求,然后Web服务器返回响应(response),连接就被关闭了,在服务器端不保留连接的有关信息。

一次完整的HTTP请求过程
1、建立TCP连接
2、客户端向服务端发送请求行
例如:GET/sample/hello.jsp HTTP/1.1
3、客户端发送请求头,并以空行结尾
4、服务器返回响应行
    HTTP/1.1 200 OK
5、服务器返回响应头,并以空行结尾
6、服务器返回数据
它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据
7、服务器结束TCP连接,如果Connection:keep-alive,则不会终止TCP连接,以后都还可以通过这个已有的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。


HTTP请求格式
当浏览器向Web服务器发出请求时,它向服务器传递了一个数据块,也就是请求信息,HTTP请求信息由3部分组成:
l   请求方法 URI 协议/版本 (请求行)
l   请求头(Request Header)  (消息报头)
l   请求正文                       (请求正文)

下面是一个HTTP请求的例子:
GET /sample.jsp HTTP/1.1Accept:image/gif.image/jpeg,*/*Accept-Language:zh-cnConnection:Keep-AliveHost:localhostUser-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)Accept-Encoding:gzip,deflate username=jinqiao&password=1234

(1)       请求方法URI协议/版本
请求的第一行是“方法 URL 协议/版本”:GET/sample.jsp HTTP/1.1
以上代码中“GET”代表请求方法,“/sample.jsp”表示URI,“HTTP/1.1代表协议和协议的版本。
根据HTTP标准,HTTP请求可以使用多种请求方法。例如:HTTP1.1支持7种请求方法:GET、POST、HEAD、OPTIONS、PUT、DELETE和TRACE。在Internet应用中,最常用的方法是GET和POST。
URL完整地指定了要访问的网络资源,通常只要给出相对于服务器的根目录的相对目录即可,因此总是以“/”开头,最后,协议版本声明了通信过程中使用HTTP的版本。
(2) 请求头(Request Header)( Header line)
请求头包含许多有关的客户端环境和请求正文的有用信息。例如,请求头可以声明浏览器所用的语言,请求正文的长度等。
Accept:image/gif.image/jpeg.*/*    浏览器能够处理的内容类型Accept-Language:zh-cn                  浏览器当前设置的语言Connection:Keep-Alive                    浏览器与服务器之间的连接类型Host:localhost                               发出请求的页面所在的域User-Agent:Mozila/4.0(compatible:MSIE5.01:Windows NT5.0)  浏览器的用户代理字符串Accept-Encoding:gzip,deflate.         浏览器能够处理的压缩编码Accept-Charset                              浏览器能够处理的字符集Cookie                                          当前页面设置的任何cookieReferer                                          发出请求的页面的URI

(3) 请求正文
请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文。请求正文中可以包含客户提交的查询字符串信息:
username=jinqiao&password=1234
在以上的例子的HTTP请求中,请求的正文只有一行内容。当然,在实际应用中,HTTP请求正文可以包含更多的内容。

HTTP请求方法我这里只讨论GET方法与POST方法
l         GET方法
GET方法是默认的HTTP请求方法,我们日常用GET方法来提交表单数据,然而用GET方法提交的表单数据只经过了简单的编码,同时它将作为URL的一部分向Web服务器发送,因此,如果使用GET方法来提交表单数据就存在着安全隐患上。例如
Http://127.0.0.1/login.jsp?Name=zhangshi&Age=30&Submit=%cc%E+%BD%BB
从上面的URL请求中,很容易就可以辩认出表单提交的内容。(?之后的内容)另外由于GET方法提交的数据是作为URL请求的一部分所以提交的数据量不能太大
l         POST方法
POST方法是GET方法的一个替代方法,它主要是向Web服务器提交表单数据,尤其是大批量的数据。POST方法克服了GET方法的一些缺点。通过POST方法提交表单数据时,数据不是作为URL请求的一部分而是作为标准数据传送给Web服务器,这就克服了GET方法中的信息无法保密和数据量太小的缺点。因此,出于安全的考虑以及对用户隐私的尊重,通常表单提交时采用POST方法。
  从编程的角度来讲,如果用户通过GET方法提交数据,则数据存放在QUERY_STRING环境变量中,而POST方法提交的数据则可以从标准输入流中获取。
 GETPOST后退按钮/刷新无害数据会被重新提交(浏览器应该告知用户数据会被重新提交)。书签可收藏为书签不可收藏为书签缓存能被缓存不能缓存编码类型application/x-www-form-urlencodedapplication/x-www-form-urlencoded 或 multipart/form-data。为二进制数据使用多重编码。历史参数保留在浏览器历史中。参数不会保存在浏览器历史中。对数据长度的限制是的。当发送数据时,GET 方法向 URL 添加数据;URL 的长度是受限制的(URL 的最大长度是 2048 个字符)。无限制。对数据类型的限制只允许 ASCII 字符。没有限制。也允许二进制数据。安全性
与 POST 相比,GET 的安全性较差,因为所发送的数据是 URL 的一部分。

在发送密码或其他敏感信息时绝不要使用 GET !

POST 比 GET 更安全,因为参数不会被保存在浏览器历史或 web 服务器日志中。可见性数据在 URL 中对所有人都是可见的。数据不会显示在 URL 中。


其他HTTP请求方法:
方法描述HEAD与 GET 相同,但只返回 HTTP 报头,不返回文档主体。PUT上传指定的 URI 表示。DELETE删除指定资源。OPTIONS返回服务器支持的 HTTP 方法。CONNECT把请求连接转换到透明的 TCP/IP 通道。

HTTP应答格式
与HTTP请求相似,HTTP响应也由3个部分构成,分别是:
l 协议状态版本代码描述
l 响应头(Response Header)
l 响应正文
下面是一个HTTP响应的例子:
HTTP/1.1 200 OKServer:Apache Tomcat/5.0.12Date:Mon,6Oct2003 13:23:42 GMTContent-Length:112 <html>    <head>        <title>HTTP响应示例<title>    </head>    <body>        Hello HTTP!    </body></html>

协议状态代码描述HTTP响应的第一行类似于HTTP请求的第一行,它表示通信所用的协议是HTTP1.1服务器已经成功的处理了客户端发出的请求(200表示成功):
HTTP/1.1 200 OK
响应头(Response Header)响应头也和请求头一样包含许多有用的信息,例如服务器类型、日期时间、内容类型和长度等,
 响应正文响应正文就是服务器返回的HTML页面:
响应头和正文之间也必须用空行分隔。 
Server:Apache Tomcat/5.0.12Date:Mon,6Oct2003 13:13:33 GMTContent-Type:text/htmlLast-Moified:Mon,6 Oct 2003 13:23:42 GMTContent-Length:112<html><head><title>HTTP响应示例<title></head><body>Hello HTTP!</body></html>

 HTTP应答码
 HTTP应答码也称为状态码,它反映了Web服务器处理HTTP请求状态。HTTP应答码由3位数字构成,其中首位数字定义了应答码的类型:
    1XX-信息类(Information),表示收到Web浏览器请求,正在进一步的处理中
  2XX-成功类(Successful),表示用户请求被正确接收,理解和处理例如:200 OK
    3XX-重定向类(Redirection),表示请求没有成功,客户必须采取进一步的动作。
    4XX-客户端错误(Client Error),表示客户端提交的请求有错误 例如:404 NOT
                                    Found,意味着请求中所引用的文档不存在。
    5XX-服务器错误(Server Error)表示服务器不能完成对请求的处理:如 500
  对于我们Web开发人员来说掌握HTTP应答码有助于提高Web应用程序调试的效率和准确性。
    
    200 OK      //客户端请求成功    301 Moved Permanently      客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。    302 Found   类似于301,但新的URL应该被视为临时性的替代,而不是永久性的。    304 Not Modified 客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原         来缓冲的文档还可以继续使用。    400 Bad Request  //客户端请求有语法错误,不能被服务器所理解    401 Unauthorized //请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用     403 Forbidden  //服务器收到请求,但是拒绝提供服务    404 Not Found  //请求资源不存在,eg:输入了错误的URL    500 Internal Server Error //服务器发生不可预期的错误    503 Server Unavailable  //服务器当前不能处理客户端的请求,一段时间后可能恢复正常



参考:http://www.cnblogs.com/mengdd/archive/2013/05/26/3099776.html

图片摘自:http://www.cnblogs.com/cheermyang/p/4883791.html
GET方法和POST方法的具体比较:http://www.w3school.com.cn/tags/html_ref_httpmethods.asp

0 0
原创粉丝点击