http protocol

来源:互联网 发布:表格的制作软件 编辑:程序博客网 时间:2024/05/16 06:25

转摘

HTTP 协议
                                                                                     —— 简介

      以前我以为HTTP协议是加了密的,现在才知道HTTP是以明文方式发送数据的。
      HTTP(Hypertext Transfer Protocol, 超文本传输协议),用于从WWW服务器传输
超文本到本地浏览器的传输协议。你可以通过协议定制传送的内容,从而减少网络
传输。HTTP协议是以TCP/IP为基础的高层协议。现在广泛使用的版本HTTP/1.1。
      HTTP协议基于请求/响应模式(Request/Response).客户与服务器建立连接后,按
照协议规定格式,发送请求到服务器,客户得到请求后,返回响应信息给客户。
HTTP使用的端口号,通常为80。
      关于HTTP的协议具体内容,网上很多,不再多说,参照相应得文档。下一篇文
章我会用 C++ 做一个 http协议的简单实现。

相关链接:
      中国协议分析网:     http://www.cnpaf.net/
      所有的协议标准:     http://www.cis.ohio-state.edu/rfc/
  

H1.  HTTP协议状态码的含义

  号码 含义
-----------------------------------------
"100" : Continue
"101" : witching Protocols
"200" : OK
"201" : Created
"202" : Accepted
"203" : Non-Authoritative Information
"204" : No Content
"205" : Reset Content
"206" : Partial Content
"300" : Multiple Choices
"301" : Moved Permanently
"302" : Found
"303" : See Other
"304" : Not Modified
"305" : Use Proxy
"307" : Temporary Redirect
"400" : Bad Request
"401" : Unauthorized
"402" : Payment Required
"403" : Forbidden
"404" : Not Found
"405" : Method Not Allowed
"406" : Not Acceptable
"407" : Proxy Authentication Required
"408" : Request Time-out
"409" : Conflict
"410" : Gone
"411" : Length Required
"412" : Precondition Failed
"413" : Request Entity Too Large
"414" : Request-URI Too Large
"415" : Unsupported Media Type
"416" : Requested range not satisfiable
"417" : Expectation Failed
"500" : Internal Server Error
"501" : Not Implemented
"502" : Bad Gateway
"503" : Service Unavailable
"504" : Gateway Time-out
"505" : HTTP Version not supported

 


Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=254733

=================================================================================

当我们想浏览一个网站的时候,只要在浏览器的地址栏里输入网站的地址就可以了,例如:www.microsoft.com,但是在浏览器的地址栏里面出现的却是:http://www.microsoft.com,你知道为什么会多出一个“http”吗?

  一、HTTP协议是什么

  我们在浏览器的地址栏里输入的网站地址叫做URL(UniformResourceLocator,统一资源定位符)。就像每家每户都有一个门牌地址一样,每个网页也都有一个Internet地址。当你在浏览器的地址框中输入一个URL或是单击一个超级链接时,URL就确定了要浏览的地址。浏览器通过超文本传输协议(HTTP),将Web服务器上站点的网页代码提取出来,并翻译成漂亮的网页。因此,在我们认识HTTP之前,有必要先弄清楚URL的组成, 例如:http://www.microsoft.com/china/index.htm。它的含义如下:

  1.http://:代表超文本传输协议,通知microsoft.com服务器显示Web页,通常不用输入;

  2.www:代表一个Web(万维网)服务器;

  3.Microsoft.com/:这是装有网页的服务器的域名,或站点服务器的名称;

  4.China/:为该服务器上的子目录,就好像我们的文件夹;

  5.Index.htm:index.htm是文件夹中的一个HTML文件(网页)。

  我们知道,Internet的基本协议是TCP/IP协议,然而在TCP/IP模型最上层的是应用层(Applicationlayer),它包含所有高层的协议。高层协议有:文件传输协议FTP、电子邮件传输协议SMTP、域名系统服务DNS、网络新闻传输协议NNTP和HTTP协议等。

  HTTP协议(Hypertext Transfer Protocol,超文本传输协议)是用于从WWW服务器传输超文本到本地浏览器的传送协议。它可以使浏览器更加高效,使网络传输减少。它不仅保证计算机正确快速地传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等。这就是你为什么在浏览器中看到的网页地址都是以“http://”开头的原因。

  自WWW诞生以来,一个多姿多彩的资讯和虚拟的世界便出现在我们眼前,可是我们怎么能够更加容易地找到我们需要的资讯呢?当决定使用超文本作为WWW文档的标准格式后,于是在1990年,科学家们立即制定了能够快速查找这些超文本文档的协议,即HTTP协议。经过几年的使用与发展,得到不断的完善和扩展,目前在WWW中使用的是HTTP/1.0的第六版。

  二、HTTP是怎样工作的

  既然我们明白了URL的构成,那么HTTP是怎么工作呢?我们接下来就要讨论这个问题。

  由于HTTP协议是基于请求/响应范式的(相当于客户机/服务器)。一个客户机与服务器建立连接后,发送一个请求给服务器,请求方式的格式为:统一资源标识符(URL)、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可能的内容。服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。

  许多HTTP通讯是由一个用户代理初始化的并且包括一个申请在源服务器上资源的请求。最简单的情况可能是在用户代理和服务器之间通过一个单独的连接来完成。在Internet 上,HTTP通讯通常发生在TCP/IP连接之上。缺省端口是TCP80,但其它的端口也是可用的。但这并不预示着HTTP协议在Internet或其它网络的其它协议之上才能完成。HTTP只预示着一个可靠的传输。

  这个过程就好像我们打电话订货一样,我们可以打电话给商家,告诉他我们需要什么规格的商品,然后商家再告诉我们什么商品有货,什么商品缺货。这些,我们是通过电话线用电话联系(HTTP是通过TCP/IP),当然我们也可以通过传真,只要商家那边也有传真。

  以上简要介绍了HTTP协议的宏观运作方式,下面介绍一下HTTP协议的内部操作过程。

  在WWW中,“客户”与“服务器”是一个相对的概念,只存在于一个特定的连接期间,即在某个连接中的客户在另一个连接中可能作为服务器。基于HTTP协议的客户/服务器模式的信息交换过程,它分四个过程:建立连接、发送请求信息、发送响应信息、关闭连接。这就好像上面的例子,我们电话订货的全过程。

  其实简单说就是任何服务器除了包括HTML文件以外,还有一个HTTP驻留程序,用于响应用户请求。你的浏览器是HTTP客户,向服务器发送请求,当浏览器中输入了一个开始文件或点击了一个超级链接时,浏览器就向服务器发送了HTTP请求,此请求被送往由IP地址指定的URL。驻留程序接收到请求,在进行必要的操作后回送所要求的文件。在这一过程中,在网络上发送和接收的数据已经被分成一个或多个数据包(packet),每个数据包包括:要传送的数据;控制信息,即告诉网络怎样处理数据包。TCP/IP决定了每个数据包的格式。如果事先不告诉你,你可能不会知道信息被分成用于传输和再重新组合起来的许多小块。

  也就是说商家除了拥有商品之外,它也有一个职员在接听你的电话,当你打电话的时候,你的声音转换成各种复杂的数据,通过电话线传输到对方的电话机,对方的电话机又把各种复杂的数据转换成声音,使得对方商家的职员能够明白你的请求。这个过程你不需要明白声音是怎么转换成复杂的数据的。
      


Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=388086

=============================================================================================

  HTTP协议的结构

1、 简介
   HTTP(HyperText Transfer Protocol),中文名称为超文本传输协议,工作在OSI七层体系中的应用层,属于高层应用协议。
   HTTP协议主要用在浏览器和Web服务器之间进行通信。
   HTTP协议使用明文进行传输,如果需要加密传输,可以使用https(注:j2me暂时不支持)。
2、HTTP协议版本
   HTTP协议有3个版本,依次是0.9、1.0、1.1。当前最新版本是1.1,但是1.0受到普遍支持。
3、协议格式
   HTTP协议是使用明文进行传输,协议主要分为三个部分:
   a)请求行/响应行:该部分只有一行,包含三个部分:请求方法 请求资源 使用的HTTP协议的版本。例如:
         get /index.html http/1.1
    其中get为请求方法,/index.html是请求的资源,http/1.1是指客户端支持的HTTP协议的版本。http1.0请求方法有3种, http1.1请求方法有7种。 HTTP方法常用的有GET、HEAD、POST,而PUT、DELETE、LINK、UNLINK方法
   b)头信息:头信息部分主要传输服务器或者客户端的一些设定信息,可以有任意多个,传输时使用“名称:值”的形式,例如:
      Accept-Language: zh-cn
      User-Agent: Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)
     其中HTTP协议里面规定了40多个头信息名称的用途,你也可以根据需要,自己来进行定义。
     头信息结束时需要一个空行和实体数据部分分开。
   c)实体数据:实体数据在请求时,如果以post方式提交时存储参数,以get方式请求时为空。在响应时,存储服务器端反馈的HTML源代码的数据。
4、HTTP连接过程
    在通讯时,由客户端发出请求连接,服务端建立连接;然后,客户端发出HTTP请求(Request),服务端返回响应信息(Respond),由此完成一个HTTP操作。
5、例子:
P 01-5-26 16:10:43 Connecting to go2.163.com ...          //连接服务器
P 01-5-26 16:10:44 Connected to go2.163.com [61.129.65.148]     //解析IP地址,以下为HTTP操作
S 01-5-26 16:10:44 GET /~minift/epretty/pretty.zip HTTP/1.1    //请求行(Request Line),表示使用GET方式取得文件,使用HTTP/1.1协议 //以下为请求头部(Request Head)
S 01-5-26 16:10:44 Connection: close                //表示非持续性连接
S 01-5-26 16:10:44 Host: go2.163.com                //主机名称
S 01-5-26 16:10:44 Accept: */*                   //接受的数据类型
S 01-5-26 16:10:44 Pragma: no-cache                //参数(与以前的服务器兼容)
S 01-5-26 16:10:44 Cache-Control: no-cache             //不使用缓存
S 01-5-26 16:10:44 Referer: http://go2.163.com/~minift/epretty  //从该网址转来
S 01-5-26 16:10:44 User-Agent: Mozilla/4.04 [en] (Win95; I ;Nav) //客户端标识
S 01-5-26 16:10:44 Cookie: AdId=ACDDAAAAAAA
S 01-5-26 16:10:44                         //以下为Respond
R 01-5-26 16:10:47 HTTP/1.0 200 OK   //响应行(Respond Line),服务器使用HTTP/1.0协议,状态值(Status Code)为200,状态为OK,表示文件可以读取
R 01-5-26 16:10:47 Date: Sat, 26 May 2001 08:15:54 GMT       //现在的时间,用格林威治时间表示
R 01-5-26 16:10:47 Server: Apache/1.3.14 (Unix) mod_layout/2.9.9  //服务器类型
R 01-5-26 16:10:47 Last-Modified: Fri, 04 May 2001 02:42:56 GMT   //文件最后更新时间
R 01-5-26 16:10:47 ETag: "e614cf-37965-3af21730"
R 01-5-26 16:10:47 Accept-Ranges: bytes              //接受的范围单位
R 01-5-26 16:10:47 Content-Length: 227685             //文件长度
R 01-5-26 16:10:47 Content-Type: application/zip          //MIME类型
R 01-5-26 16:10:47 X-Cache: MISS from shca8
R 01-5-26 16:10:47 X-Cache-Lookup: MISS from shca8:80
R 01-5-26 16:10:47 Connection: close                //表示文件传输完毕就关闭连接。
R 01-5-26 16:10:47                         //以下为文件传输

HTTP 1.1 RFC 地址:RFC 2616 - Hypertext Transfer Protocol -- HTTP/1.1:http://www.w3.org/Protocols/rfc2616/rfc2616.html


Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=251753

==========================================================================================================================

HTTP头标
头标由主键/值对组成。它们描述客户端或者服务器的属性、被传输的资源以及应该实现连接。

四种不同类型的头标:
1.通用头标:即可用于请求,也可用于响应,是作为一个整体而不是特定资源与事务相关联。
2.请求头标:允许客户端传递关于自身的信息和希望的响应形式。
3.响应头标:服务器和于传递自身信息的响应。
4.实体头标:定义被传送资源的信息。即可用于请求,也可用于响应。

头标格式:<name>:<value><CRLF>

下表描述在HTTP/1.1中用到的头标
Accept            定义客户端可以处理的媒体类型,按优先级排序;
            在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept: image/jpeg,image/png,*/*
Accept-Charset        定义客户端可以处理的字符集,按优先级排序;
            在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept-Charset: iso-8859-1,*,utf-8
Accept-Encoding        定义客户端可以理解的编码机制。例如:Accept-Encoding:gzip,compress
Accept-Language    定义客户端乐于接受的自然语言列表。例如:Accept-Language: en,de
Accept-Ranges        一个响应头标,它允许服务器指明:将在给定的偏移和长度处,为资源组成部分的接受请求。
            该头标的值被理解为请求范围的度量单位。例如Accept-Ranges: bytes或Accept-Ranges: none
Age            允许服务器规定自服务器生成该响应以来所经过的时间长度,以秒为单位。
            该头标主要用于缓存响应。例如:Age: 30
Allow            一个响应头标,它定义一个由位于请求URI中的次源所支持的HTTP方法列表。例如:Allow: GET,PUT
aUTHORIZATION        一个响应头标,用于定义访问一种资源所必需的授权(域和被编码的用户ID与口令)。
            例如:Authorization: Basic YXV0aG9yOnBoaWw=
Cache-Control        一个用于定义缓存指令的通用头标。例如:Cache-Control: max-age=30
Connection        一个用于表明是否保存socket连接为开放的通用头标。例如:Connection: close或Connection: keep-alive
Content-Base        一种定义基本URI的实体头标,为了在实体范围内解析相对URLs。
            如果没有定义Content-Base头标解析相对URLs,使用Content-Location URI(存在且绝对)或使用URI请求。
            例如:Content-Base: Http://www.myweb.com
Content-Encoding    一种介质类型修饰符,标明一个实体是如何编码的。例如:Content-Encoding: zip
Content-Language    用于指定在输入流中数据的自然语言类型。例如:Content-Language: en
Content-Length        指定包含于请求或响应中数据的字节长度。例如:Content-Length:382
Content-Location        指定包含于请求或响应中的资源定位(URI)。
            如果是一绝。对URL它也作为被解析实体的相对URL的出发点。
            例如:Content-Location: http://www.myweb.com/news
Content-MD5        实体的一种MD5摘要,用作校验和。
            发送方和接受方都计算MD5摘要,接受方将其计算的值与此头标中传递的值进行比较。
            例如:Content-MD5: <base64 of 128 MD5 digest>
Content-Range        随部分实体一同发送;标明被插入字节的低位与高位字节偏移,也标明此实体的总长度。
            例如:Content-Range: 1001-2000/5000
Contern-Type        标明发送或者接收的实体的MIME类型。例如:Content-Type: text/html
Date            发送HTTP消息的日期。例如:Date: Mon,10PR 18:42:51 GMT
ETag            一种实体头标,它向被发送的资源分派一个唯一的标识符。
            对于可以使用多种URL请求的资源,ETag可以用于确定实际被发送的资源是否为同一资源。
            例如:ETag: "208f-419e-30f8dc99"
Expires            指定实体的有效期。例如:Expires: Mon,05 Dec 2008 12:00:00 GMT
Form            一种请求头标,给定控制用户代理的人工用户的电子邮件地址。例如:From: webmaster@myweb.com
Host            被请求资源的主机名。对于使用HTTP/1.1的请求而言,此域是强制性的。例如:Host: www.myweb.com
If-Modified-Since        如果包含了GET请求,导致该请求条件性地依赖于资源上次修改日期。
            如果出现了此头标,并且自指定日期以来,此资源已被修改,应该反回一个304响应代码。
            例如:If-Modified-Since: Mon,10PR 18:42:51 GMT
If-Match            如果包含于一个请求,指定一个或者多个实体标记。只发送其ETag与列表中标记区配的资源。
            例如:If-Match: "208f-419e-308dc99"
If-None-Match        如果包含一个请求,指定一个或者多个实体标记。资源的ETag不与列表中的任何一个条件匹配,操作才执行。
            例如:If-None-Match: "208f-419e-308dc99"
If-Range            指定资源的一个实体标记,客户端已经拥有此资源的一个拷贝。必须与Range头标一同使用。
            如果此实体自上次被客户端检索以来,还不曾修改过,那么服务器只发送指定的范围,否则它将发送整个资源。
            例如:Range: byte=0-499<CRLF>If-Range:"208f-419e-30f8dc99"
If-Unmodified-Since    只有自指定的日期以来,被请求的实体还不曾被修改过,才会返回此实体。
            例如:If-Unmodified-Since:Mon,10PR 18:42:51 GMT
Last-Modified        指定被请求资源上次被修改的日期和时间。例如:Last-Modified: Mon,10PR 18:42:51 GMT
Location            对于一个已经移动的资源,用于重定向请求者至另一个位置。
            与状态编码302(暂时移动)或者301(永久性移动)配合使用。
            例如:Location: http://www2.myweb.com/index.jsp
Max-Forwards        一个用于TRACE方法的请求头标,以指定代理或网关的最大数目,该请求通过网关才得以路由。
            在通过请求传递之前,代理或网关应该减少此数目。例如:Max-Forwards: 3
Pragma            一个通用头标,它发送实现相关的信息。例如:Pragma: no-cache
Proxy-Authenticate    类似于WWW-Authenticate,便是有意请求只来自请求链(代理)的下一个服务器的认证。
            例如:Proxy-Authenticate: Basic realm-admin
Proxy-Proxy-Authorization    类似于授权,但并非有意传递任何比在即时服务器链中更进一步的内容。
            例如:Proxy-Proxy-Authorization: Basic YXV0aG9yOnBoaWw=
Public            列表显示服务器所支持的方法集。例如:Public: OPTIONS,MGET,MHEAD,GET,HEAD
Range            指定一种度量单位和一个部分被请求资源的偏移范围。例如:Range: bytes=206-5513
Refener            一种请求头标域,标明产生请求的初始资源。对于HTML表单,它包含此表单的Web页面的地址。
            例如:Refener: http://www.myweb.com/news/search.html
Retry-After        一种响应头标域,由服务器与状态编码503(无法提供服务)配合发送,以标明再次请求之前应该等待多长时间。
            此时间即可以是一种日期,也可以是一种秒单位。例如:Retry-After: 18
Server            一种标明Web服务器软件及其版本号的头标。例如:Server: Apache/2.0.46(Win32)
Transfer-Encoding    一种通用头标,标明对应被接受方反向的消息体实施变换的类型。例如:Transfer-Encoding: chunked
Upgrade        允许服务器指定一种新的协议或者新的协议版本,与响应编码101(切换协议)配合使用。
            例如:Upgrade: HTTP/2.0
User-Agent        定义用于产生请求的软件类型(典型的如Web浏览器)。
            例如:User-Agent: Mozilla/4.0(compatible; MSIE 5.5; Windows NT; DigExt)
Vary            一个响应头标,用于表示使用服务器驱动的协商从可用的响应表示中选择响应实体。例如:Vary: *
Via            一个包含所有中间主机和协议的通用头标,用于满足请求。例如:Via: 1.0 fred.com, 1.1 wilma.com
Warning            用于提供关于响应状态补充信息的响应头标。例如:Warning: 99 www.myweb.com Piano needs tuning
www-Authenticate    一个提示用户代理提供用户名和口令的响应头标,与状态编码401(未授权)配合使用。响应一个授权头标。
            例如:www-Authenticate: Basic realm=zxm.mgmt
========================================================================================================================
========================================================================================================================