HTTP前端协议

来源：互联网发布：2017php面试题大全编辑：程序博客网时间：2024/05/18 00:49

HTTP工作原理
HTTP协议定义Web客户端如何从Web服务器请求Web页面，以及服务器如何把Web页面传送给客户端。HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求报文，请求报文包含请求的方法、URL、协议版本、请求头部和请求数据。服务器以一个状态行作为响应，响应的内容包括协议的版本、成功或者错误代码、服务器信息、响应头部和响应数据。

响应报文
状态码
* HTTP 请求/响应的步骤*
1. 客户端连接到Web服务器
一个HTTP客户端，通常是浏览器，与Web服务器的HTTP端口（默认为80）建立一个TCP套接字连接。
2. 发送HTTP请求
通过TCP套接字，客户端向Web服务器发送一个文本的请求报文，一个请求报文由请求行、请求头部、空行和请求数据4部分组成。
3. 服务器接受请求并返回HTTP响应
Web服务器解析请求，定位请求资源。服务器将资源复本写到TCP套接字，由客户端读取。一个响应由状态行、响应头部、空行和响应数据4部分组成。
4. 释放连接TCP连接
若connection 模式为close，则服务器主动关闭TCP连接，客户端被动关闭连接，释放TCP连接;若connection 模式为keepalive，则该连接会保持一段时间，在该时间内可以继续接收请求;
5. 客户端浏览器解析HTML内容
客户端浏览器首先解析状态行，查看表明请求是否成功的状态代码。然后解析每一个响应头，响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML，根据HTML的语法对其进行格式化，并在浏览器窗口中显示。

在浏览器地址栏键入URL，按下回车之后会经历以下流程
1. 浏览器向 DNS 服务器请求解析该 URL 中的域名所对应的 IP 地址;
2. 解析出 IP 地址后，根据该 IP 地址和默认端口 80，和服务器建立TCP连接;
3. 浏览器发出读取文件(URL 中域名后面部分对应的文件)的HTTP 请求，该请求报文作为 TCP 三次握手的第三个报文的数据发送给服务器;
4. 服务器对浏览器请求作出响应，并把对应的 html 文本发送给浏览器;
5. 释放 TCP连接;
6. 浏览器将该 html 文本并显示内容; 　　
缓存控制
在HTTP 1.1版本之前，浏览器缓存是通过对HTTP 1.0的Expire是头部控制来实现的，Expires只能根据绝对时间来刷新缓存内容，HTTP 1.1增加了Cache-Control头域，可以支持max-age用来表示相对过期时间，另外请求服务器也可以根据Etag和Last-Modified来判断是否从浏览器缓存中加载文件，此时缓存的控制和判断将决定服务器的响应报文中头部内容的状态码200还是304。
判断过程：

浏览器先查询Cache-Control，（Expires）也可以
在浏览器端判断上次文件返回头中是否含有Etag，有则带上If-None-Match字段信息请求发送给服务器，服务器判断Etag未修改返回304,修改了则返回200。
在浏览器端判断上次文件返回头中是否含有Last-Modified信息，有则带上If-Modified-Since字段信息发送请求，服务器判断Last-Modified失效则返回200，有效返回304。
如果Etag和Last-Modified都不存在，直接向服务器请求内容。

HTTP2

优点：

HTTP2采用完全二进制的格式传输数据，而非HTTP 1.x的默认文本格式，而二进制在网络中传输的基本单位一般为帧（一个帧可以理解为具有固定格式和长度的二进制数据包）。我们也可以理解为HTTP2协议是通过流式传输的。同时HTTP2对消息头采用HPACK压缩传输，最大限度节省了传输带宽。相比于HTTP 1.x每次请求都会携带大量冗余头信息。
HTTP2采用TCP多路复用的方式来降低网络请求连接建立和关闭的开销，多个请求可以通过一个TCP连接来并发完成。HTTP 1.1可以通过PipeLine实现并发请求，但PipeLine是通过串行传输的，多个请求之间的响应可能会被阻塞。
HTTP2支持传输流的优先级和流量控制机制。HTTP2每一个文件传输流都有自己的传输优先级，可以通过服务器来动态改变，服务器会保证优先级高的文件流先传输。
支持服务器推送，服务器能够在特定条件下把资源主动推送给客户端。

GET和POST的区别
1. GET提交，请求的数据会附在URL之后（就是把数据放置在HTTP协议头中），以?分割URL和传输数据，多个参数用&连接；例如：login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD。如果数据是英文字母/数字，原样发送，如果是空格，转换为+，如果是中文/其他字符，则直接把字符串用BASE64加密，得出如： %E4%BD%A0%E5%A5%BD，其中％XX中的XX为该符号以16进制表示的ASCII。
POST提交：把提交的数据放置在是HTTP包的body中。
因此，GET提交的数据会在地址栏中显示出来，而POST提交，地址栏不会改变
2. GET方式需要使用Request.QueryString来取得变量的值，而POST方式通过Request.Form来获取变量的值。
3. 传输数据的大小：首先声明：HTTP协议没有对传输的数据大小进行限制，HTTP协议规范也没有对URL长度进行限制。
而在实际开发中存在的限制主要有：
GET:特定浏览器和服务器对URL长度有限制，例如 IE对URL长度的限制是2083字节(2K+35)。对于其他浏览器，如Netscape、FireFox等，理论上没有长度限制，其限制取决于操作系统的支持。
因此对于GET提交时，传输数据就会受到URL长度的限制。
POST:由于不是通过URL传值，理论上数据不受限。但实际各个WEB服务器会规定对post提交数据大小进行限制，Apache、IIS6都有各自的配置。
4. 安全性
POST的安全性要比GET的安全性高。比如：通过GET提交数据，用户名和密码将明文出现在URL上，因为(1)登录页面有可能被浏览器缓存；(2)其他人查看浏览器的历史纪录，那么别人就可以拿到你的账号和密码了，除此之外，使用GET提交数据还可能会造成Cross-Site Request Forgery攻击。
GET和POST相同的地方
HTTP GET、POST协议都是在HTTP上运行的
1. GET：请求参数是作为一个key/value对的序列（查询字符串）附加到URL上的。查询字符串的长度受到web浏览器和web服务器的限制（如IE最多支持2048个字符），不适合传输大型数据集同时，它很不安全
2. POST：请求参数是在HTTP标题的一个不同部分（名为entity body）传输的，这一部分用来传输表单信息，因此必须将Content-type设置为:application/x-www-form-urlencoded。POST设计用来支持web窗体上的用户字段，其参数也是作为key/value对传输。但是：它不支持复杂数据类型，因为POST没有定义传输数据结构的语义和规则。
HTTP请求头字段

//Accept设置接受的内容类型Accept:text/plain//Accept-Charset设置接受的字符编码Accept-Charset:utf-8//Accept-Encoding设置接受的编码格式Accept-Encoding:gzip,deflate//Accept-Datetime设置接受的版本时间Accept-Datetime:Thu,31 May 2007 20:35:00 GMT//Accept-Language设置接受的语言Accept-Language:en-US//Authorization设置HTTP身份验证的凭证Authorization:Basic QWxhZGRpbjpv//Cache-Control 设置请求响应链上所有的缓存机制必须遵守的指令Cache-Control:no-cache//Connection:设置当前连接和hop-by-hop协议请求字段列表的控制选项Connection:keep-aliveConnection:Upgrade//Content-Length：设置请求体的字节长度Content-Length：348//Content-MD5设置基于MD5算法对请求题内容进行Base64二进制编码Content-MD5：Q2hl//Content-Type设置请求体的MIME类型（适用POST和PUT请求）Content-Type：application/x-www-form-urlencoded//cookie设置服务器使用Set-Cookie发送的http cookieCookie：$Version=1;Skin=new;//Date 设置消息发送的日期和时间Date：Tue，15 Nov 1994//Expect标识客户端需要的特殊浏览器行为Expect:100-continue//Forwarded 披露客户端通过http代理连接web服务的源信息Forwarded: for=192.0.2.60;proto=http;by=203.0.113.43Forwarded: for=192.0.2.43, for=198.51.100.17//From 设置发送请求的用户的email地址From: user@example.com//Host 设置服务器域名和TCP端口号，如果使用的是服务请求标准端口号，端口号可以省略Host: en.wikipedia.org:8080Host: en.wikipedia.org//If-Match 设置客户端的ETag,当时客户端ETag和服务器生成的ETag一致才执行，适用于更新自从上次更新之后没有改变的资源If-Match: "737060cd8c284d8af7ad3082f209582d"//If-Modified-Since 设置更新时间，从更新时间到服务端接受请求这段时间内如果资源没有改变，允许服务端返回304 Not ModifiedIf-Modified-Since: Sat, 29 Oct 1994 19:43:31 GMT//If-None-Match 设置客户端ETag，如果和服务端接受请求生成的ETage相同，允许服务端返回304 Not ModifiedIf-None-Match: "737060cd8c284d8af7ad3082f209582d"//If-Range 设置客户端ETag，如果和服务端接受请求生成的ETage相同，返回缺失的实体部分；否则返回整个新的实体If-Range: "737060cd8c284d8af7ad3082f209582d"//If-Unmodified-Since 设置更新时间，只有从更新时间到服务端接受请求这段时间内实体没有改变，服务端才会发送响应If-Unmodified-Since: Sat, 29 Oct 1994 19:43:31 GMT//Max-Forwards 限制代理或网关转发消息的次数Max-Forwards: 10//Origin 标识跨域资源请求（请求服务端设置Access-Control-Allow-Origin响应字段）Origin: http://www.example-social-network.com//Pragma 设置特殊实现字段，可能会对请求响应链有多种影响Pragma: no-cache//Proxy-Authorization 为连接代理授权认证信息Proxy-Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==//Range 请求部分实体，设置请求实体的字节数范围，具体可以参见HTTP/1.1中的Byte servingRange: bytes=500-999//Referer 设置前一个页面的地址，并且前一个页面中的连接指向当前请求，意思就是如果当前请求是在A页面中发送的，那么referer就是A页面的url地址（轶事：这个单词正确的拼法应该是"referrer",但是在很多规范中都拼成了"referer"，所以这个单词也就成为标准用法）Referer: http://en.wikipedia.org/wiki/Main_Page//Upgrade 请求服务端升级协议Upgrade: HTTP/2.0, HTTPS/1.3, IRC/6.9, RTA/x11, websocket//User-Agent 用户代理的字符串值User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:12.0) Gecko/20100101 Firefox/21.0

DNS解析原理
- 一个域中的每个主机名与其IP地址的映射关系由这个域的DNS服务器负责管理，例如，“www.it315.org”、“ftp.it315.org”、“blog.it315.org”等主机名都由管理域“it315.org”的DNS服务器进行管理，而不能由管理域“org”的DNS服务器进行管理。
- 每个子域都必须在其直接父域的DNS服务器上注册该子域的名称和该子域的DNS服务器的IP地址，例如，必须在管理域“org”的DNS服务器注册子域“it315.org”和管理子域“it315.org”的DNS服务器的IP地址后，域名“it315.org”才能真正被外界所认可。
- 为了方便对顶级域名的统一管理，在顶级域名之上其实还有一个根域名，根域名用点（.）表示，例如，“www.it315.org”也可以写为“www.it315.org.”，“www.it315.org.”中的最后的那个点（.）就表示根域名。 Internet中的根域名由InterNIC（国际互联网络信息中心）集中管理，顶级域名和其下的域名则由拥有该域名的组织、公司和个人自己管理。

域名解析方式一：

域名解析方式二：

阅读全文

0 0