WEB初探

来源：互联网发布：pe系统制作软件编辑：程序博客网时间：2024/05/18 16:16

WEB初探

当我在浏览器地址栏里输入一个地址后发生的故事…

1.首先，在浏览器里输入要网址
这里写图片描述

2. 浏览器查找域名的IP地址
通过访问的域名找出其IP地址,这个从URL到IP地址的过程叫做DNS查找。
DNS查找过程如下：

浏览器缓存 – 浏览器会缓存DNS记录一段时间。有趣的是，操作系统没有告诉浏览器储存DNS记录的时间，这样不同浏览器会储存个自固定的一个时间（2分钟到30分钟不等）。
系统缓存 – 如果在浏览器缓存里没有找到需要的记录，浏览器会做一个系统调用（windows里是gethostbyname）。这样便可获得系统缓存中的记录。
-路由器缓存 – 接着，前面的查询请求发向路由器，它一般会有自己的DNS缓存。
-ISP DNS 缓存 – 接下来要check的就是ISP缓存DNS的服务器。在这一般都能找到相应的缓存记录。
-递归搜索 – 你的ISP的DNS服务器从跟域名服务器开始进行递归搜索，从.com顶级域名服务器到Facebook的域名服务器。一般DNS服务器的缓存中会有.com域名服务器中的域名，所以到顶级服务器的匹配过程不是那么必要了。

其中关于DNS递归查找以及本文的更详细介绍，请参考原博客
(http://blog.csdn.net/zll0927/article/details/11885239)

3. 建立连接和发送请求

得到服务器的IP地址，首先我希望它把bilibili.com对应的网页传送给我。则需要跟服务器建立一个连接。
这里写图片描述

通过这个专用通道，向服务器发起一个请求（Request）。这个请求里面，我会像服务器阐明我想要的资源是什么，例如在这里，我想要的资源就是B站的首页。
而具体这个资源的位置如何告诉服务器，需要回答URL上，这里以百度为例介绍了URL的组成：
这里写图片描述
一个URL一般由六个部分组成，这里我们只介绍主机名（服务器名）和资源位置（或者说是资源路径）。一个服务器上可以有很多的资源，对应着不同的页面或者文件，例如http://xxx.com/login可以是某网站的登录页面，http://xxx.com/register则可以是某网站的注册页面。这里的/login和/register就代表了两个不同的资源（这里是页面）。/是比较特殊的资源路径，叫做“根路径”，通常就是网站的首页了。其实，这里的原理就和我们电脑上的文件夹是一模一样的。

在知道了需要的资源的位置之后，给服务器发送一个请求：
这里列举原博客访问baidu.com例：

GET / HTTP/1.1 User-Agent: curl/7.37.1 Host: baidu.com Accept: */*
在这里，需要知道的是，GET /即代表，从服务器上拿下来一个资源，这个资源的位置是/。另外，Host: baidu.com代表我要请求的主机名叫做baidu.com。Host这个英文单词就是有主机的意思！

请求通过之前建立的连接将这个请求直接送给服务器。

4.获得响应
当服务器获得请求之后，经过一系列的工作最后将要送还给浏览器的材料，包括网页的代码，全部打包起来形成一个响应（Response），通过连接返回给浏览器。
这里写图片描述

5.浏览器根据接收内容进行显示

以上即为我在浏览器地址栏里输入一个地址后发生的变化。

参考博客：

http://blog.csdn.net/zll0927/article/details/11885239
部分内容和图片引用自http://blog.leapoahead.com/2015/08/30/what-happens-when-you-open-a-webpage/

注：引用非商用，如有问题请联系本人。

0 0