有关http关于b/s模式的理解

来源:互联网 发布:数据库系统的实现 编辑:程序博客网 时间:2024/06/05 11:11

客户端(浏览器)发送请求,有个请求头,请求头中包含这次所请求的信息,包括域名端口号等等,请求方式有getpost等等

get后面的/http/1.1这个就是所要访问的资源路径


服务器接收到这个请求,解析,传回数据,有个响应头,还有响应内容,可以是一个网页,浏览器分析并展示该网页。


200指的是不是连接是否建立,连接建立成功与否是传输层考虑的问题,在应用层,假设链接已经建立起来,200是指正确处理客户端所传来的请求。


所以用python写服务器就是得到请求内容、分析、传回响应内容。

爬虫:给一个种子(初始网址)根据这个沿着整个网站爬,就是先有一次请求,请求后,分析服务器传过来的数据,在爬所得到数据中含有的网址,记录一下这个是否爬过,有各种策略,抓取数据,已键值对的形式存到数据库中,像百度搜索引擎,无时无刻不在爬取内容,存下来,等用户搜索时,根据用户所给的关键字去数据库中查。



在传输层,tcp协议进行传输数据


服务器开发就是在rec和send之间写处理代码。


原创粉丝点击