Python-request(一)

来源:互联网 发布:怎么样做好网络销售 编辑:程序博客网 时间:2024/05/22 12:41

Python-request库

一、requests库的安装

  1. 通过pip installing安装。在 windows 系统下,打开控制台。只需要输入命令 pip install requests ,即可安装。
  2. 安装requests库的另一种方法。打开这个网址, http://www.lfd.uci.edu/~gohlke/pythonlibs 在这个网站上面有很多 python 的第三方库文件,我们按 ctrl+f 搜索很容易找到 requests。

这里写图片描述

  1. 将 .whl文件下载下来后,将文件重命名,将后缀名从 .whl 改为 .zip ,然后解压文件,我们可以得到两个文件夹。将得到的第一个文件夹拷贝到python 的安装目录下的 lib 目录下。
  2. 测试。打开控制台。输入import request。如下图。说明已经安装成功
    这里写图片描述

二、request库的测试。

  import requests    r = requests.get("http://www.baidu.com")    print(r.status_code)    200

三、requests库的7个主要方法

方法 说明 requests.request() 构造一个请求,支撑以下个方法的基础 requests.get() 获取HTML网页的主要方法,对应于HTTP协议中的get方法 requests.head() 获取HTML网页头信息的方法,对应于HTTP中的HEAD requests.post() 向HTML网页提交post请求的方法,对应于HTTP中的POST requests.put() 向HTML网页提交put请求的方法,对应于HTTP中的put requests.patch() 向HTML网页提交局部修改的请求,对应于HTTP中的PATCH requests.delete() 向HTML网页提交删除的请求,对应于HTTP中的DELETE

1. get()方法
r = requests.get(url)
首先,构造一个向服务器请求资源的requests对象。url是服务器的链接。请求成功之后,返回一个包含服务器资源的response对象。
* requests.get(url, params=None, **Kwargs)
* url:拟获取页面的链接
* params:中的额外参数,字典或者字节流格式,可选
* **Kwargs:12个控制访问的参数

  • response对象:包含服务器返回的所有信息,也包含请求的信息。


    import requests
    r = requests.get(“http://www.baidu.com“)
    r.status_code
    200
    type(r)

requests库的异常
异常 说明 requests.ConnectionError 网络连接错误异常,如DNS查询失败,拒绝连接等 requests.HTTPErrorHTTP 错误异常 requests.URLRequired URL缺失异常 requests.TooManyRedirects 超过最大重定向次数,产生重定向异常 requests.ConnectTimeOut 连接远程服务超时异常 requests.TimeOut请求url 超时异常

* r.raise_for_status()在方法内部自行判定status_code是否为i200,如果不是,则抛出异常。作用就是检测HTTPError

requests网络爬虫的通用代码框架


import requestsdef getHTMLTEXT(url):try:    r = requests.get(url, timeout=30)    r.raise_for_status()    r.encoding = r.apparent_encoding    return r.textexcept:    return "产生异常"

0 0
原创粉丝点击