Python-request(一）

来源：互联网发布：怎么样做好网络销售编辑：程序博客网时间：2024/05/22 12:41

Python-request库

一、requests库的安装

通过pip installing安装。在 windows 系统下，打开控制台。只需要输入命令 pip install requests ，即可安装。
安装requests库的另一种方法。打开这个网址， http://www.lfd.uci.edu/~gohlke/pythonlibs 在这个网站上面有很多 python 的第三方库文件，我们按 ctrl+f 搜索很容易找到 requests。

这里写图片描述

将 .whl文件下载下来后，将文件重命名，将后缀名从 .whl 改为 .zip ，然后解压文件，我们可以得到两个文件夹。将得到的第一个文件夹拷贝到python 的安装目录下的 lib 目录下。
测试。打开控制台。输入import request。如下图。说明已经安装成功

二、request库的测试。

  import requests    r = requests.get("http://www.baidu.com")    print(r.status_code)    200

三、requests库的7个主要方法

方法说明 requests.request() 构造一个请求，支撑以下个方法的基础 requests.get() 获取HTML网页的主要方法，对应于HTTP协议中的get方法 requests.head() 获取HTML网页头信息的方法，对应于HTTP中的HEAD requests.post() 向HTML网页提交post请求的方法，对应于HTTP中的POST requests.put() 向HTML网页提交put请求的方法，对应于HTTP中的put requests.patch() 向HTML网页提交局部修改的请求，对应于HTTP中的PATCH requests.delete() 向HTML网页提交删除的请求，对应于HTTP中的DELETE

1. get()方法
r = requests.get(url)
首先，构造一个向服务器请求资源的requests对象。url是服务器的链接。请求成功之后，返回一个包含服务器资源的response对象。
* requests.get(url, params=None, **Kwargs)
* url:拟获取页面的链接
* params:中的额外参数，字典或者字节流格式，可选
* **Kwargs:12个控制访问的参数

response对象：包含服务器返回的所有信息，也包含请求的信息。
import requests
r = requests.get(“http://www.baidu.com“)
r.status_code
200
type(r)

requests库的异常

异常说明 requests.ConnectionError 网络连接错误异常，如DNS查询失败，拒绝连接等 requests.HTTPErrorHTTP 错误异常 requests.URLRequired URL缺失异常 requests.TooManyRedirects 超过最大重定向次数，产生重定向异常 requests.ConnectTimeOut 连接远程服务超时异常 requests.TimeOut请求url 超时异常

* r.raise_for_status()在方法内部自行判定status_code是否为i200,如果不是，则抛出异常。作用就是检测HTTPError

requests网络爬虫的通用代码框架

import requestsdef getHTMLTEXT(url):try:    r = requests.get(url, timeout=30)    r.raise_for_status()    r.encoding = r.apparent_encoding    return r.textexcept:    return "产生异常"

0 0