python urllib2库

来源:互联网 发布:中万网络 域名 编辑:程序博客网 时间:2024/06/04 17:40

urllib2是一个用来打开URL的可扩展的库。urllib2模块定义在一个用来打开复杂的世界的URLs(大多数是HTTP)的函数和类--包括基本的和摘要式身份验证(digest authentication),重定向(redirection),缓存(cookies)等。

urllib2有以下的函数

urllib2.urlopen()

打开一个URL,这个URL既可以是一个字符串,也可以是一个Request对象。

urllib2有以下关键的类

urllib2.Request(url)

这个类是URL请求的一个抽象。

url应该是一个包含合法URL的字符串。

data可能是一个发到服务器的指定了额外数据的字符串,如果这个数据并不需要,它可以为None。现在HTTP请求是唯一需要data的;但data没有提供时,HTTP请求将是一个POST请求而不是GET请求。在标准应用/x-www-form-urlencoded格式中,data应该是一个buffer。

headers应该是一个字典,并且add_header()被调用时,参数为headers的键和值。这经常被用在User-Agend的头部,用来被浏览器识别它自己-- 一些HTTP服务器仅仅允许来自通用浏览器的请求,而拒绝来自脚本的请求。

0 0
原创粉丝点击