urllib

来源:互联网 发布:js 日期不支持 format 编辑:程序博客网 时间:2024/05/23 10:33

urllib.urlopen(url,data=None,proxies=None,context=None)

data是访问URL时要传送的数据

proxies是代理(字典)

urlopen返回一个类文件对象,它提供以下方法:
read()、readline()、readlines()、fileno()、close()【同文件操作方法】
getcode():返回网页状态码
info():返回一个httplib.HTTPMessage对象,表示服务器返回的头信息
geturl():返回请求的URL


urllib.urlretrieve(url,filename,reporthook,data)

filename:指定保存文件的路径(未制定参数,urllib会生成一个临时文件)

reporthook:一个回调函数,当连接上服务器、以及相应额数据块传世完毕时会触发该回调,可显示下载进度

data:post到服务器的数据,包含两个元素的元组(filename,headers),filename表示保存到本地的路径,header表示服务器的响应头


urllib.urlcleanup()
清除以前调用可能已经构建的缓存


urllib.quote(url)和urllib,quote_plus(url)
将url数据捕获后,并将其编码,从而与URL字符串中,使其能被打印和被web服务器接受


urllib.unquote(url)和urllib.quote_plus(url)
解码被编码的URL


urllib.urlencoding(query)
将URL中的键值对以连接符‘&’划分


urllib.pathname2url(path)
将路径名的本地语法转换为URL的路径组件中使用的表单。不会产生完整的URL。返回值将使用该quote()函数引用。


urllib.url2pathname(path)
将路径组件,路径从百分比编码的URL转化为路径的本地语法。不接受完整的网址,用于unquote()路径


urllib.getproxies()
将代理服务器URL映射返回一个字典方案。

原创粉丝点击