Python3.0 如何抓取网页
来源:互联网 发布:阿里云申请二级域名 编辑:程序博客网 时间:2024/04/28 14:30
用Python来抓取网页是很容易的,前面也写过很多类似的内容,但在Python3.0中,内容多多少少有些不同,下面进行一下介绍.
简单的抓取网页:
这样虽然简单,但如果需要进一步精细的控制就略显不足了,在Python 3.0中,将2.x中urllib和urllib2进行了整合,使得抓取网页变得足够的简单了.具体的,大家都知道,网页抓取实际上分为2步:第一步是发出请求,第二步接收服务器返回的数据,在Python中也是这么做的.
上面的是POST的数据,众所周知,还有一种GET的,怎么做了?
上面2个例子中的response对象有2个常用的方法,geturl(),info()
geturl()的设置是为了辨别是否有服务器端的网址重定向,而info()则包含了一系列的信息.
另外一个重要的内容就是错误处理了,这里错误处理比较简单,贴个代码大家自己琢磨吧
最后一个是关于认证的了,网页认证如果大家有相关的网址请发一个过来(没有测试不方便发),关于Cookie认证的以后再写
- Python3.0 如何抓取网页
- Python3抓取网页图片
- Python3网页抓取urllib
- 用python3抓取中文网页
- Python3 抓取网页中的图片
- Python3 抓取网页中的图片
- Python3.4.4抓取网页图片
- Python3:抓取网页HTML代码
- python3.x 抓取网页资源
- python3爬虫--抓取网页信息
- python3抓取网页解码问题!
- python3 抓取网页自有图片
- 如何抓取网页数据
- php如何抓取网页
- 如何抓取网页
- Python3.X抓取网页html乱码问题
- 使用 Python3 抓取网页的简单范例
- Python3 爬虫(一)-- 简单网页抓取
- 编程书籍推荐
- Head First C# 中文版 图文皆译 第五章 封装 page204
- const成员函数
- 浅谈div 与 table
- 叫你宝贝的那个人。。。
- Python3.0 如何抓取网页
- 没有周末的日子
- 写给今天
- JNI-Java(Eclipse)调用dll/so
- 安静
- 饺子
- Struts2 的 Action跳转,错误验证条件下的跳转
- 接下来的这一年
- 第一个圣诞节