python爬虫原理解析

来源:互联网 发布:ios数据恢复工具 编辑:程序博客网 时间:2024/04/30 07:58

三个模块:url管理器(已爬和待爬)、网页下载器urllib2、网页解析器BeautifulSoup.


第一步:构造request

第二步:urllib2.urlopen(request)

第三部:使用Beautifulsoup来对下载下来的网页进行DOM解析。



0 0