学习小记 - Python爬虫 (3）利用Python爬取wanimal所有图片

来源：互联网发布：win7搜不到网络打印机编辑：程序博客网时间：2024/05/21 18:35

这是辆车…

本次调用urlretrieve()方法实现对媒体文件的本地存储，其他和之前类似。

from urllib.request import urlopen, urlretrievefrom bs4 import BeautifulSoupfrom urllib.error import URLError, HTTPErrorimport requestsclass Wanimal:    def __init__(self, page):        self.page = page        self.imgs = []    def getPage(self, page):        try:            html = urlopen("http://wanimal1983.org/page/"+str(page))            bsobj = BeautifulSoup(html, "html.parser")            return bsobj        except (URLError, HTTPError) as e:            print (e)            return None    def getImages(self, page):        print ("正在加载第%d页" % page)        bsobj = self.getPage(page)        imgTags = bsobj.findAll("div", {"class": "photo-sets"})        self.imgs = []        for imgTag in imgTags:            for img in imgTag.findAll("img"):                self.imgs.append(img)    def download(self):        for page in range(self.page):            self.getImages(page+1)            for i in range(len(self.imgs)):                print ("正在保存第%d个图片" % (i+1))                path = str(page)+'_'+str(i)+".jpg"                print (self.imgs[i].attrs["src"])                urlretrieve(self.imgs[i].attrs["src"], "wanimal/"+path)w = Wanimal(100000)print (w.imgs)w.download()

由于Ubutun下不能全局翻墙（我不会><），本次代码在windows下运行。
代码跑起来咯~！

这里写图片描述

0 0

学习小记 - Python爬虫 (3） 利用Python爬取wanimal所有图片

学习小记 - Python爬虫 (3）利用Python爬取wanimal所有图片