批量下载百度贴吧帖子图片

来源:互联网 发布:oracle sql语句面试题 编辑:程序博客网 时间:2024/05/01 13:33

总体功能:下载百度贴吧网页的图片


这个例子延续了上一个抓取贴吧楼主发布内容的例子,上一个例子是把图片剔除掉了,这边重新做了一个下载图片的demo,比较简单。



代码:

# -*- encoding:utf-8 -*-# 下载贴吧的图片import reimport urllibimport urllib2#下载百度贴吧图片类class DownloadImg:    def getImage(self,Url):        request = urllib2.Request(Url)        response = urllib2.urlopen(request)        pattern = re.compile(r'<img class="BDE_Image" src="(.*?)" pic_ext=',re.S)        images = re.findall(pattern,response.read().decode("utf-8"))        name = 1        for img in images:             print img             #urlretrieve(url, filename=None, reporthook=None, data=None)             #把远程的文件下载到本地             urllib.urlretrieve(img,'%s.jpg' %name)             name += 1URL = raw_input(r'请输入帖子网址:')dlImg = DownloadImg()dlImg.getImage(URL)

结果截图(http://tieba.baidu.com/p/3926461641?pn=1):



0 0
原创粉丝点击