python图片小爬虫

来源：互联网发布：战地2小队数据编辑：程序博客网时间：2024/04/26 07:07

import reimport urllibimport osdef rename(name):     name = name + '.jpg'    return name  def getHtml(url):    page = urllib.urlopen(url)    html = page.read()    return htmldef getImg(html):    reg = r'src="(.+?\.jpg)" pic_ext'    imgre = re.compile(reg)    imglist = re.findall(imgre,html)            os.chdir("E:\\pic")      os.getcwd()     x=1    for imgurl in imglist:        img=urllib.urlopen(imgurl)                          name=str(x)          name = rename(name)          print(name)         x=x+1                f=open(name,'wb')        f.write(img.read())         f.close()       html = getHtml("http://tieba.baidu.com/p/3553148164")getImg(html)print 'pic save!'

爬取的网页是 http://tieba.baidu.com/p/3553148164

图片保存在E盘pic文件夹下

爬取结果如下:

1 0

python图片小爬虫
python 图片小爬虫
【python小练习】百度图片小爬虫
一个python爬图片的小爬虫
python 实现网站图片抓取小爬虫
python 小爬虫爬取美女图片
第一个python程序，小爬虫--抓取网页图片
python爬虫小项目：爬取百度贴吧图片
python小爬虫—抓取pixabay网站的图片资源
百度图片小爬虫
一个图片小爬虫
[python]网页小爬虫
一个Python小爬虫
python爬虫小程序
Python小爬虫，(多线程)
python小爬虫
python爬虫小实例
python小爬虫
COM组件设计与应用（四）——简单调用组件
面向对象上
Ubuntu网络配置+Fixing “Failed to bring up eth0” in Ubuntu
外部排序的基本思路
mysql和apache tomcat服务安装
python图片小爬虫
高等几何——射影变换4
2015.1.29实验室日记
FTP协议要点
教科书的程序与实际商用的区别
Face Databases
汉语言文学专升本学生教科研素养调查及对策
在NSString中找到数字转换成int,方法如下。so cool !
Objective - C基础: 第六天 - 5.protocol协议的基本认识