python图片小爬虫
来源:互联网 发布:战地2小队数据 编辑:程序博客网 时间:2024/04/26 07:07
import reimport urllibimport osdef rename(name): name = name + '.jpg' return name def getHtml(url): page = urllib.urlopen(url) html = page.read() return htmldef getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) os.chdir("E:\\pic") os.getcwd() x=1 for imgurl in imglist: img=urllib.urlopen(imgurl) name=str(x) name = rename(name) print(name) x=x+1 f=open(name,'wb') f.write(img.read()) f.close() html = getHtml("http://tieba.baidu.com/p/3553148164")getImg(html)print 'pic save!'
爬取的网页是 http://tieba.baidu.com/p/3553148164
图片保存在E盘pic文件夹下
爬取结果如下:
1 0
- python图片小爬虫
- python 图片小爬虫
- 【python小练习】百度图片小爬虫
- 一个python爬图片的小爬虫
- python 实现网站图片抓取小爬虫
- python 小爬虫爬取美女图片
- 第一个python程序,小爬虫--抓取网页图片
- python爬虫小项目:爬取百度贴吧图片
- python小爬虫—抓取pixabay网站的图片资源
- 百度图片小爬虫
- 一个图片小爬虫
- [python]网页小爬虫
- 一个Python小爬虫
- python爬虫小程序
- Python小爬虫,(多线程)
- python小爬虫
- python爬虫小实例
- python小爬虫
- COM组件设计与应用(四)——简单调用组件
- 面向对象上
- Ubuntu网络配置+Fixing “Failed to bring up eth0” in Ubuntu
- 外部排序的基本思路
- mysql和apache tomcat服务安装
- python图片小爬虫
- 高等几何——射影变换4
- 2015.1.29实验室日记
- FTP协议要点
- 教科书的程序与实际商用的区别
- Face Databases
- 汉语言文学专升本学生教科研素养调查及对策
- 在NSString中找到数字转换成int,方法如下。so cool !
- Objective - C基础: 第六天 - 5.protocol协议的基本认识