Python 网络爬虫-下载图片

来源：互联网发布：java 长连接框架编辑：程序博客网时间：2024/06/05 08:19

#!/usr/bin/python#-*- coidng:UTF-8-*-'''Created on 2015-1-19@author: huangpeng03'''#coding=utf-8import urllibimport redef getHtml(url):    page = urllib.urlopen(url)    html = page.read()    return htmldef getImg(html):    reg = r'src="(.+?\.jpg)" pic_ext'    imgre = re.compile(reg)    imglist = re.findall(imgre,html)    x = 0    for imgurl in imglist:        urllib.urlretrieve(imgurl,'%s.jpg' % x)        x+=1html = getHtml("http://tieba.baidu.com/p/2460150866")print getImg(html)

默认下载路径是工程目录

.+? 是懒惰模式匹配  .+的意思是.至少含有一个，加个问号表示匹配成功一次后就不往后走了

0 0

Python 网络爬虫-下载图片
python中使用网络爬虫下载图片
python 3.x网络爬虫下载图片
【Python】网络爬虫-批量下载图片
python 爬虫下载图片
python 爬虫下载网站图片
python 爬虫批量下载图片
python 简单爬虫下载图片
python爬虫学习--下载图片
python网络爬虫抓取图片
python 网络爬虫抓取图片
python网络爬虫抓取图片
python网络爬虫抓取图片
python网络爬虫抓取图片
python下载网络图片
Python 实现的下载op海贼王网的图片（网络爬虫）
【Python开发】【神经网络与深度学习】网络爬虫之图片自动下载器
利用python网络爬虫批量下载花瓣中个人主页中收藏的所有图片
虚拟化课程Citrix XenDesktop 7.1 管理
SSH+ExtJS实战开发视频教程
我们为什么需要DTO(数据传输对象)
花前病酒的学拳笔记，杨氏叶派，叶家拳，暂时1-19
textarea 输入框限制字数（完美兼容）
Python 网络爬虫-下载图片
ActionBar Menus
python文件比较的lib
物联网的爆发点：六大因素正稳步壮大物联网
HTTP代码 404，500，200代表什么意思
linux中fork()函数的详解
Tomcat 相关问题记录
cp命令
hdu1251