简单爬虫源码,下载指定网页所有图片
来源:互联网 发布:mac 鼠标指针小手 编辑:程序博客网 时间:2024/04/28 01:32
以下是源码,参考的是虫师写的简单爬虫的实现,虫师教程太老,导致范例跑不起来。 原因是里面的网址404了。必须要正则能够搜索到图片。
本文范例所用网址里面的图片命名是 http://tb.himg.baidu.com/sys/portrait/item/33a5786c3936343937303734355a33
#-*- coding:utf-8 -*-import reimport urllibdef getHtml(url): page = urllib.urlopen(url) html = page.read() return htmldef getImg(html): reg = r'src="(http://.*?)"' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: print x urllib.urlretrieve(imgurl,'%s.jpg' % x) x+=1 print x return imglisthtml = getHtml("http://tieba.baidu.com/p/4817501655")getImg(html)
运行以上代码 就会把网址里的所有jpg图片下载到本地目录也就是和程序文件同目录下
0 0
- 简单爬虫源码,下载指定网页所有图片
- 抓取网页所有url的简单Python爬虫源码
- 从指定网页自动下载其中所有的图片
- 下载网页所有图片的最简单的方法
- Python下载网页所有图片
- Python 爬虫5——爬取并下载网页指定规格的图片
- python 简单爬虫下载图片
- 爬虫 scrapy 框架学习 2. Scrapy框架业务逻辑的理解 + 爬虫案例 下载指定网站所有图片
- Python3 爬虫下载指定页面图片
- [python][爬虫]从网页中下载图片
- Python3.x爬虫下载网页图片
- 爬虫_简单下载一下网页
- python 下载指定网页上得图片
- Python3简单爬虫抓取网页图片
- python3 批量下载网页所有图片
- Chrome扩展,下载网页上所有图片
- Android 读取网页源码和下载图片
- python获取网页中所有图片并筛选指定分辨率
- dojo:DOM 和HTML
- 如何在 Java 中正确使用 wait, notify 和 notifyAll – 以生产者消费者模型为例
- Win7安装虚拟光驱蓝屏解决办法
- 开始使用MySQL
- oracle11g dataguard 完全手册
- 简单爬虫源码,下载指定网页所有图片
- [UOJ#244][UER#7A]短路(贪心)
- PS--把美女头像转成漂亮的仿手绘效果
- Gradle 提示中文乱码
- 32位和64位及其内存长度
- 第七周 oj训练5
- 关于动画。
- Swift闭包
- Android Material Design之TextInputLayout