Python 简单爬虫--获得网上的图片
来源:互联网 发布:日本对中国文化知乎 编辑:程序博客网 时间:2024/05/29 13:58
代码:
# -*- coding: utf-8 -*- # feimengjuan import re import urllib import urllib2 #抓取网页图片 #根据给定的网址来获取网页详细信息,得到的html就是网页的源代码 def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def saveImages(imglist): number = 1 for imageURL in imglist: fileName = "pic" + "/" + str(number) + "." + "jpg" # 对于每张图片地址,进行保存 try: u = urllib2.urlopen("http:"+imageURL) data = u.read() f = open(fileName,'wb+') f.write(data) print u'正在保存的一张图片为',fileName f.close() except urllib2.URLError as e: print (e.reason) number += 1 #获取网页中所有图片的地址 def getAllImg(html): #利用正则表达式把源代码中的图片地址过滤出来 reg = r'data-original="(.+?\.jpg)" alt' imgre = re.compile(reg) imglist = imgre.findall(html)#表示在整个网页中过滤出所有图片的地址,放在imglist中 print imglist return imglist if __name__ == '__main__': html = getHtml("http://category.vip.com/search-1-0-1.html?q=3|29736|10000389|&rp=30071|29737#J_catSite")#获取该网址网页详细信息,得到的html就是网页的源代码 path = u'图片' imglist = getAllImg(html) #获取图片的地址列表 saveImages(imglist) # 保存图片
结果:
0 0
- Python 简单爬虫--获得网上的图片
- python爬虫爬取斗图网上图片
- Python简单图片爬虫
- Python简单图片爬虫
- 简单的python爬虫抓取图片实例
- python爬虫----简单的图片爬取
- 一个简单的python爬虫爬取糗百图片
- Python实现一个简单的图片爬虫
- python 简单爬虫下载图片
- Python简单爬虫爬取多页图片
- 一个简单的网络爬虫-从网上爬取美女图片
- python爬虫爬取网上的照片
- Python 实现简单的爬虫功能: 图片的抓取
- python 抓取网上的图片。
- Python简单的爬虫
- 简单的python爬虫
- 简单的Python 爬虫
- python——基于煎蛋网的简单图片爬虫
- 线性规划
- vSphere 6.5新功能
- 机器学习:金融领域的岗位需求
- JVM调优浅谈
- System里getProperty 方法获得系统参数
- Python 简单爬虫--获得网上的图片
- hive三种方式区别和搭建、HiveServer2环境搭建、HWI环境搭建和beeline环境搭建
- ocr识别图片文字,调用OneNote
- 递归专题
- spark mllib源码分析之随机森林(Random Forest)(一)
- android新特性: 底部导航栏BottomNavigationView系统库与第三方库的两种不同库的使用方法
- r语言聚类实现整理
- dp专题 第十九题 最低通行费
- json_decode转换json数据为null