python 爬取网页中的图片到本地
来源:互联网 发布:c语言中flag怎么用 编辑:程序博客网 时间:2024/04/29 03:54
最近在学习python,顺便写一个爬取网页中图片的程序练练手。
主要分为两个过程:
第一,从给定域名的网页中爬取图片的链接
第二,读取链接对应的图片,保存到本地
第一个过程需要导入utllib包,在python2.7环境下使用 import urllib2 即可
在python3.X 之后的版本中,由于没有了urllib2模块,所以导入的是 import urllib.request
在这里,我的环境是 python 2.7
import urllib2 # 导入urllib2模块req = urllib2.urlopen('https://www.nuomi.com/?cid=002540')buf = req.read()
三行语句即可将网页的源代码输出到buf对象,然后可以用print buf查看网页的内容
import re # 导入re模块listurl = re.findall(r'http:.+\.jpg',buf) #正则表达式,匹配图片格式print listurl # 将图片的格式放入list中
之后就是利用正则表达式匹配图片格式的链接,将链接存到list中
最后就是将list中的链接读取出来,将图片保存到本地即可。
源代码:
import urllib2 # 导入urllib2模块req = urllib2.urlopen('https://www.nuomi.com/?cid=002540')buf = req.read()import re # 导入re模块listurl = re.findall(r'http:.+\.jpg',buf) #正则表达式,匹配图片格式print listurl # 将图片的格式放入list中i = 0for url in listurl:f = open(str(i)+'.jpg',"wb") #打开文件req = urllib2.urlopen(url)buf = req.read() #读出文件f.write(buf) #写入文件i = i + 1 #更改文件名
在这里,我爬取的是 百度糯米网上的图片,成功保存到当前目录。
3 0
- python 爬取网页中的图片到本地
- python 爬取网页中的图片到本地
- python 爬取网页中的图片到本地
- python爬虫之抓取网页中的图片到本地
- 利用python正则表达式抓取网页中的图片到本地
- python 爬取csdn网页并保存博客到本地
- Python 爬虫多线程爬取美女图片保存到本地
- python爬取网页图片
- python爬取网页图片
- Python爬取网页图片
- Python爬取网页图片
- Python 爬取网页图片
- Python 网页爬取图片
- python 保存网页图片到本地
- Python爬虫——爬取网页中的图片小试牛刀
- 用Java和webmagic爬取图片并下载到本地(动态网页)
- python爬图片到本地
- python小试牛刀之爬取网页文本内容保存到本地
- 反编译Android应用
- 【HDU3949】XOR——线性基
- 各种大型网站技术架构
- easy_install 安装、卸载第三方库
- PyQt之QHBoxLayout、QVBoxLayout 与QGridLayout
- python 爬取网页中的图片到本地
- UITableView获取cell的indexPath.row值(多种方式)
- 数组
- Oracle Fusion Applications 11g Release 7 安装介质
- 电影观后感——穿条纹睡衣的男孩
- JVM小结
- 我的书单
- 程序中的@Override是什么意思?
- 函数