网络图片的爬取和存储

来源:互联网 发布:穿越火线开挂软件 编辑:程序博客网 时间:2024/06/05 14:55

网络图片链接的格式为:

http://www.example.com/picture.jpg
我们以国家地理为例:http://www.nationalgeographic.com.cn/
选择一个图片Web页面:
http://www.nationalgeographic.com.cn/photography/photo_of_the_day/3921.html

利用浏览器的检查功能可以找到图片的地址


下面利用Requests库爬取并储存这张图片


with open(path,'wb')as f:
f.write(r.content)

这两句就是向指定地点写入文件,最后将文件关闭

这样在D盘里就可以对应地找到abc.jpg了

也可以将图片原来的名字作为图片的名字

path="D://"+url.split('/')[-1]
文件名称和网络中的文件名称是相同的


图片爬取的全代码


如果根目录不存在,则先创建,如果文件不存在,则下载

这样可以提高程序的可靠性和稳定性,在做每一步操作的时候都对此时的状态进行判断

原创粉丝点击