python实例---python爬虫
来源:互联网 发布:佛罗里达州立大学 知乎 编辑:程序博客网 时间:2024/05/24 03:13
此爬虫可以将网络上的图片下载到本地:# -*- coding:UTF-8 -*-#爬虫import urllibimport redef getHtml(url): page = urllib.urlopen(url) html = page.read() return htmldef getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg' % x) x+=1 return imglisthtml = getHtml("http://tieba.baidu.com/p/2460150866")print getImg(html)
在ide上执行此代码即可。
这里的核心是用到了urllib.urlretrieve()方法,直接将远程数据下载到本地。通过一个for循环对获取的图片连接进行遍历,为了使图片的文件名看上去更规范,对其进行重命名,命名规则通过x变量加1。保存的位置默认为程序的存放目录。
程序运行完成,将在目录下看到下载到本地的文件。
参考地址:http://www.cnblogs.com/fnng/p/3576154.html
阅读全文
0 0
- python实例---python爬虫
- python爬虫实例
- Python 爬虫入门实例
- python爬虫小实例
- Python简单爬虫实例
- 一个python爬虫实例
- Python爬虫实例一
- Python爬虫实例二
- Python爬虫实例三
- 简单Python爬虫实例
- Python 爬虫文字实例
- Python爬虫实例
- python爬虫实例之一
- Python requests爬虫实例
- python爬虫实例备忘
- Python爬虫实例
- python 网络爬虫实例
- python爬虫实例--百度风云榜
- 总结
- spring StopWatch 监控请求执行时间
- async修饰符,await运算符关键字(C# 参考)
- 关于 tomcat 集群中 session 共享的三种方法
- qduoj 帅气的HYC的珍珠 (树状数组)
- python实例---python爬虫
- JavaScript学习(三)面向对象、闭包、原型
- ES6之解构赋值
- 机器学习中的特征选择和优缺点
- VMware 12.5虚拟机安装Mac OS X 10(最新版)
- VMware Workstation 不可恢复错误: (vcpu-0)解决方法
- ActiveMQ发布-订阅消息模式(同点对点模式的区别)
- dateTimePicker 賦值
- 【SpringMVC之配置文件(一)】spring 里面的ApplicationContext.xml 和 xxx-servlet.xml分别的作用是什么?