Python爬虫_简单获取百度贴吧图片
来源:互联网 发布:手机上能开淘宝店吗 编辑:程序博客网 时间:2024/05/24 20:07
#coding=utf-8import reimport urllibdef getHtml(url): page = urllib.urlopen(url) html = page.read() return htmldef callbackfunc(blocknum, blocksize, totalsize): '''回调函数 @blocknum: 已经下载的数据块 @blocksize: 数据块的大小 @totalsize: 远程文件的大小 ''' percent = 100.0 * blocknum * blocksize / totalsize if percent > 100: percent = 100 print "%.2f%%"% percentdef getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 #保存文件到本地,urlretrieve函数的第一个参数是URL,第二个是地址 for imgurl in imglist: print '正在保存第' + str(x+1) + '图片...' urllib.urlretrieve(imgurl,'%s.jpg' % x,callbackfunc) x+=1 return imglist html = getHtml("http://tieba.baidu.com/p/2460150866")#print getImg(html)getImg(html)
0 0
- Python爬虫_简单获取百度贴吧图片
- Python 爬虫获取百度贴吧图片
- Python爬虫_获取贴吧内容
- 【python爬虫】百度贴吧帖子图片批量保存爬虫
- 【python 爬虫】百度贴吧帖子所有楼层图片爬虫
- 百度贴吧_爬虫
- Python 百度爬虫图片
- python简单爬虫(获取图片)
- python 百度贴吧爬虫(下载图片)
- python爬虫:下载百度贴吧图片学习笔记
- python爬虫小项目:爬取百度贴吧图片
- Python简单爬虫,爬取百度贴吧
- python百度贴吧爬虫
- python 百度贴吧爬虫
- python- 百度贴吧爬虫
- [python]百度贴吧爬虫
- Python简单图片爬虫
- Python简单图片爬虫
- App性能瓶颈优化 总结
- 内核源码解读基础
- 在AWS RDS(Oracle)上执行数据导入
- Java之冒泡排序的实现
- Ros_OpenCV_cascade分类器检测程序
- Python爬虫_简单获取百度贴吧图片
- C++扬帆远航——8(张三李四,等差数列)
- zabbix监控邮件报警功能二次开发(自定义媒体)
- go语言channel关注点
- 微信和qq默认表情代码对照表及表情文件下载
- 康托展开(哈希方法)
- 15、Bootstrap 框架
- CocoaPods 导入第三方库头文件自动补齐
- 86. Partition List【M】【48】【leetcode题解】