python爬虫天堂网图片的进阶版
来源:互联网 发布:金星能过性能活不知乎 编辑:程序博客网 时间:2024/04/27 15:30
闲话不多说,直接上代码:
import requestsfrom bs4 import BeautifulSoupimport reimport urllibdef cbk(a,b,c): '''''回调函数 @a:已经下载的数据块 @b:数据块的大小 @c:远程文件的大小 ''' per=100.0*a*b/c if per>100: per=100 print ('%.2f%%' % per) print(" ")url = 'http://www.ivsky.com/tupian/meishishijie/'headers ={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.3427.400 QQBrowser/9.6.12513.400','Referer':'http://www.ivsky.com/tupian/qita/index_11.html'}html = requests.get(url,headers = headers)soup = BeautifulSoup(html.text,'html.parser')for i in range(0,12): link = url +'/index_'+str(i)+'.html' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.3427.400 QQBrowser/9.6.12513.400', 'Referer':'http://www.ivsky.com/tupian/qita/index_11.html'} html = requests.get(link, headers=headers) mess = BeautifulSoup(html.text, 'html.parser') for page in mess.find_all('ul',class_='ali'): for img in page.find_all('img'): imgre = re.compile(r'src="(.*?\.jpg)" alt') imglist = re.findall(imgre,html.text) #imgurl = img.get('src') #print imgurl x = 0 for imgurl in imglist: work_path = "E:/img/" + str(x) + ".jpg" urllib.urlretrieve(imgurl,work_path,cbk) x += 1
阅读全文
0 0
- python爬虫天堂网图片的进阶版
- 天堂图片网爬虫
- python 抓取天堂图片网中的图片
- python爬虫实现下载电影天堂电影
- Python 爬虫进阶必须的几步
- python爬虫进阶(七):应对反爬虫的策略
- python爬虫进阶
- Python爬虫进阶
- 用python做一个可以下载电影天堂最新电影的爬虫
- Python爬虫实战(八):爬取电影天堂的电影下载链接
- python[五]:python爬虫进阶
- Python进阶_6.爬虫中总结的Python
- python——图片爬虫:爬取爱女神网站(www.znzhi.net)上的妹子图 进阶篇
- 自己用python捣鼓的煎蛋网图片爬虫
- python——基于煎蛋网的简单图片爬虫
- python爬虫进阶之多线程
- python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索
- 简单的python爬虫抓取图片实例
- jquery中的ajax方法参数的用法和他的含义
- Linux常用命令——统计文件个数
- Javascript学习笔记(一)
- JavaScript学习笔记(二)
- JS学习-基础运动
- python爬虫天堂网图片的进阶版
- 关于交换机VRRP和SNMP的配置
- JQuery学习笔记
- GIT笔记
- Linux 常用命令大全
- AJAX学习笔记
- 使用FormData进行Ajax请求上传文件到controller层的实现
- jQuery能做什么
- 计算圆、长方形的面积和周长