Python爬虫实战一 | 抓取取校花网的所有妹子
来源:互联网 发布:数据存储加密解决方案 编辑:程序博客网 时间:2024/05/17 03:20
今天晚上顺带就实际的写写工具,我们刚学完Python的基础语法!抓点妹子带回家~
总结一下之前的吧,我写了关于Python爬虫的六节课程,也就是六篇文章,文章有点简洁,但是很细节,如果还有不懂的请加我QQ:1099718640,或者留言,小东看到了一定会及时回复的哦!愿和各位志同道合的程序猴子一起畅谈人生!哈哈~
今天晚上,刚开完班会。。。老实说,小东大一的成绩很不好,全班倒数,无颜见父老啊,待在“卓越班”感觉自己负罪感满满,哎╮(╯▽╰)╭,在博客里吐槽一下啦~今后好好把公共基础课学好,大学到最终还是以成绩来衡量的,但还是要尽量地多去参加一下竞赛,哈哈~
# 抓取校花网 校花图片# 作者:DYBOY 小东# 时间:2017-09-06'''http://www.xiaohuar.com/list-1-0.html 第一页http://www.xiaohuar.com/list-1-1.html 第二页'''import requestsimport refrom bs4 import BeautifulSoup#以上作为基本引用def getGirls(girl_url): main_url = 'http://www.xiaohuar.com' header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'} res = requests.get(girl_url,headers = header,timeout=10) res.encoding = 'gb2312' soup = BeautifulSoup(res.text,'html.parser') for images in soup.select('.item'): img_url = main_url + images.select('.item_t .img a img')[0]['src'] houzhui = img_url[-4:] img_alt = images.select('.item_t .img a img')[0]['alt'] + houzhui print(img_alt) img = requests.get(img_url) with open('xiaohua/' + img_alt,"wb") as code: code.write(img.content) print('ok!')def url_change(): for i in range(19,44): url = 'http://www.xiaohuar.com/list-1-' + str(i) + '.html' getGirls(url)#MAINurl_change()
代码自己去github上去看~
注:本文属于原创文章,转载请注明本文地址!
作者QQ:1099718640
CSDN博客主页:http://blog.csdn.net/dyboy2017
Github开源项目:https://github.com/dyboy2017/xiaohua
阅读全文
1 0
- Python爬虫实战一 | 抓取取校花网的所有妹子
- python 爬虫 实战 抓取妹子图中图
- 爬虫实战一:爬取当当网所有 Python 书籍
- Python爬虫实战(四) :下载煎蛋网所有妹子照片
- [Python/爬虫/]校花网
- Python爬虫框架Scrapy:爬取校花网
- Python网络爬虫(4)煎蛋网妹子图片抓取
- Python爬虫---------------<妹子图>图片抓取(1)
- Python 爬虫-爬取pixiv特定搜索结果的所有作品-抓取 分析 下载
- [Python]网络爬虫学习笔记,爬取豆瓣妹子上妹子的照片
- python爬虫系列一:爬取糗百成人的妹子图片(urllib2)
- Python爬虫实战(十):爬取Linux公社资源站的所有电子资源
- Python爬虫实战之抓取淘宝MM照片(一)
- 用python爬取校花网图片
- Python爬虫实战一之使用Beautiful Soup抓取‘谣言百科’的分类内容
- python 爬虫爬取所有上市公司公告信息(一)
- Python爬虫实战一之爬取糗事百科段子
- Python爬虫实战一之爬取糗事百科段子
- 网络编程
- 如何使用SignalTap观察被综合掉的wire与reg值
- linux下LAMP环境配置之apache-2.4.27编译安装
- (3)数据挖掘算法之SVM
- 斐波那契数列的递归和非递归实现 —— python
- Python爬虫实战一 | 抓取取校花网的所有妹子
- 引用类型(类)
- Java常用算法——选择排序
- 链式物理结构(元素查找、元素删除、元素插入)
- java 程序文本文档形式的编写,编译,及运行
- 别让时光---消磨你美丽的脸庞
- Linux笔记
- (4)数据挖掘算法之Apriori
- LeetCode——102. Binary Tree Level Order Traversal