Python爬虫3
来源:互联网 发布:淘宝店铺销量怎么计算 编辑:程序博客网 时间:2024/06/05 20:07
实战——制作文本爬虫
目标网站:http://www.jikexueyuan.com/
目标内容:课程图片
实现原理:
1.保存网页源代码
2.Python读文件加载源代码
3.正则表达式提取图片网址
4.下载图片
#-*-coding:utf8-*-import reimport requests#读取源代码文件f = open('source.txt','r')html = f.read()f.close()#匹配图片网址pic_url = re.findall('img src="(.*?)" class="lessonimg"',html,re.S)i = 0for each in pic_url: print 'now downloading:' + each pic = requests.get(each) fp = open('pic\\' + str(i) + '.jpg','wb') fp.write(pic.content) fp.close() i += 1
从极客网主页的“审查元素”中复制包含图片的内容到source.txt中!!!
0 0
- python 3 爬虫
- Python爬虫3
- [Python]网络爬虫3
- python 3 简单爬虫
- NO.3 Python爬虫
- Python爬虫基础-3
- Python 爬虫学习3
- python爬虫练习3
- python 3 爬虫教程
- python爬虫备忘(3)
- Python爬虫----爬虫入门(3)---urllib2
- python 爬虫-3:id 遍历爬虫
- python爬虫随笔3 妹子图爬虫
- Python爬虫入门 | 3 爬虫必备Python知识
- python爬虫初学(3)
- Python爬虫(3),Python3.x
- Python爬虫(bs4)-3
- python 3.0 网络爬虫 3
- 深入JavaScript(6)S.O.L.I.D五大原则之单一职责SRP
- Additive equations--zoj
- java常见错误及解决方法
- 关键字volatile
- 关于开发人员申请苹果账号相关事宜
- Python爬虫3
- android-ndk开发helloworld
- 深入JavaScript(7)S.O.L.I.D五大原则之开闭原则OCP
- 用OC语言完成简易通讯录(实现增删改查)功能.
- HDU 1394 Minimum Inversion Number
- UVA 694 The Collatz Sequence
- 深入JavaScript(8)S.O.L.I.D五大原则之里氏替换原则LSP
- C++中this指针的本质
- 引跑科技助力传统企业构建大数据价值体系