Python第一个爬虫(爬取贴吧图片)
来源:互联网 发布:app 数据分析工具 编辑:程序博客网 时间:2024/04/28 19:10
Python第一个爬虫(爬取贴吧图片)
1.导入的包
# coding:utf-8import urllib2,urllibimport re
2.使用urllib2打开页面读取数据
def getHtml(url):page = urllib2.urlopen(url)html = page.read()return html
3.使用正则表达式,解析数据,获取想要的数据
def getImg(html):reg = r'murl":"(.+?)"'imgre = re.compile(reg)imgList = re.findall(imgre,html)x=0;for imgUrl in imgList:print imgUrlurllib.urlretrieve(imgUrl,'C:\Users\xxx\Desktop\ss\%s.jpg'%x)//调用方法下载图片x+=1
4.调用方法,爬取贴吧的图片
html = getHtml("http://tieba.baidu.com/photo/g/bw/picture/list?kw=%E5%9B%BE%E7%89%87&alt=jview&rn=200&tid=1433290786&pn=1&ps=1&pe=40&info=1&_=1506576344661&red_tag=b1600243292")getImg(html)
##运行截图
##结果截图
结束
阅读全文
0 0
- Python第一个爬虫(爬取贴吧图片)
- Python爬虫学习:我的第一个爬虫—爬取贴吧感兴趣帖子的图片(大家都懂,哈哈)
- python第一个爬虫
- 第一个Python爬虫
- 第一个python爬虫
- 第一个python爬虫
- 第一个python爬虫
- Python--第一个爬虫
- 纪念我的第一个Python爬虫——图片
- 第一个python程序,小爬虫--抓取网页图片
- [python] 第一个爬虫, 爬妹子写真集图片
- python网络爬虫-第一个网络爬虫
- 【Python爬虫】编写第一个爬虫
- [Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程
- [Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程
- [Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程
- [Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程
- [Python]网络爬虫(12):爬虫框架Scrapy的第一个爬虫示例入门教程
- 词向量源码解析:(5.9)ngram2vec源码解析之word2vecf.py
- VPN篇(5.6) 04. 删除向导建立的IPsec VPN ❀ 飞塔 (Fortinet) 防火墙
- 弹框水平垂直居中
- C,C++,C#,Java?这些有什么区别?
- java基于feemarker 生成word文档
- Python第一个爬虫(爬取贴吧图片)
- 词向量源码解析:(5.10)ngram2vec源码解析之glovef.py
- 图像alt属性的应用对搜索引擎的重要性
- HDU 4366 树上分块
- ES6(一)
- stm32-串口使用IDLE中断接受不定长数据方法
- 词向量源码解析:(5.11)ngram2vec源码解析之中文analogy数据集
- angularJS 使HTML解释JS字符串中的标签。
- JavaScript 函数调用时带括号和不带括号的区别