简单的爬取网页图片
来源:互联网 发布:淘宝套餐链接转手机端 编辑:程序博客网 时间:2024/06/04 23:20
import reimport urllib.request# ------ 获取网页源代码的方法 ---def getHtml(url): page = urllib.request.urlopen(url) html = page.read() return html# ------ getHtml()内输入任意帖子的URL ------html = getHtml("http://tieba.baidu.com/p/3205263090")# ------ 修改html对象内的字符编码为UTF-8 ------html = html.decode('UTF-8')# ------ 获取帖子内所有图片地址的方法 ------def getImg(html): # ------ 利用正则表达式匹配网页内容找到图片地址 ------ reg = r'src="([.*\S]*\.jpg)" pic_ext="jpeg"' imgre = re.compile(reg); imglist = re.findall(imgre, html) return imglistimgList = getImg(html)imgName = 0for imgPath in imgList: # ------ 这里最好使用异常处理及多线程编程方式 ------ f = open("F:/pic/"+str(imgName)+".jpg", 'wb') f.write((urllib.request.urlopen(imgPath)).read()) f.close() imgName += 1print("All Done!")
阅读全文
0 0
- 简单的爬取网页图片
- 一个简单的网络爬虫---爬取网页中的图片
- 利用python对网页和图片的简单爬取
- 简单的实现爬虫爬取网页文本和图片
- 制作一个简单的网页爬虫爬取一张网页的特定图片
- 图片的简单爬取
- 爬取网页图片
- 爬取网页图片
- Python爬取一个网页的图片
- Python爬取一个网页的图片
- python webdriver简单实例:爬取网页图片
- Python爬虫实战(三):简单爬取网页图片
- python3爬虫爬取网页图片简单示例
- 【Python3.6爬虫学习记录】(一)爬取简单的静态网页图片
- 简单爬取图片
- python爬取网页图片
- python爬取网页图片
- Python爬取网页图片
- 2017 ACM/ICPC Asia Regional Shenyang Online
- 线性表的Java实现
- 从零开始学_JavaScript_系列(66)——AMD、CMD、CommonJS
- C++基础学习笔记:运算符重载
- java内存分析
- 简单的爬取网页图片
- Java基础方面面试总结
- kinect v2.0原理介绍之十一:录制视频
- Mfc插入第三方ActiveX控件报错ASSERT(m_pCtrlSite != NULL); // not an OLE control (not yet, at least)
- 设置图片加载错误或期间加载的图片
- 35 个 Java 代码性能优化总结
- sql语句查询一对一,一对多,多对多
- Java1.8环境变量配置(WIN7)
- TensorFlow教程之完整教程 2.7 字词的向量表示