Python 实现简单的爬虫功能: 图片的抓取
来源:互联网 发布:python arff 读取 编辑:程序博客网 时间:2024/05/22 06:53
#!/usr/python3import urllib.request # 导入urllib中的request类import re # 导入 re 模块 主要包含了正则表达式def gethtml(url): page=urllib.request.urlopen(url) # 用于打开一个URL地址。 html=page.read() # 用于读取URL上的数据,向gethtml()函数传递一个网址,并把整个页面下载下来。执行程序就会把整个网页打印输出。 return htmldef getimg(html): reg = r'src="(.*?\.jpg)"'#抓取图片的正则表达式 img=re.compile(reg) #可以把正则表达式编译成一个正则表达式对象. html=html.decode('utf-8') #python3 imglist=re.findall(img,html) #方法读取html 中包含 imgre(正则表达式)的数据。 x = 0 for imgurl in imglist: urllib.request.urlretrieve(imgurl,'%s.jpg'%x) #这里的核心是用到了urllib.urlretrieve()方法,直接将远程数据下载到本地。 x = x+1 #通过一个for循环对获取的图片连接进行遍历,为了使图片的文件名看上去更规范,对其进行重命名,命名规则通过x变量加1。保存的位置默认为程序的存放目录。 #程序运行完成,将在目录下看到下载到本地的文件。html=gethtml("https://tieba.baidu.com/p/5385194399")print(getimg(html))
阅读全文
1 0
- Python 实现简单的爬虫功能: 图片的抓取
- 简单的python爬虫抓取图片实例
- python实现简单爬虫抓取图片
- Python 实现简单的网络抓取图片
- 用python实现的一个抓取图片的爬虫
- python如何实现简单的爬虫功能
- Python实现抓取页面上链接的简单爬虫分享
- Python实现抓取页面上链接的简单爬虫分
- Python实现一个简单的图片爬虫
- 爬虫:实现网站的全部图片抓取
- Python实现简单爬虫功能--批量下载百度贴吧里的图片
- Python 实现简单的爬虫功能并保存到本地
- Selenium + PhantomJS + python 简单实现爬虫的功能
- python 实现网站图片抓取小爬虫
- [Java]中的HttpClient对象实现简单的爬虫,抓取妹子图片
- python爬虫抓取图片
- Python实现简单的爬虫
- Python实现简单的爬虫
- ScrollRectHelper
- ios和安卓的input的click事件和change事件的加载顺序问题。
- RabbitMQ基础概念详细介绍
- Alpha-beta剪枝算法
- Ubuntu下连接shanxun校园网
- Python 实现简单的爬虫功能: 图片的抓取
- 启动文件
- 如何使用中文维基百科语料
- 设计模式六大原则
- IPSec VPN工作原理
- python两个 list 获取交集,并集,差集的方法.
- Spring Boot 简介
- Velocity初探小结--Velocity在spring中的配置和使用
- Android开发之ConstraintLayout布局