python 实现网站图片抓取小爬虫
来源:互联网 发布:ios uitableview优化 编辑:程序博客网 时间:2024/04/28 15:34
初学python,自己实现的一个抓取网站图片的小爬虫。
import reimport urllib.requestdef getResouce(url): source = urllib.request.urlopen(url).read() return source#从源代码中匹配正则表达式,提取urldef getimg(source): #正则表达式 reg = r'src="(.*?\.jpg)" width' #生成正则表达式对象 regcompile = re.compile(reg) #匹配正则表达式,获取url 主要网页的编码方式 utf-8 、gb2312等 #urls = regcompile.findall(source.decode('gb2312')) urls = regcompile.findall(source.decode('utf-8')) return urlsdef download(urls): num = input("picture编号:(a-)") number =1 for url in urls[1:]: #下载数据,并写入文件,利用urlretrieve urllib.request.urlretrieve(url,'E:/picture/litter_picture/%s%s.jpg'% (num,number)) number +=1def downloadbyurllib(url): #获取源代码 source = getResouce(url) #获取urls urls = getimg(source) #下载数据 download(urls) print("finish the download!")if __name__ == '__main__': downloadbyurllib("http://www.kutoo8.com/pc/8.html")
0 0
- python 实现网站图片抓取小爬虫
- python小爬虫—抓取pixabay网站的图片资源
- 【Python】爬虫入门--抓取网站图片
- 爬虫:实现网站的全部图片抓取
- python实现简单爬虫抓取图片
- python爬虫抓取图片
- <四>、python爬虫抓取购物网站商品信息--图片价格名称
- Python爬虫之从网站图片中抓取文字
- 第一个python程序,小爬虫--抓取网页图片
- python网络爬虫抓取图片
- Python爬虫抓取网页图片
- python 网络爬虫抓取图片
- python网络爬虫抓取图片
- python网络爬虫抓取图片
- python爬虫 抓取图片入门
- Python爬虫抓取女演员图片
- python 爬虫抓取页面图片
- python网络爬虫抓取图片
- 数组与ArrayList的关系与区别
- 欢迎使用CSDN-markdown编辑器
- Mysql创建及删除用户命令
- 双边滤波
- 16 观察者模式
- python 实现网站图片抓取小爬虫
- thinkphp+js生成曲线图
- uiview边框圆角阴影
- 多线程断点下载器
- 大话设计模式之简单工厂模式
- 郑爽杨幂领衔影视剧中10大旺夫专业户
- JAVA 反射 总结 之 初级 (二)
- Ural 1017 Staircases
- Android学习笔记__1__Android体系架构