python简单的爬虫程序
来源:互联网 发布:python bt文件下载 编辑:程序博客网 时间:2024/05/17 09:20
代码:
#coding = utf-8import urllibimport re#读取网站html内容def getHtml(url): page = urllib.urlopen(url) html = page.read() return html#找到图片并下载到指定文件夹def getImg(html): reg = 'src="(.+?\.jpg)" alt=' #图片的正则表达式 imgre = re.compile(reg) #编译正则表达式模式,返回一个对象的模式。 imglist = re.findall(imgre, html) #re.findall遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表。 x = 0 for imgurl in imglist: name = imgurl[45:] content = urllib.urlopen(imgurl).read() open(r'image/' + name,'w+').write(content) #下载图片到指定文件夹image x+=1 return imglisthtml = getHtml("http://www.ivsky.com/")print getImg(html)def getHtml(url): page = urllib.urlopen(url) html = page.read() return htmldef getImg(html): reg = 'src="(.+?\.jpg)" alt=' imgre = re.compile(reg) imglist = re.findall(imgre, html) x = 0 for imgurl in imglist: name = imgurl[45:] content = urllib.urlopen(imgurl).read() open(r'image/' + name,'w+').write(content) x+=1 return imglisthtml = getHtml("http://www.ivsky.com/")print getImg(html)
阅读全文
0 0
- 简单的Python爬虫程序
- python简单的爬虫程序
- python简单爬虫程序
- 一个简单的python爬虫程序
- python编写的简单爬虫程序
- 一个简单的python爬虫程序
- 简单的Python网络爬虫程序
- 简单的Python爬虫刷访问量程序
- 一个简单的python爬虫程序
- 爬虫程序的简单介绍(Python)
- python简单网络爬虫程序
- 简单的爬虫程序
- Python简单的爬虫
- 简单的python爬虫
- 简单的Python 爬虫
- Python的爬虫程序
- 用 python 做简单的网页爬虫程序
- Python写的网络爬虫程序(很简单)
- [Python高效编程]
- KVM-Qemu-Libvirt三者之间的关系
- python 读取txt出现\xef\xbb\xbf…的问题
- 嵌入式Linux驱动笔记(十八)------浅析V4L2框架之ioctl
- Fatal signal 11 (SIGSEGV), code 2调试方法
- python简单的爬虫程序
- hibernate框架一对多级联删除例子(十三)
- 0、slam基础
- Matlab2017a安装教程及语言设置
- Vue.js组件——标签页组件
- gem5跑linux或安卓bench
- 如何成为一名全栈语音识别工程师?
- 模板的类型萃取
- Sublime Text2 多行编辑快捷键