Python实现一个简易的网页抓取程序

来源：互联网发布：网络yy骗小钱编辑：程序博客网时间：2024/05/20 17:40

#coding=utf-8import urllibimport redef getHtml(url):    page = urllib.urlopen(url)    html = page.read()    return htmldef getImg(html):    reg = r'src="(.+?\.jpg)" pic_ext'    imgre = re.compile(reg)    imglist = re.findall(imgre,html)    x = 0    for imgurl in imglist:        urllib.urlretrieve(imgurl,'%s.jpg' % x)        x+=1html = getHtml("http://tieba.baidu.com/p/2460150866")print getImg(html)

0 0

Python实现一个简易的网页抓取程序
一个极其简洁的Python网页抓取程序，自动从雅虎财经抓取股票数据
抓取网页文件中的email地址的简易java程序
一个抓取网页解析内容的程序。
python抓取网页的一个小例子
一个简易的网页抽奖程序
Python学习笔记-简易抓取网页-1
Python学习笔记-简易抓取网页-2
一个简单的使用python抓取网页中的水文数据的程序
简易python web抓取小程序
python多线程实现抓取网页
一个简单的基于java的网页抓取程序
简易聊天程序的python实现
实现一个简易的Python版CountDownLatch
(网页抓取)一个用PHP实现的网页抓取的实例
Jsoup抓取网页数据完成一个简易的Android新闻APP
Jsoup抓取网页数据完成一个简易的Android新闻APP
网页防抓取的一个思路以及实现
Linux下ln链接命令详解
maven之安装包到本地
语言兼容
树莓派linux内核编译与固件升级
OpenLayers：创建地图对比窗口（双地图对比）
Python实现一个简易的网页抓取程序
三、分治算法策略
excel导入导出需要的jar包---maven
应用程序编译进安桌系统
vs2010 中 qt窗口的提升
ubuntu apt-get 下载软件ERROR的问题
Cocos2D-x 入门(1)
uva_10201 adventure_in_moving dp
Android 通过Base64上传图片到服务器