python抓取页面数据实例

来源：互联网发布：linux恢复rm删除文件夹编辑：程序博客网时间：2024/05/16 05:09

抓取文章数据保存在本地

#coding=utf-8import urllibimport redef getHtml(url):    page = urllib.urlopen(url)    html = page.read()    return htmldef getImg(html):    reg = r'src="(.+?\.jpg)" pic_ext'    imgre = re.compile(reg)    imglist = re.findall(imgre,html)    x = 0    for imgurl in imglist:        urllib.urlretrieve(imgurl,'%s.jpg' % x)        x+=1html = getHtml("http://www.chtml.cn/")#这里可以直接保存到数据库中，作为测试这里打印给大家看print getImg(html)

0 0

python抓取页面数据实例
Python爬虫----实例：抓取百度百科Python词条相关1000个页面数据
python webkit 异步抓取页面数据
python webkit 异步抓取页面数据
python使用spynner抓取动态页面数据
Python使用pyquery抓取数据实例
python 页面信息抓取
Python抓取页面
Python 抓取页面
php 抓取页面数据
html页面数据抓取
Python爬虫实例2-多线程爬虫抓取糗事百科数据
Java HTML页面抓取实例
python抓取数据例子
python抓取数据步骤
Python Scrapy抓取数据
python数据抓取
python 抓取网页数据
请解释一下CRC是什么意思？并说明其应用场合？根据下面的描述完成CRC16的C代码。
Julia曲线绘制-——CPU版本与GPU版本对比
android OS系统如何适配蓝牙遥控器
分析命令行参数 (getopt函数)
WebView中实现文件下载功能
python抓取页面数据实例
151.Best Time to Buy and Sell Stock III-买卖股票的最佳时机 III（中等题）
怎么把pdf转换成ppt直接进行编辑
android仿微博@人话题可点击
NPOI导出EXcel合并单元格问题
Fusioncharts ---多折线图，多柱形图(2D)
Linux环境中安装JDK
百度地图4.0多个经纬度展示在地图上
安卓APP流量测试小结