程序博客网 > 软件著作权申请表范本

正则表达式运用之小爬虫

来源：互联网发布：软件著作权申请表范本编辑：程序博客网时间：2024/06/06 09:09

获取某网站上的gif图片

# -*- coding:utf-8 -*-#小爬虫import reimport urllibdef getHtml(url):#该函数获取网页的html代码    page = urllib.urlopen(url) #创建该网页的对象    html = page.read() #读取网页的html源代码    return html #返回源代码def getImag(html):#该函数爬取图片    reg = r'src="(http.*?\.gif)"' #根据该网页中图片的地址规律编写正则表达式，把所有图片的地址过滤出来    imgre = re.compile(reg) #编译生成对象，方便使用    imglist = re.findall(imgre,html) #调用imgre获取所有图片的地址    #print imglist    x = 0    for imgurl in imglist: #依次根据列表里的每一个地址下载图片，并以gif的后缀保存        urllib.urlretrieve(imgurl,'%s.gif' % x)        x += 1html = getHtml("http://www.hanzhong123.com/forum/thread-10208862-1-1.html")getImag(html) #文件保存在该执行文件的同一目录下

结果：

0 0

软件著作权申请表范本

软件著作权申请表范本

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子打算盘的口诀三年级英语口诀拼魔方的口诀五笔打字口诀表二年级成法口诀 234的乘法口诀加法进位口诀表化合价的口诀法的分类口诀在再区分口诀电脑二十六键口诀天干地支背诵口诀三阶魔方简易口诀摩斯密码背诵口诀三阶魔方公式口诀图解象棋基本杀法口诀把脉入门必背口诀电工配线必背口诀 26个字母背诵口诀熟记电脑键盘口诀指心算加减法口诀珠心算加减法口诀史丰收速算法口诀 10以内加减法口诀表怎么背小学数学心算口诀完形填空解题口诀硬笔书法教程口诀变一般疑问句口诀高中化学沉淀口诀一般疑问句的口诀三阶魔方复原口诀 100以内质数表口诀高中历史背诵口诀运算符优先级口诀二十四节气背诵口诀象棋24种基本杀法口诀科目三灯光考试口诀如何写好毛笔字口诀五线谱快速记忆法口诀二十以内加减法口诀表 10以内的加减法口诀