python实现的入门级别死爬虫

来源:互联网 发布:淘宝限时抢购 编辑:程序博客网 时间:2024/06/05 03:00


学习使我快乐。

这几天学了python基本语法,网易云+慕课网,总之就是挑着不要钱的上2333

渣渣做了一个死爬虫,下载某网页上的图片。

炮姐曾经说过:

正面上我啊图片


所以就去了百度贴吧搞点事情,至少不用担心以后头像不够换了不是吗?


截图1

import reimport urllibimport urllib.requestdef gethtml(url):                    #获取网页源代码    web = urllib.request.urlopen(url)    html = web.read()    return htmldef getpng(html):    reg = r'src="(https://imgsa.baidu.com/forum/w%3D580/.*?\.jpg)'   #正则表达式    re1 = re.compile(reg,re.I)    x = 1    imglist = re1.findall(html)    for imgurl in imglist:        urllib.request.urlretrieve(imgurl,'%s.png' %x)     #默认保存路径在程序所在位置        x += 1    return imglistwebsite = 'https://tieba.baidu.com/p/4595130275?pn=5'      #这是第5页的图片html = str(gethtml(str(website)))getpng(html)