python实现的入门级别死爬虫

来源：互联网发布：淘宝限时抢购编辑：程序博客网时间：2024/06/05 03:00

学习使我快乐。

这几天学了python基本语法，网易云+慕课网，总之就是挑着不要钱的上2333

渣渣做了一个死爬虫，下载某网页上的图片。

炮姐曾经说过：

正面上我啊图片

所以就去了百度贴吧搞点事情，至少不用担心以后头像不够换了不是吗？

截图1

import reimport urllibimport urllib.requestdef gethtml(url):                    #获取网页源代码    web = urllib.request.urlopen(url)    html = web.read()    return htmldef getpng(html):    reg = r'src="(https://imgsa.baidu.com/forum/w%3D580/.*?\.jpg)'   #正则表达式    re1 = re.compile(reg,re.I)    x = 1    imglist = re1.findall(html)    for imgurl in imglist:        urllib.request.urlretrieve(imgurl,'%s.png' %x)     #默认保存路径在程序所在位置        x += 1    return imglistwebsite = 'https://tieba.baidu.com/p/4595130275?pn=5'      #这是第5页的图片html = str(gethtml(str(website)))getpng(html)

阅读全文

1 0