python爬虫爬取涂鸦吧照片

来源:互联网 发布:广东粤数大数据 编辑:程序博客网 时间:2024/04/25 07:10

importre
importurllib

defgetHtml(url):
    page=urllib.urlopen(url)
    html=page.read()
    returnhtml

      #获取源代码
defgetImg(html):
    reg=r'src="(.*?\.jpg)"'#正则表达式
    
# print reg
    
imgre =re.compile(reg)
    # print imgre
    
imglist=re.findall(imgre,html)
    # print imglist
    
x=0
    forimgurl inimglist:
        printimgurl
        urllib.urlretrieve(imgurl,'%s.jpg'% x)
        x+=1 #给下载的图片取名字
html= getHtml("http://tieba.baidu.com/p/4469078009")
printgetImg(html)

0 0