爬虫

来源:互联网 发布:一生只爱你南风知意txt 编辑:程序博客网 时间:2024/04/28 03:24
import re
import urllib
def getHtml(url):
page=urllib.urlopen(url)
html=page.read()
return html


def getImg(html):
reg=r'src="(.*?\.jpg)"'
imgre=re.compile(reg)
imglist=re.findall(imgre,html)
x=0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' % x)
x+=1


html=getHtml("http://tieba.baidu.com/p/2970106602")


print getImg(html)
0 0
原创粉丝点击