程序博客网 > ios uitableview优化

python 实现网站图片抓取小爬虫

来源：互联网发布：ios uitableview优化编辑：程序博客网时间：2024/04/28 15:34

初学python，自己实现的一个抓取网站图片的小爬虫。

import reimport urllib.requestdef getResouce(url):    source = urllib.request.urlopen(url).read()    return source#从源代码中匹配正则表达式，提取urldef getimg(source):    #正则表达式    reg = r'src="(.*?\.jpg)" width'    #生成正则表达式对象    regcompile = re.compile(reg)    #匹配正则表达式，获取url 主要网页的编码方式 utf-8 、gb2312等    #urls = regcompile.findall(source.decode('gb2312'))    urls = regcompile.findall(source.decode('utf-8'))    return urlsdef download(urls):    num = input("picture编号：（a-）")    number =1    for url in urls[1:]:        #下载数据，并写入文件，利用urlretrieve        urllib.request.urlretrieve(url,'E:/picture/litter_picture/%s%s.jpg'% (num,number))        number +=1def downloadbyurllib(url):    #获取源代码    source = getResouce(url)    #获取urls    urls = getimg(source)    #下载数据    download(urls)    print("finish the download!")if __name__ == '__main__':    downloadbyurllib("http://www.kutoo8.com/pc/8.html")

0 0

ios uitableview优化

ios uitableview优化

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子微电子科学与工程就业前景信息对抗技术就业前景建筑装饰工程技术就业前景汽车制造与装配技术就业前景市政工程技术就业前景控制科学与工程就业前景能源化学工程就业前景化学工程就业前景应用电子技术就业前景种子科学与工程就业前景光学工程就业前景应用化学就业前景电气工程就业前景环境工程就业前景旅游管理专业就业前景汽车运用技术就业前景旅游管理就业前景电子信息工程技术就业前景化学工程与工艺就业前景生物技术专业就业方向新能源科学与工程就业前景园林工程技术就业前景自动化专业就业前景移动通信技术就业前景电子信息类就业前景应用化工技术就业前景电子封装技术就业前景铁道工程技术就业前景电子工程就业前景嵌入式系统就业前景数字媒体技术就业前景集成电路工程就业前景光电信息工程就业前景建筑工程就业前景自动化就业前景水利工程就业前景机械制造与自动化就业方向工程监理就业前景环境生态工程就业前景华南理工大学材料学考研新罕布什尔大学新生申请材料