使用python批量爬取apk文件

来源:互联网 发布:sql复制表结构 编辑:程序博客网 时间:2024/05/24 06:43
学习python期间,自己写的一个小的爬虫文件,从360应用市场下载接近两千个app,代码放在github里
# -*- coding: utf-8 -*-"""Created on Fri May 12 11:30:11 2017@author: GXW"""import reimport urllibimport os#response=urllib.urlopen('http://zhushou.360.cn/list/index/cid/1?page=1')#html=response.read()#link_list=re.findall(r"(?<=&url=).*?apk",html)#for url in link_list: #    print urlclass testClass:    def __init__(self):        self.urllist=[]        self.k=111        self.baseurl='http://zhushou.360.cn/list/index/cid/1?page='    def geturl(self,pageindex):        for i in range(1,pageindex+1):            self.urllist.append(self.baseurl+str(i))    def spider(self):        for i in range(len(self.urllist)):            response=urllib.urlopen(self.urllist[0])            html=response.read()            link_list=re.findall(r"(?<=&url=).*?apk",html)            for url in link_list:                file_name="%d.apk"%(self.k)                self.k=self.k+1                file_path=os.path.join("F:\\APK",file_name)                urllib.urlretrieve(url,file_path)            del self.urllist[0]            print i    def start(self):        self.geturl(50)        self.spider()        a=testClass()a.start()

0 0
原创粉丝点击