使用python批量爬取apk文件
来源:互联网 发布:sql复制表结构 编辑:程序博客网 时间:2024/05/24 06:43
学习python期间,自己写的一个小的爬虫文件,从360应用市场下载接近两千个app,代码放在github里
# -*- coding: utf-8 -*-"""Created on Fri May 12 11:30:11 2017@author: GXW"""import reimport urllibimport os#response=urllib.urlopen('http://zhushou.360.cn/list/index/cid/1?page=1')#html=response.read()#link_list=re.findall(r"(?<=&url=).*?apk",html)#for url in link_list: # print urlclass testClass: def __init__(self): self.urllist=[] self.k=111 self.baseurl='http://zhushou.360.cn/list/index/cid/1?page=' def geturl(self,pageindex): for i in range(1,pageindex+1): self.urllist.append(self.baseurl+str(i)) def spider(self): for i in range(len(self.urllist)): response=urllib.urlopen(self.urllist[0]) html=response.read() link_list=re.findall(r"(?<=&url=).*?apk",html) for url in link_list: file_name="%d.apk"%(self.k) self.k=self.k+1 file_path=os.path.join("F:\\APK",file_name) urllib.urlretrieve(url,file_path) del self.urllist[0] print i def start(self): self.geturl(50) self.spider() a=testClass()a.start()
0 0
- 使用python批量爬取apk文件
- python爬虫实战 | 批量爬取开放服务器的文件
- Python爬取文件
- python+selenium批量爬取ieeexplore论文
- Python批量爬取第三方库(安装)(二进制.whl文件)
- 使用python批量修改文件的后缀
- 使用python递归批量重命名文件
- 使用Python批量重命名文件夹中的文件
- python 批量爬取博客数据(仅供学习)
- Python裸奔也疯狂:批量爬取中国工程院院士信息
- python easyicon同类型ico图片批量爬取
- 使用python爬取代理服务器
- Python:使用Kivy将python程序打包为apk文件
- Python:使用Kivy将python程序打包为apk文件
- python批量验证apk渠道包脚本
- python动态网页爬取——四六级成绩批量爬取
- python批量重命名文件
- 批量重命名文件 Python
- mysql字母数字混合排序
- map迭代方法
- 抽象类和普通类的区别
- 组合计数(容斥定理+卢卡斯定理的正确姿势)
- BZOJ 4809: 皇后 (n皇后问题)dfs搜索入门
- 使用python批量爬取apk文件
- JAVA的三大特性
- [leetcode]213. House Robber II
- java后台跳转带参数
- 2017 git的学习笔记之设置(忽略换行 权限)
- jquery取得多选checkbox选中的值
- Android中的快捷方式(本文只包含检查快捷方式的创建)
- NGUI之UIButton
- 51nod1220 约数之和