python解压压缩包的几种方法
来源:互联网 发布:java语言开发 编辑:程序博客网 时间:2024/06/05 06:52
这里讨论使用Python解压例如以下五种压缩文件:
.gz .tar .tgz .zip .rar
简单介绍
gz: 即gzip。通常仅仅能压缩一个文件。与tar结合起来就能够实现先打包,再压缩。
tar: linux系统下的打包工具。仅仅打包。不压缩
tgz:即tar.gz。先用tar打包,然后再用gz压缩得到的文件
zip: 不同于gzip。尽管使用相似的算法,能够打包压缩多个文件。只是分别压缩文件。压缩率低于tar。
rar:打包压缩文件。最初用于DOS,基于window操作系统。
压缩率比zip高,但速度慢。随机訪问的速度也慢。
关于zip于rar之间的各种比較。可见:
http://www.comicer.com/stronghorse/water/software/ziprar.htm
gz
因为gz一般仅仅压缩一个文件,全部常与其它打包工具一起工作。比方能够先用tar打包为XXX.tar,然后在压缩为XXX.tar.gz
解压gz,事实上就是读出当中的单一文件,Python方法例如以下:
import gzipimport osdef un_gz(file_name): """ungz zip file""" f_name = file_name.replace(".gz", "") #获取文件的名称,去掉 g_file = gzip.GzipFile(file_name) #创建gzip对象 open(f_name, "w+").write(g_file.read()) #gzip对象用read()打开后,写入open()建立的文件里。 g_file.close() #关闭gzip对象
tar
XXX.tar.gz解压后得到XXX.tar,还要进一步解压出来。
*注:tgz与tar.gz是同样的格式,老版本号DOS扩展名最多三个字符,故用tgz表示。
因为这里有多个文件,我们先读取全部文件名称。然后解压。例如以下:
import tarfiledef un_tar(file_name): untar zip file""" tar = tarfile.open(file_name) names = tar.getnames() if os.path.isdir(file_name + "_files"): pass else: os.mkdir(file_name + "_files") #因为解压后是很多文件,预先建立同名目录 for name in names: tar.extract(name, file_name + "_files/") tar.close()
*注:tgz文件与tar文件同样的解压方法。
zip
与tar类似,先读取多个文件名称,然后解压。例如以下:
import zipfiledef un_zip(file_name): """unzip zip file""" zip_file = zipfile.ZipFile(file_name) if os.path.isdir(file_name + "_files"): pass else: os.mkdir(file_name + "_files") for names in zip_file.namelist(): zip_file.extract(names,file_name + "_files/") zip_file.close()
rar
由于rar通常为window下使用,须要额外的Python包rarfile。
可用地址: http://sourceforge.net/projects/rarfile.berlios/files/rarfile-2.4.tar.gz/download
解压到Python安装文件夹的/Scripts/文件夹下,在当前窗体打开命令行,
输入Python setup.py install
安装完毕。
import rarfileimport osdef un_rar(file_name): """unrar zip file""" rar = rarfile.RarFile(file_name) if os.path.isdir(file_name + "_files"): pass else: os.mkdir(file_name + "_files") os.chdir(file_name + "_files"): rar.extractall() rar.close()
- #!/usr/bin/env /usr/local/bin/python
- # encoding: utf-8
- import tarfile
- import os
- import time
- start = time.time()
- tar=tarfile.open('/path/to/your.tar,'w')
- for root,dir,files in os.walk('/path/to/dir/'):
- for file in files:
- fullpath=os.path.join(root,file)
- tar.add(fullpath,arcname=file)
- tar.close()
- print time.time()-start
- #!/usr/bin/env /usr/local/bin/python
- # encoding: utf-8
- import tarfile
- import time
- start = time.time()
- t = tarfile.open("/path/to/your.tar", "r:")
- t.extractall(path = '/path/to/extractdir/')
- t.close()
- print time.time()-start
- tar = tarfile.open(filename, 'r:gz')
- for tar_info in tar:
- file = tar.extractfile(tar_info)
- do_something_with(file)
- python解压压缩包的几种方法
- python解压压缩包的几种方法
- python解压压缩包的几种方法
- Python 解压压缩包
- Linux常用的几种文件压缩解压方法
- 分包压缩包的解压方法
- 关于几种语言(c#,php,python,javascript)字符串的gzip压缩与解压的整理
- 关于几种语言(c#,php,python,javascript)字符串的gzip压缩与解压的整理
- linux下的rar包的压缩解压方法
- CentOS下7zip包的解压、压缩方法
- linux各类压缩包的解压方法,留着备用
- Linux下常见压缩包的解压方法
- Linux下解压,压缩JAR包的方法
- Linux下解压,压缩JAR包的方法
- linux下解压不同压缩包的方法
- Linux下常见压缩包的解压方法
- jar包的解压、压缩
- python中的压缩、解压包tarfile
- String类的实现(深拷贝or浅拷贝)
- CTF线下攻防赛总结
- NoSQL资料汇集
- 进程IPC---共享内存
- Spring Cloud学习--容错机制(Hystrix DashBoard之数据监控)
- python解压压缩包的几种方法
- MongoDB&C++开发(五)C++ Driver API 主要类及成员函数
- Linux安装jdk遇到的问题
- 十六、图像识别领域近期进展 & 其他深度模型介绍
- 1042. 字符统计(20)
- 【UVA 712 S-Tree】& 二叉树
- Teamwork Gym
- 3.2 队列
- HDU5972 Regular Number (ShiftAnd算法+bitset)