Pyhon 获取文件夹的大小统计

来源:互联网 发布:编写一个java应用程序 编辑:程序博客网 时间:2024/06/01 07:40

通过Python 实现文件夹大小的统计:主要是通过了 import os 中的几个方法来实现。

                                            --Zero

Python OS 文件/目录方法

首先介绍用到的几个函数,写了一个小demo便于理解。

 

os.getcwd()

返回当前路径。 

os.listdir (path)

返回当前路径下的文件夹与文件(不向下二级递归)。

os.path.join()

join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。

os.path 让join()识别为路径,根据系统自动补齐'\' '/'。

os.path.getsize(path)  返回文件大小

复制代码
 1 # -*- encoding: utf-8  -*_ 2 import os 3  4 path = os.getcwd() # 获取当前路径 5 for dirs in os.listdir(path): 6     print dirs 7  8 file_name = "路径补齐.txt" 9 path = os.path.join(path,file_name)10 print path11 size = os.path.getsize("E:\PythonEclipse\PythonStudy\os.listdir\listdirs.py")12 print size
复制代码

输出结果:

复制代码
1 A2 B3 C4 file.txt5 listdirs.py6 E:\PythonEclipse\PythonStudy\os.listdir\路径补齐.txtA
7 303
复制代码

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

top -- 根目录下的每一个文件夹(包含它自己), 产生3-元组 (dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名】。

topdown --可选,为True或者没有指定, 一个目录的的3-元组将比它的任何子文件夹的3-元组先产生 (目录自上而下)。如果topdown为 False, 一个目录的3-元组将比它的任何子文件夹的3-元组后产生 (目录自下而上)。

onerror -- 可选,是一个函数; 它调用时有一个参数, 一个OSError实例。报告这错误后,继续walk,或者抛出exception终止walk。

followlinks -- 设置为 true,则通过软链接访问目录。

复制代码
1 # -*- encoding: utf-8  -*_2 import os3 4 for root, dirs, filename in os.walk(os.getcwd()):5     print root6     print dirs7     print filename
复制代码

输出结果:

复制代码
 1 E:\PythonEclipse\PythonStudy\os.listdir 2 ['A', 'B', 'C'] 3 ['file.txt', 'listdirs.py'] 4 E:\PythonEclipse\PythonStudy\os.listdir\A 5 [] 6 [] 7 E:\PythonEclipse\PythonStudy\os.listdir\B 8 [] 9 ['file.txt']10 E:\PythonEclipse\PythonStudy\os.listdir\C11 []12 []
复制代码

功能实现思路:

需要获取文件夹的大小,只要遍历文件下所有的文件,获取所有文件大小求和即可。

这里是实现的是当前目录下,文件夹大小不包括当前文件下文件大小。

python的编码的格式,需要注意。

复制代码
 1 # -*- encoding: utf-8 -*- 2 import os 3 rootdir = os.getcwd()               #获取当前路径 4  5 rootdir = rootdir.decode('gbk') 6 x  = u'统计文件大小.csv' 7 f = open(os.path.join(rootdir,x), "w+") 8 for dirname in  os.listdir(rootdir):  #获取二级目录所有文件夹与文件 9     Dir = os.path.join(rootdir, dirname)    #路径补齐10     count = 011     if (os.path.isdir(Dir)):           #判断是否为目录12         for r, ds, files in os.walk(Dir): #遍历目录下所有文件根,目录下的每一个文件夹(包含它自己), 产生3-元组 (dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名称】13             for file in files:      #遍历所有文件14                 size = os.path.getsize(os.path.join(r, file)) #获取文件大小15                 count += size16         if ((count/1024.0/1024.0) < 1024):17             print  Dir +'\t' + '%.2f'% (count/1024.0/1024.0)+'MB'18             f.write(Dir.encode("gbk") +','+  '%.2f'% (count/1024.0/1024.0)+'MB' + '\n')19         else:20             print  Dir + '\t' + '%.2f' % (count / 1024.0 / 1024.0/1024.0) + 'GB'21             f.write(Dir.encode("gbk") + ',' + '%.2f' % (count / 1024.0 / 1024.0/1024.0) + 'GB' + '\n')22     else:23         continue24 f.close()
复制代码

转载自:http://www.cnblogs.com/Zero-blog/p/6464168.html