Django实现下载文件功能

来源:互联网 发布:java支付系统开发 编辑:程序博客网 时间:2024/06/06 00:49

一、简单介绍文件下载

最简单的文件下载功能的实现

  1. 将文件流放入HttpResponse对象即可,如:

代码块

def file_download(request):    # do something...    with open('file_name.txt') as f:        c = f.read()    return HttpResponse(c)

这种方式简单粗暴,适合小文件的下载,但如果这个文件非常大,这种方式会占用大量的内存,甚至导致服务器崩溃

更合理的文件下载功能

Django的HttpResponse对象允许将迭代器作为传入参数,将上面代码中的传入参数c换成一个迭代器,便可以将上述下载功能优化为对大小文件均适合;而Django更进一步,推荐使用 StreamingHttpResponse对象取代HttpResponse对象,StreamingHttpResponse对象用于将文件流发送给浏览器,与HttpResponse对象非常相似,对于文件下载功能,使用StreamingHttpResponse对象更合理。
因此,更加合理的文件下载功能,应该先写一个迭代器,用于处理文件,然后将这个迭代器作为参数传递给StreaminghttpResponse对象

HttpResponse会直接使用迭代器对象,将迭代器对象的内容存储城字符串,然后返回给客户端,同时释放内存。可以当文件变大看出这是一个非常耗费时间和内存的过程。
StreamingHttpResponse这是一种非常省时省内存的方法。但是因为StreamingHttpResponse的文件传输过程持续在整个response的过程中,所以这有可能会降低服务器的性能。
如:

代码块

from django.http import StreamingHttpResponse def file_download(request):    def file_iterator(file_name, chunk_size=512):        with open(file_name) as f:            while True:                c = f.read(chunk_size)                if c:                    yield c                else:                    break    the_file_name = "file_name.txt"    response = StreamingHttpResponse(file_iterator(the_file_name))    return response

文件下载功能再次优化

上述的代码,已经完成了将服务器上的文件,通过文件流传输到浏览器,但文件流通常会以乱码形式显示到浏览器中,而非下载到硬盘上,因此,还要在做点优化,让文件流写入硬盘。优化很简单,给StreamingHttpResponse对象的Content-Type和Content-Disposition字段赋下面的值即可,如:

response['Content-Type'] = 'application/octet-stream'response['Content-Disposition'] = 'attachment;filename="test.pdf"

完整代码如下:

def file_download(request):    def file_iterator(file_name, chunk_size=512):        with open(file_name) as f:            while True:                c = f.read(chunk_size)                if c:                    yield c                else:                    break    the_file_name = "file_name.txt"    response = StreamingHttpResponse(file_iterator(the_file_name))    response['Content-Type'] = 'application/octet-stream'    response['Content-Disposition'] = 'attachment;filename="{0}"'.format(the_file_name)    return response

二、具体导出文件格式

导出Excel表格

1. 首先是直接导出Excel表格

首先获取要导出的数据、以列表方式保存。
然后将数据写入到Excel,以流的方式返回到页面下载。关于ByteIO/StringIO流的操作参考廖雪峰官方网站

import xlwtimport ioimport jsonfrom django.http import HttpResponsedef set_style(name, height, bold=False):    style = xlwt.XFStyle()  # 初始化样式    font = xlwt.Font()  # 为样式创建字体    font.name = name  # 'Times New Roman'    font.bold = bold    font.color_index = 000    font.height = height    style.font = font    # 设置单元格边框    # borders= xlwt.Borders()    # borders.left= 6    # borders.right= 6    # borders.top= 6    # borders.bottom= 6    # style.borders = borders    # 设置单元格背景颜色    # pattern = xlwt.Pattern()    # 设置其模式为实型    # pattern.pattern = pattern.SOLID_PATTERN    # 设置单元格背景颜色    # pattern.pattern_fore_colour = 0x00    # style.pattern = pattern    return styledef write_excel(data, name, header):    # 打开一个Excel工作簿    file = xlwt.Workbook()    # 新建一个sheet,如果对一个单元格重复操作,会引发异常,所以加上参数cell_overwrite_ok=True    table = file.add_sheet(name, cell_overwrite_ok=True)    if data is None:        return file    # 写标题栏    row0 = [u'业务', u'状态', u'北京', u'上海', u'广州', u'深圳', u'状态小计']    for i in range(0, len(row0)):        table.write_merge(0, 0, i, i,  row0[i], set_style('Times New Roman', 220, True))    table.write_merge(0, 2, 7, 9, "单元格合并", set_style('Times New Roman', 220, True))    """    table.write_merge(x, x + m, y, w + n, string, sytle)x表示行,y表示列,m表示跨行个数,n表示跨列个数,string表示要写入的单元格内容,style表示单元格样式。其中,x,y,w,h,都是以0开始计算的。    """    l = 0    n = len(header)    # 写入数据    for line in data:        for i in range(n):            table.write(l, i, line[header[i]])        l += 1    # 直接保存文件    # file.save("D:/excel_name.xls")    # 写入IO    res = get_excel_stream(file)    # 设置HttpResponse的类型    response = HttpResponse(content_type='application/vnd.ms-excel')    from urllib import parse    response['Content-Disposition'] = 'attachment;filename=' + parse.quote("excel_name") + '.xls'    # 将文件流写入到response返回    response.write(res)    return responsedef get_excel_stream(file):    # StringIO操作的只能是str,如果要操作二进制数据,就需要使用BytesIO。    excel_stream = io.BytesIO()    # 这点很重要,传给save函数的不是保存文件名,而是一个BytesIO流(在内存中读写)    file.save(excel_stream)    # getvalue方法用于获得写入后的byte将结果返回给re    res = excel_stream.getvalue()    excel_stream.close()    return res

2. 导出json文件

导出json文件不像Excel那么麻烦,只需要拼接json格式数据即可,直接导出到本地还是很简单,但是导出到网页,怎么像导出excel一样不保存到本地,直接将流返回?

def write_json(data):    try:        json_stream = get_json_stream(data)        response = HttpResponse(content_type='application/json')        from urllib import parse        response['Content-Disposition'] = 'attachment;filename=' + parse.quote("test") + '.json'        response.write(json_stream)        return response    except Exception as e:        print(e)def get_json_stream(data):    # 开始这里我用ByteIO流总是出错,但是后来参考廖雪峰网站用StringIO就没问题    file = io.StringIO()    data = json.dumps(data)    file.write(data)    res = file.getvalue()    file.close()    return res
  • 3. 导出压缩包

由于导出两个文件无法同时都返回,所以考虑将这两个文件放入包中,然后将包以流的方式返回。
思考?此时导出的是zip包中,我怎么将这两个文件流写入zip中,好像有点不太合理。后来在老大指导下先将要打包的文件保存到本地,打包到zip后,将本地的文件删除,随后将该zip文件流读取,写入到response,返回zip文件流。

def write_zip(e_data, j_data, export_name):    try:        # 保存到本地文件        # 返回文件名,注意此时保存的方法和前面导出保存的json、excel文件区别        j_name = write_json(j_data, export_name[1])        e_name = write_excel(e_data, export_name[1])        # 本地文件写入zip,重命名,然后删除本地临时文件        z_name='export.zip'        z_file = zipfile.ZipFile(z_name, 'w')        z_file.write(j_name)        z_file.write(e_name)        os.remove(j_name)        os.remove(e_name)        z_file.close()        # 再次读取zip文件,将文件流返回,但是此时打开方式要以二进制方式打开        z_file = open(z_name, 'rb')        data = z_file.read()        z_file.close()        os.remove(z_file.name)        response = HttpResponse(data, content_type='application/zip')        from urllib import parse        response['Content-Disposition'] = 'attachment;filename=' + parse.quote(z_name)        return response    except Exception as e:        logging.error(e)        print(e)
原创粉丝点击