python分割大文件(源码)
来源:互联网 发布:审计 孟然 知乎 编辑:程序博客网 时间:2024/05/20 01:45
假设需要处理大文件,又不想依赖数据库,那么将文件分割也不失为一种解决方案。下面简单介绍将数据以月分割的python实现方法。
#引入依赖库
import pandas as pdimport datetimeimport os
def splitData(): user_pay_path = "../dataset/IJCAI-17/dataset/user_pay.txt" columnsName = ['user_id','shop_id','time_stamp'] startTime = '2015-07-01 00:00:00' endTime = '2016-11-01 00:00:00'
#pandas下一个很好用的时间处理函数,非常好用。 dateRange = pd.date_range(startTime,endTime,freq='MS')#以月分割 num = dateRange.size
#定义文件字典 fplist = {} for index,date in enumerate(dateRange): if index == num-1: break
#开始时间 strSDate = str(dateRange[index])
#结束时间 strEDate = str(dateRange[index+1])
#自动命名文件名 path = strSDate[:10] + '.txt' fp = open(path,'w+') fplist[strSDate] = fp''' for (key,fp) in fplist.items(): fp.close() '''
先写到这里,困得不行,主要的思路已经在上面,后续再补充,深感抱歉!
阅读全文
0 0
- python分割大文件(源码)
- Python 大文件分割
- FileUtil(大文件分割)
- 超级文件分割《合并》机(分割大文件)
- 用邮件分割和传送大文件,python实现 I
- 用邮件分割和传送大文件,python实现 II
- 用邮件分割和传送大文件,python实现 III
- python 模拟分割大文件后,多线程处理
- java读取大文件(分割)
- 分割大文件SHELL
- linux 分割大文件
- 大文件分割程序
- java大文件分割
- golang 大文件分割
- 大日志文件分割
- shell分割大文件
- 分割大文件
- python实现分割文件
- Ubuntu 16.04通过proxychains让命令行实现Socks代理联网
- JSP中四种属性范围
- Opengles
- 99%的人理解错 HTTP 中 GET 与 POST 的区别
- 部署Maven项目无法找到Maven管理的Jar包
- python分割大文件(源码)
- QT开发之QSS样式表的加载
- 使用wireshark常用的过滤命令
- 【修真院“善良”系列之十五】给未来的pm学员的一封信
- 浅析.Net反射机制
- Spring简单依赖注入演示
- 设计模式(Design Pattern)
- 对象隐式转换,复制构造函数和重载等号运算符的区别
- less-作为函数使用的混合