Python之pandas数据加载、存储
来源:互联网 发布:电脑解压缩软件 编辑:程序博客网 时间:2024/06/06 05:38
Python之pandas数据加载、存储
0. 输入与输出大致可分为三类:
0.1 读取文本文件和其他更好效的磁盘存储格式2.2 使用数据库中的数据0.3 利用Web API操作网络资源
1. 读取文本文件和其他更好效的磁盘存储格式
pandas提供了一些用于将表格型数据读取为DataFrame对象的函数。1.1 pandas中的解析函数: read_csv 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号 read_table 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为制表符("\t") read_clipboard 读取剪贴板中的数据,可以看做read_table的剪贴板版。在将网页转换为表格时很有用 其中,read_csv、read_table使用较多。1.2 逐块读取文本文件 读取几行nrows 逐块读取chunksize(行数)1.3 将数据写到文本格式 利用DataFrame的to_csv
2. 使用数据库中的数据
2.1 使用关系型数据库中的数据,可以使用Python SQL驱动器(PyODBC、psycopg2、MySQLdb、pymssql等)2.2 使用非关系型数据库中的数据,如MongoDB,用其官方驱动器pymongo通过默认端口进行连接。
3. 利用Web API操作网络资源
3.1 应用lxml.html处理HTML 步骤: 1)利用urllib2将URL打开,然后由lxml解析得到数据流 2)得到URL和链接文本 使用文档根节点的findall方法以及一个XPath,以及个对象的get方法(针对URL)和text_content方法(针对显示文本) 3)通过反复试验从文档中找到正确表格 4)将所有步骤结合起来,将数据转换为一个DataFrame3.2 应用lxml.objectify处理XML 1)使用lxml.objetify解析文件 2)通过getroot得到XML文件的根节点3.3 使用网站通过JSOM及其他格式提供数据的公共的API 使用requests包访问这些API
0 0
- Python之pandas数据加载、存储
- python/pandas/numpy(十二)数据加载、存储与文件格式
- pandas处理数据加载、存储
- 数据分析之Pandas-05数据加载
- 利用python进入数据分析之数据加载、存储、文件格式
- python之pandas使用:数据的选择
- python数据分析之(3)pandas
- Python数据分析之pandas学习
- python数据分析之pandas包
- Python数据分析之pandas基础
- Python数据分析之pandas统计分析
- Python数据分析之pandas学习
- Python数据扩展包之Pandas
- Python数据分析之pandas学习
- Python数据分析之pandas ,part1
- 【Python数据挖掘】实用模块之Pandas
- Python数据分析之pandas学习
- Pandas数据存储
- 互联网产品快速迭代下是否需要写详细测试用例
- java递归之求0到100甚至更大区间的和
- java中InputStream的用法
- NSURLSession学习笔记(一)简介
- Oracle 中查询数据库中表的字段名称
- Python之pandas数据加载、存储
- java中从键盘输入字符存入文件中
- Hbase原生态api总结
- spark中 进行高维矩阵的SVD分解(1)
- gradle多渠道打包及友盟统计-eclipse版本
- linux grep命令
- IMP-00013: 错误的解决
- NSURLSession学习笔记(二)Session Task
- AVCaptureDevice摄像机