python—DataFrame的存储
来源:互联网 发布:客观钓鱼岛主权 知乎 编辑:程序博客网 时间:2024/06/05 10:25
转载于:http://blog.sina.com.cn/s/blog_4ddef8f80102vu4e.html
Pandas中的DataFrame数据既可以存储在SQL数据库中,也可以直接存储在CSV文件中。
数据库
1. dataframe.to_sql()函数将DataFrame数据存储到数据库中。
name :数据表的名称, string, Name of SQL table
con : 数据库的链接,SQLAlchemy engine or DBAPI2 connection (legacy mode)
if_exists : 如果SQL表已经存在的处理方式,{‘fail’, ‘replace’, ‘append’}, default ‘fail’
取消存储, fail: If table exists, do nothing.
替换SQL表,replace: If table exists, drop it, recreate it, and insert data.
附加在SQL表后,append: If table exists, insert data. Create if does not exist.
index : 是否将行标签存入SQL表,boolean, default True, Write DataFrame index as a column.
index_label : 如果存储行标签,指定该列的名称,string or sequence, default None, Column label for index column(s).
2. pandas.read_sql()函数将SQL表读入DataFrame。
sql : 要读取的SQL表,string, database table name.
con : 与数据库的链接,SQLAlchemy engine
index_col : 指定用于行标签的列,string, optional, column name to use as index for the returned DataFrame object.
CSV文件
1. dataframe.to_csv()函数将DataFrame数据存储在指定的csv文件中。该函数常用的参数有
columns : 指定需要存储的列,Columns to write
header : 是否把列的名字写入CSV文件, boolean, default True. Write out column names. If a list of string is given it is assumed to be aliases for the column names
index : 是否把index写入CSV文件,boolean, default True.Write row labels (index)
index_label : 如果将index写入CSV文件,那么给出index列的标签(列的名字),string or sequence, or False, default None.
2. pandas.read_csv()函数将CSV文件中的数据读入DataFrame。
header : CSV文件的列名所在的行, int, list of ints. Row number(s) to use as the column names, and the start of the data. Defaults to 0 if no names passed, otherwise None.
index_col : 指定行标签所在的列,int or sequence or False, default None. Column to use as the row labels of the DataFrame.
names : 列的名称,array-like. List of column names to use.
总结:
相同点:
1. 存储时,CSV和SQL都默认存储行标签(index),因此需要指定存储行标签列的名字,index_label。
2. 读取时,CSV和SQL都需要指定哪一列是行标签(index)列,index_col,不同的是CSV是通过列的序号指定,SQL是通过列的名字指定。
不同点:
1. SQL一定会存储列标签,CSV可以存储列标签也可以不存储列标签。
- python—DataFrame的存储
- python dataframe的索引
- python的dataframe数据分组
- python 的pandas DataFrame大全
- python的DataFrame排序问题
- 【python DataFrame】Pandas里面的屠龙宝刀DataFrame
- python的dataframe和matrix的互换
- python的dataframe与series的创建
- python/pandas dataframe中multiindex的操作
- pandas、DataFrame、python三者的关联性
- python DataFrame 修改列的顺序
- Python Series和DataFrame的基本操作
- python-pandas-Series和DataFrame的基本功能
- Python草稿簿-Pandas的DataFrame结构
- python的dataframe转换为多维矩阵
- Python Dataframe ——指定多列去重、求差集
- Spark SQL的DataFrame会不会存储相同的数据
- 基于Alluxio系统的Spark DataFrame高效存储管理技术
- Java--反射(五)从反射看泛型集合的本质
- 【SSLGZ 2780】2017年10月20日提高T2 收银员(01背包)
- 【bzoj4282】慎二的随机数列
- android 五种存储方式——Http
- 二分答案+队列的运用
- python—DataFrame的存储
- JavaScript:On The Way...(2)函数
- dp-飞扬的小鸟
- ping过程中发生了什么
- eclipse里启动了tomcat正常,但是页面一直报404
- 初始mysql存储过程
- 爬取拉勾网招聘信息并使用xlwt存入Excel
- LeetCode 148. Sort List 单链表排序 Python Solution
- 设计模式系列-工厂模式