python学习笔记-CSV文件读

来源:互联网 发布:java权限管理框架源码 编辑:程序博客网 时间:2024/05/29 12:21
python pandas IO tools 之csv文件读写
读取csv文件:pd.read_csv(),写入csv文件:pd.to_csv() 
import pandas as pdobj=pd.read_csv('test.csv')print obj
  Unnamed: 0  c1  c2  c30          a   0   5  101          b   1   6  112          c   2   7  123          d   3   8  134          e   4   9  14
test.csv为有列索引没有行索引的数据,read_csv会自动加上行索引,即使原数据集有行索引。 read_csv读取的数据类型为Dataframe

header=None时,即指明原始文件数据没有列索引,这样read_csv为自动加上列索引,除非你给定列索引的名字。
obj_2=pd.read_csv('test.csv',header=None,names=range(2,5))print obj_2
    2   3   40  c1  c2  c31   0   5  102   1   6  113   2   7  124   3   8  135   4   9  14

index_col为指定数据中那一列作为Dataframe的行索引,也可以可指定多列,形成层次索引,默认为None,即不指定行索引,这样系统会自动加上行索引
obj=pd.read_csv('test.csv',index_col=0)print obj
   c1  c2  c3a   0   5  10b   1   6  11c   2   7  12d   3   8  13e   4   9  14

usecols:可以指定原数据集中,所使用的列。在本例中,共有4列,当usecols=[1,2,3]时,即从第二列开始,之后令原始数据集的第二列为行索引。
obj_2=pd.read_csv('test.csv',index_col=0,usecols=[1,2,3])print obj_2
    c2  c3c1        0    5  101    6  112    7  123    8  134    9  14

nrows:可以给出从原始数据集中的所读取的行数,目前只能从第一行开始到nrows行。
obj_2=pd.read_csv('test.csv',index_col=0,nrows=3)print obj_2
   c1  c2  c3a   0   5  10b   1   6  11c   2   7  12






















0 0
原创粉丝点击