程序博客网 > 白蜡杆淘宝

pandas 常用操作

来源：互联网发布：白蜡杆淘宝编辑：程序博客网时间：2024/05/22 15:11

删除操作

删除列：
df=df.drop('column_label',axis=1)
删除行：
df=df.drop('row_label')
删除重复的行: df=df.drop_duplicates(['column_label_one','column_label_two'])

查看

查看行数
len(df) or len(df.index) or df.shape[0]
列数
len(df.columns) or df.shape[1]
数据类型
df.dtypes

重命名

列标签的重命名
df.rename(columns={"old label": "new label"})
行标签的重命名
df.rename(index={"old label": "new label"}

时间序列的操作

将时间字符串转换成datetime数据
dt['StartTime'] = pd.to_datetime(dt['StartTime'])

排序

按值排序，可指定列名和排序方式，默认的是升序排序
dt.sort(['StartTime'], inplace=True) or dt.sort(['StartTime'])
照索引（行名）或者列名进行排序,指定axis=0表示按索引（行名）排序，axis=1表示按列名排序，并可指定升序或者降序：
df.sort_index(axis=1, ascending=False)

读写操作

读csv
pd.read_csv('input.csv') | pd.read_table('input.csv', sep=',')
- 参数 header = None pandas分配默认列名
- 参数 name = [‘a’, ‘b’, ‘c’] 指定列名
- 参数 index_col=’idx 指定索引
- 参数 shiprows = [0, 2, 4] 跳过文件部分行
- 参数 nrows = 20 只读取文件前xx行
- 参数 chunksize = 10000 指定每次读取行数，分块读取，返回TextParse对象
写csv
pd.to_csv('output.csv')
- 参数 na_rep = ‘NULL’ 缺失值输出为指定标记值，默认为空字符串
- 参数 index = False, header = False 禁止输出行和列的标签, 默认输出
- 参数 cols=[‘a’, ‘b’] 指定输出以部分列，并以指定顺序排序

0 0

白蜡杆淘宝

白蜡杆淘宝

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子出国留学的英文出国留学英文中介留学费用新东方留学中介留学费用排名美国留学学费留学学历认证美国留学条件留学是什么意思英国留学条件美国留学一年费用国外留学费用排行榜北京留学中介排名澳际留学中介怎么样出国留学咨询机构排名上海留学中介排名研究生出国留学条件高中生出国留学条件初中生出国留学的条件成人出国留学去国外留学的条件出国留学要求专科出国留学条件首尔大学留学条件申请国外留学的条件国外留学条件留学美国读研的条件考研出国留学条件公费留学申请条件公费出国留学的条件各国出国留学费用高中生去留学怎么选择留学机构各国研究生留学费用免费留学中介孩子出国留学好不好留学条件出国美国研究生留学出国留学步骤好的留学中介美国留学中介机构