pandas—Dataframe操作(选取 插入 删除)

来源:互联网 发布:cloudstack基本网络 编辑:程序博客网 时间:2024/04/30 18:27

数据

from pandas import DataFrame, Seriesimport pandas as pdimport numpy as npcontries = {    '俄罗斯': {'2013': 10, '2014': 20, '2015': 30},    '阿富汗': {'2013': 12, '2014': 25, '2015': 33},    '新加坡': {'2013': 11, '2014': 22, '2015': 38},    '柬埔寨': {'2013': 18, '2014': 16, '2015': 27},}d1 = DataFrame(contries)d1----------        俄罗斯 新加坡 柬埔寨 阿富汗2013     10     11   18    122014     20     22   16    252015     30     38   27    33

获取元素

获取一列或者多列数组
d1['柬埔寨']d1[ ['俄罗斯', '新加坡', '柬埔寨']  ]d1.iloc[:, 1: 3]
获取一行或者多行数据
d1.loc['2013']d1.loc[ ['2013', '2014'] ]d1.loc[ ['2013', '2014'], ['俄罗斯', '新加坡'] ]
获取行数据, loc里面可以放字符串标签和布尔值、数组
d1.loc[d1.新加坡 > 11]d1.loc[d1.新加坡 > 11, ['俄罗斯', '新加坡']]d1.iloc[1]
位置下标获取行数据
data_frame1.iloc[0]
切片获得区间数据,以下两种效果一样
data_frame1.iloc[1:3]data_frame1[1:3]
数组切片索引
 data_frame1.iloc[1:3, [0, 1]] data_frame1.iloc[1:3, 1:]
数字和字符串混合
d1.ix[1:3, ['阿富汗', '俄罗斯']]

如果使用标签索引,用loc获取行
如果使用数字索引, 用iloc获取行
如果希望两者混合, 用ix获取行
loc iloc ix都是用获取某行、多行数据的

插入元素

插入一行
d1.loc['2016'] = 666    d1.loc['2017'] = ['111', '222', '333', '444']    d1.loc['2018'] = Series([1, 2, 3, 4], index=['新加坡', '俄罗斯', '柬埔寨', '阿富汗'])    d1 = d1.append( Series([11, 22, 33, 44], index=['新加坡', '俄罗斯', '柬埔寨', '阿富汗'], name='2019') )
在指定位置插入一行
a1 = d1.iloc[:2]a2 = d1.iloc[2:]s1 = Series([1, 2, 3, 4], index=['新加坡', '俄罗斯', '柬埔寨', '阿富汗'], name='2020')a1 = a1.append(s1)
合并两个DataFrame
d1 = pd.concat([a1, a2])
插入一列数据
d1['法兰西'] = Series(np.arange(8), index=[ str(val) for val in range(2013, 2021)])d1.insert(2, '马来西亚',Series(np.random.randint(0, 8, 8), index=[str(x) for x in range(2013, 2021)]))

删除元素

 del pop 删除一列数组 drop 删除一行或者多行 一列或者多列数据

del pop

del d1['马来西亚']d1.pop('阿富汗')

drop

d1.drop('法兰西', axis=1)d1 = d1.drop('2013', axis=1)删除多行数据d1.drop(['2013', '2019'], axis=0)
原创粉丝点击