python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix
来源:互联网 发布:淘宝茶叶排名 编辑:程序博客网 时间:2024/05/21 00:47
相信很多人像我一样在学习python,pandas过程中对数据的选取和修改有很大的困惑(也许是深受Matlab)的影响。。。
到今天终于完全搞清楚了!!!
先手工生出一个数据框吧
import numpy as npimport pandas as pddf = pd.DataFrame(np.arange(0,60,2).reshape(10,3),columns=list('abc'))df 是这样子滴
那么这三种选取数据的方式该怎么选择呢?
一、当每列已有column name时,用 df [ 'a' ] 就能选取出一整列数据。如果你知道column names 和index,且两者都很好输入,可以选择 .loc
df.loc[0, 'a']df.loc[0:3, ['a', 'b']]df.loc[[1, 5], ['b', 'c']]由于这边我们没有命名index,所以是DataFrame自动赋予的,为数字0-9
二、如果我们嫌column name太长了,输入不方便,有或者index是一列时间序列,更不好输入,那就可以选择 .iloc了。这边的 i 我觉得代表index,比较好记点。
df.iloc[1,1]df.iloc[0:3, [0,1]]df.iloc[[0, 3, 5], 0:2]iloc 使得我们可以对column使用slice(切片)的方法对数据进行选取。
三、.ix 的功能就更强大了,它允许我们混合使用下标和名称进行选取。 可以说它涵盖了前面所有的用法。基本上把前面的都换成df.ix 都能成功,但是有一点,就是
df.ix [ [ ..1.. ], [..2..] ], 1框内必须统一,必须同时是下标或者名称,2框也一样。 BTW, 1框是用来指定row,2框是指定column, 当然上面所有的取数方法都是这个规则。
这就是我目前的领悟吧。
1 0
- python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix
- python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix
- python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix
- python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix
- python pandas中的ix,loc和iloc
- pandas学习笔记5—DataFrame数据筛选loc,iloc,ix,at,iat
- python的pandas包数据框单层索引操作核心方法loc,iloc,ix,query
- python库学习笔记——Pandas数据索引:ix、loc、iloc区别
- python pandas (ix & iloc &loc) 的区别
- python pandas中ix,iloc,loc的区别
- python pandas (ix & iloc &loc) 的区别
- python pandas (ix & iloc &loc) 的区别
- python pandas (ix & iloc &loc) 的区别
- Pandas的 loc iloc ix 区别
- pandas中loc、iloc、ix的区别
- pandas中loc iloc ix的区别
- Pandas的 loc iloc ix 区别
- pandas中ix loc iloc的区别
- 安卓缓存之DiskLruCache及设计(异步+缓存)图片加载器DiskCacheImageLoader
- JAVASE总结--Proterties
- 260.[LeetCode]Single Number III
- JAVASE总结--内部类
- 对象转换成JSON
- python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix
- hdu 5795 最长公共子序列的应用-----公共子序列的个数
- swift流程控制
- JAVASE总结--线程
- Java main 函数中的 String[] args是什么?
- 51Nod-1191-消灭兔子
- Zephyr新手指南
- 判断一个url字符串的字节长度是否过长
- JAVASE总结--线程的死锁