python/pandas/numpy数据分析(七)-MultiIndex
来源:互联网 发布:mac收藏页面快捷键 编辑:程序博客网 时间:2024/06/05 17:38
data=Series(np.random.randn(10),index=[list('aaabbbccdd'),list('1231231223')])dataa 1 0.198134 2 0.657700 3 -0.984464b 1 0.105481 2 -1.587769 3 0.329646c 1 -0.172460 2 -1.234518d 2 -1.200264 3 -0.239958dtype: float64data.indexMultiIndex(levels=[['a', 'b', 'c', 'd'], ['1', '2', '3']], labels=[[0, 0, 0, 1, 1, 1, 2, 2, 3, 3], [0, 1, 2, 0, 1, 2, 0, 1, 1, 2]])
取层次化索引:
data['b':'c']b 1 0.105481 2 -1.587769 3 0.329646c 1 -0.172460 2 -1.234518dtype: float64data.ix[['b','c']]b 1 0.105481 2 -1.587769 3 0.329646c 1 -0.172460 2 -1.234518dtype: float64
取内层索引:
data[:, '2']a 0.657700b -1.587769c -1.234518d -1.200264dtype: float64
unstack: 将Series放到DataFrame中
data.unstack() 1 2 3a 0.198134 0.657700 -0.984464b 0.105481 -1.587769 0.329646c -0.172460 -1.234518 NaNd NaN -1.200264 -0.239958
data.unstack().stack() 进行还原
data.unstack().stack()
对于DataFrame,每个轴上都可以有分层索引
frame=DataFrame(np.arange(12).reshape(4,3), index=[list('aabb'),list('1212')], columns=[['ohio','ohio','colorado'],['Green','Red','Green']])frame
还可以命名:
frame.index.names=['key1','key2']frame.columns.names=['state','color']frame
因为有了列索引,所以可以直接取列分组
frame['ohio']
根据级别汇总统计
frame.indexMultiIndex(levels=[['a', 'b'], ['1', '2']], labels=[[0, 0, 1, 1], [0, 1, 0, 1]], names=['key1', 'key2'])
levels用于在指定在某条轴上进行求和的级别.
frame.sum(level='key2')frame.sum(level='color',axis=1)
将列转换为行索引
DataFrame的set_index函数会将一个或者多个列转换为行索引,并创建一个新的DataFrame
reset_index的功能跟set_index刚好相反,层次化索引的级别挥别转移到列里面
0 0
- python/pandas/numpy数据分析(七)-MultiIndex
- 利用Python数据分析:Numpy基础(七)
- pandas multiIndex
- python/pandas dataframe中multiindex的操作
- python/pandas/numpy数据分析(十一)-相关系数与协方差
- Python数据分析笔记——Numpy、Pandas库
- Python数据分析模块安装---Numpy、Pandas、Matplotlib
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- python数据分析学习笔记-Numpy-Matplotlib-Pandas
- Python数据分析常用手册——Numpy和Pandas
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- 利用python/pandas/numpy做数据分析(三)-透视表pivot_table
- python/pandas/numpy数据分析(十)-函数, rank,重复索引
- python/pandas/numpy(十二)数据加载、存储与文件格式
- python数据分析---Pandas
- Python 数据分析 pandas
- 欠拟合、过拟合及其解决方法
- 【DP总结】【字符串】【前缀树】【LA3942】
- java中的super,this和static
- extern和头文件在多文件编译过程中的作用
- 基于LVS负载均衡的高性能Web站点设计与实现
- python/pandas/numpy数据分析(七)-MultiIndex
- POJ 2240Arbitrage(最短路floyd)
- android Environment 常用方法(获取存储目录)
- 关于手机安全卫士开发详解
- leetCode练习(126)
- ShraedPreferences 存储到SD卡
- [51nod]矩阵中不重复的元素
- Spark之Scala学习之路(五)
- Faster_RCNN配置步骤(win7+GTX TITAN X + CUDA7.5)----by jhj