Python-pandas模块数据处理
来源:互联网 发布:上位机编程语言 编辑:程序博客网 时间:2024/05/19 03:42
1.常用数据结构
(1)Series相当于一个一维数组,只不过多了一个索引
>import pandas as pd>s=pd.Series([1,2,3,4],index=['a','b','c','d'])>sa 1b 2c 3d 4dtype: int64>s['a']1
(2)DataFrame相当于一个二维数组,可以通过行,列来索引
>df=pd.DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np.random.randn(5),'data2':np.random.randn(5)}) data1 data2 key1 key20 0.298132 -0.889997 a one1 -1.610528 0.735897 a two2 1.229059 -0.922434 b one3 -0.419731 1.611932 b two4 -0.485703 -1.041524 a one>df.ix[1,:]data1 -1.61053data2 0.735897key1 akey2 twoName: 1, dtype: object>df['data1']0 0.2981321 -1.6105282 1.2290593 -0.4197314 -0.485703Name: data1, dtype: float64
2.常用操作
【不定期更新,边学边练】
(1)groupby
(2)rolling,rolling_mean
DataFrame.rolling(window, min_periods=None, freq=None, center=False, win_type=None, on=None, axis=0, closed=None)
相当于滑动窗口处理数据
window–窗口大小
min_periods–至少得有多少个元素才能计算结果
>df['data1'].rolling(2).sum()#第一个窗口因为只有一个元素,所以没办法计算结果0 NaN1 -1.3123962 -0.3814683 0.8093284 -0.905435Name: data1, dtype: float64>df['data1'].rolling(2,min_periods=1).sum()#设置min_peroid,第一个窗口也可以成功计算0 0.2981321 -1.3123962 -0.3814683 0.8093284 -0.905435Name: data1, dtype: float64
这个函数好像快被前面那个替代了
pandas.rolling_mean(arg, window, min_periods=None, freq=None, center=False, how=None, **kwargs)
>pd.rolling_mean(df[['data1','data2'],2) data1 data20 NaN NaN1 -0.656198 -0.0770502 -0.190734 -0.0932683 0.404664 0.3447494 -0.452717 0.285204>pd.rolling_mean(df[['data1','data2']],2,min_periods=1) data1 data20 0.298132 -0.8899971 -0.656198 -0.0770502 -0.190734 -0.0932683 0.404664 0.3447494 -0.452717 0.285204
0 0
- Python-pandas模块数据处理
- Python大数据处理模块Pandas
- 学习Python大数据处理模块Pandas
- 学习Python大数据处理模块Pandas
- Python 数据处理:Pandas 模块的 12 种实用技巧
- Python基于pandas的数据处理
- Python数据处理的瑞士军刀:pandas
- Python中的pandas模块
- python: pandas模块
- Python--pandas模块
- python模块学习pandas(-)
- Python 数据处理扩展包: pandas 模块的DataFrame介绍(创建和基本操作)
- python 数据处理学习pandas之DataFrame(一)
- python 数据处理学习pandas之DataFrame(二)
- python 数据处理学习pandas之DataFrame(三)
- Python数据处理进阶——pandas
- python 数据处理学习一(pandas)
- python:pandas(4),缺失数据处理
- 初学Map
- 欢迎使用CSDN-markdown编辑器
- sql优化总结 / sql中decode(...)函数的用法
- POJ
- swift——复合类型——tuple
- Python-pandas模块数据处理
- Java 1.5,1.6,1.7,1.8新特性整理
- 51nod 1118 机器人走方格 & 1119 机器人走方格 V2(排列组合)
- not found while looking for property
- 工业设计公司对工业设计的讲解
- HDU 1014 Uniform Generator
- swift——复合类型——String
- Hadoop2.X大数据集群规划与架构设计
- LocalBroadcastManager的使用