pandas

来源:互联网 发布:辽宁省软件评测中心 编辑:程序博客网 时间:2024/06/04 19:39

一、Series类型
Series类型由一组数据及与之相关的数据索引组成。

创建:1、列表    a = pd.Series([5,4,3],index=['a','b','c'])2、字典    b = pd.Series({'a':5,'b':4,'c':3}, index=['c','a','b','d'])    #按index顺序输出,d的值为NaN3、从ndarray类型创建    in:        import pandas as pd        import numpy as np        c = pd.Series(np.arange(3),index=np.arange(9,6,-1))        print(c)    out:        9    0        8    1        7    2        dtype: int32
Series类型操作方法:a.index  #获得索引a.value  #获得数据索引方法与ndarray类型一致in操作:'c' in a  #会显示True或FalseSeries类型在运算中会自动对齐不同索引的数据

二、DataFrame类型
DataFrame是一个表格型的数据类型,既有行索引、也有列索引,常用于表达二维数据,是二维带“标签”数组。

DataFrame创建1、从二维ndarray对象创建    import pandas as pd    import numpy as np    d = pd.DataFrame(np.arange(8).reshape(2,4))2、从一维ndarray对象字典创建    dt = {'one':pd.Series([4,3,2], index=['a','b','c']),          'two':pd.Series([9,8,7], index=['a','c','d'])}    e = pd.DataFrame(dt)    #数据根据行列索引自动补齐3、从列表类型的字典创建    dt = {'one':[5,4,3,2], 'two':[9,8,7,6]}    f = pd.DataFrame(dt, index=['a','b','c','d'])
DataFrame类型操作:1、重新索引:.reindex()能够改变或重排Series和DataFrame索引    d = d.reindex(index=['c1','c2','c3','c4'], columns=['a4','a3','a2','a1'])2、删除指定索引:    d.drop(['a','c']) #同时删除两个索引需要[]    d.drop('c5')
原创粉丝点击