pandas常用的数据分析函数(一)

来源:互联网 发布:mac怎么上传淘宝助理 编辑:程序博客网 时间:2024/06/05 02:50

(1)查看数据函数

当收集到某一csv文件数据时,常用的查看函数

inspect_dataset(df_data)
 def inspect_dataset(df_data):     """            查看加载的数据基本信息     """    print '数据集基本信息:'    print df_data.info()        print '数据集有%i行,%i列' %(df_data.shape[0], df_data.shape[1])    print '数据预览:'    print df_data.head()

 此函数传进的参数df_data为一DataFrame文件,其他文件需要相应的格式转化

(2)处理缺失数据函数

  当数据文件中有缺失数据时,用此函数处理Na数据:

def process_missing_data(df_data):    """            处理缺失数据    """    if df_data.isnull().values.any():        # 存在缺失数据        print '存在缺失数据!'        df_data = df_data.fillna(0.)    # 填充nan        # df_data = df_data.dropna()    # 过滤nan    return df_data                     #返回数据
    #return df_data.reset_index()     #此为返回重置索引
 此函数传进的参数df_data扔然为一DataFrame文件,其他文件需要相应的格式转化,

 当需要直接过滤时时用df_data.dropna(),

 当需要填充为数值或字符串时用df_data.fillna(0.)

 当需要返回数据时用return df_data

 当需要返回其处理后数据的重置索引时,用reset_index()

0 0