pandas垃圾数据的处理

来源:互联网 发布:生化危机5武器数据 编辑:程序博客网 时间:2024/04/29 23:21
# df.dropna()  df.fillna() df.isnull() np.any(df.isnull()) == True
import numpy as np
import pandas as pd
dates = pd.date_range('20170326',periods = 6)
df = pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns = ['A','B','C','D'])
df.iloc[0,1] = np.nan
df.iloc[1,2] = np.nan

print(df)
# axis=0:只对行进行操作,how='any'只要存在nan就删除掉
# 全部是NAN才删除掉
df_result = df.dropna(axis = 0,how='any')

#df.fillna如果是将 NaN 的值用其他值代替, 比如代替成 0:

df_result = df.fillna(value=0)

print(df_result)

#df.isnull() 判断是否由缺失数据,true表示缺失数据
print(df.isnull())
# 检测再数据中是否存在nan,如果存在就返回true
print(np.any(df.isnull()))

0 0
原创粉丝点击