pandas笔记,长期记录不会的知识点~

来源:互联网 发布:实木多层板环保吗 知乎 编辑:程序博客网 时间:2024/04/29 06:09

1,如果有些列用不到了,用drop([列名],axis=1)去掉,别用del。

 

2,groupby后的对象是一个个的DataFrame,虽然不能print出来,但是可以使用apply方法,此时的apply传入的参数x就是一个个的DataFrame。

 

3,DataFrame需要有多个约束条件的时候,不能用and,可以用多个[],

例如:temp3[temp3.Final_in_ZD190 == 1][temp3['管外'] == 1]

 

4,如果apply用到的函数需要额外的参数,用元组的格式传给args,如果有1个a的话就用(a,),例如:apply(dobias,args=(1,)),但是groupby的apply要这样:apply(dobias,1)

 

5,DataFrame.info()  查看各个列的类型、空值等信息。


6,DataFrame的filter方法是个选择特征列好方法,可以用正则表达式匹配需要选择的列。


7,使用 DataFrame.dtypes 可以查看每列的数据类型,Pandas默认可以读出int和float64,其它的都处理为object,需要转换格式的一般为日期时间。DataFrame.astype() 方法可对整个DataFrame或某一列进行数据格式转换,支持Python和NumPy的数据类型。


8,取不为空的值用notnull()方法,取空值用isnull()方法。


9,corr方法可以算相关度


10,填充的方法,前向和后向



11,apply有axis参数,设为1就能在lambda中使用ix等方法了

0 0