Learning R---dplyr

来源:互联网 发布:单片机与pc串口通信 编辑:程序博客网 时间:2024/06/05 22:39

1、取子集

类似于基础函数的subset~

## 基础函数,感觉subset反而更方便## 参数:指定数据框、筛选行、筛选列subset(x=iris,Sepal.Length<5,select=Sepal.Length)## dplyr## filter筛选行、select筛选列library(dplyr)iris %>% filter(Sepal.Length<5) %>% select(Sepal.Length) 

2、变量变换/重构mutate

类似于基础函数的subset~

head(late_refund_data)## 数据格式  Var1  Freq1    0 270052    1  55493    2  27574    3  20815    4  23926    5  1156## 求累计百分比late_refund_data <-  mutate(late_refund_data,         Cum_Freq = cumsum(Freq),         Cum_Prop = Cum_Freq / sum(Freq))## 最终结果  Var1  Freq Cum_Freq  Cum_Prop1    0 27005    27005 0.60640422    1  5549    32554 0.73100853    2  2757    35311 0.79291764    3  2081    37392 0.83964705    4  2392    39784 0.89336006    5  1156    40940 0.9193183