【R】数据缺失值处理

来源:互联网 发布:李小龙身体实际数据 编辑:程序博客网 时间:2024/09/21 08:59

方法一:subset

x<-c(6,1:3,NA,12)

运行结果

x
[1] 6 1 2 3 NA 12

x>5

运行结果

[1] 6 NA 12

subset(x,x>5)

运行结果

[1] 6 12

方法二:complete.cases( )-处理数据框dataframe

构建数据

kids<-c('jack','lily','lucy')ages<-c(12,NA,10)d<-data.frame(kids,ages,stringsAsFactors = FALSE)

查看运行结果

kids ages
1 jack 12
2 lily NA
3 lucy 10

complete.cases(d)

查看运行结果

[1] TRUE FALSE TRUE

d1<-d[complete.cases(d),]

查看运行结果

d1
kids ages
1 jack 12
3 lucy 10

方法三:缺失值 na.rm=TRUE

 mean(d$ages)

[1] NA

操作过程中加入na.rm选项

 mean(d$ages,na.rm=TRUE)

[1] 11

0 0