R语言学习:数据结构5-因子

来源:互联网 发布:跟单软件下载 编辑:程序博客网 时间:2024/06/08 08:36
因子 factor,是用来处理分类数据的,分类数据又分为有序和无序,有序(年级:低中高,性别:男女)。
整数向量+标签label,因子优于整数向量。在线性和线性模型中经常会用到。
创建因子、基线水平
#factor
x <- factor(c("female","female","male"))    //在没有指定基线水平时,按照数字、字母排序
y <- factor(c("female","female","male"), levels=c("male","female"))    //设定基线水平
table(x)    //查看因子统计
unclass(x)    //去掉因子的水平输出,但是变量本身没有改变
class(unclass(x))    //去掉水平后,变为了整数向量
注意:levels是因子的一个属性,levels中的第一个就是基线。因子去掉levels属性之后就变成一个整数向量了。

1 0
原创粉丝点击