哑变量的处理

来源:互联网 发布:linux怎么编译c语言 编辑:程序博客网 时间:2024/04/30 22:06

library(caret)

将几个离散变量转换为因子,目的便于下面一次性处理哑变量

final_housecluster<factor(clust cluster)
final_housefloow<factor(final h ouse floow)
final_housetype.new<factor(final h ouse type.new)

筛选出所有因子型变量

factors <- names(final_house)[sapply(final_house, class) == ‘factor’]

将因子型变量转换成公式formula的右半边形式

formula <- f <- as.formula(paste(‘~’, paste(factors, collapse = ‘+’)))
dummy <- dummyVars(formula = formula, data = final_house)
pred <- predict(dummy, newdata = final_house)
head(pred)

将哑变量规整到final_house数据集中

final_house2 <- cbind(final_house,pred)

0 0
原创粉丝点击