R语言记录

来源:互联网 发布:mysql数据库设计原则 编辑:程序博客网 时间:2024/04/30 14:56

小白一枚,最近开始课题要求,正在尝试用R处理数据,在这个过程中学习了一些命令,记录一下。


x<-read.csv("F:/table.csv",sep=",") ## 读取数据

v2<-x$v1!=0 ###新建变量:将x中变量v1不等于零的编码为0,大于或小于0的编码为1a<-sum(v2)/3163   ###计算v1不为0的个数占总数的比例(即v2求和处以总数)xv1<-x[v2,]   ###保留v1中不等于零的案例
v3<-x$v1>0meanv1<-mean(x[v3,]$v1)   ###求v1中大于零的平均数tapply(v2,x$industry,sum)  #######分行业看v2的个数

小结:

不等于: 

!=

read.csv()data.frame(c(...),c(...))x[row,col]tapply(v1,v2,FUN)
with(y, addmargins(table(gender, province)))##可以做出一个gender和province的交叉表



0 0
原创粉丝点击