《R语言实战》自学笔记 day2

来源:互联网 发布:商业银行表外业务数据 编辑:程序博客网 时间:2024/06/16 04:11

批处理:

“C:/Program Files\R\R-2.13.0\bin\R.exe” CMD BATCH

--vanilla--slave "c:\my projects\myscript.R"


创建数据集

数据集,行表示观测(记录、示例),列表示变量(字段、属性)。

向量

可以存储数据型、字符型、逻辑型数据。a <-  c(1,2,3,)(“one”,“two”,“three”)(TURE,FALSE,TURE),同一向量数据类型相同。通过 c()创建。

> a <- c (1,2,3,4,5, )

> a [3] 得出结果是 3

> a [ 1,3,4] 得出结果是 1 3 4

> a [ 2:4] 得出结果 2 3 4 需要注意的是:冒号在赋值时也可以用。 a <- c (2: 6 ) 等价于a <- c (2,3,4,5,6)

矩阵

可以存储数值型、字符型、逻辑型。可以通过 matrix()创建。

mymatrix <- matrix (所有元素,nrow = 行数, ncol= 列数, byrow = (默认false,按列填充), dimnames= list (行名,列名))

 > cells <- c(1,26,24,28)
> rnames <- c ("R1","R2")
> cnames <- c ("C1","C2")
> mymatrix <- matrix (cells,nrow
=2,ncol=2,byrow=true,dimnames=list(rnames,cnames))

X [ i, j ] 代表第i行,第j列个元素。

x [2, ]  第二行, x [ ,2]  第二列,X [1,4] 第一行第四列, X [2, C(4,5)] 第二行,第四第五列。

数组

数组的维度可以大于2。通过 array ( ) 来创建。

myarray <- array ( 数据,数值型向量(各个维度下的最大值),各个维度的标签(可选) )

> dim1 <- c("A1","A2")
> dim2 <- c("B1","B2","B3")
> dim3 <- c
("C1","C2","C3","C4")
> Z <- arrary (1:24,c(
2,3,4),dimnames=list(dim1,dim2,dim3))

注意:要在英文输入场景下,c(2,3,4)与 dinames =list 对应的向量里的值要一直,dim1有两个值,对应c里的2。


数据框

通过 mydata <- data.fame (col1,col2,co3,……)来创建

创建方式,就是: 向量1 <- ( )  ,col1的位置写向量1即可。


mydata$col1,会直接调出col1列中的元素。以下的方式更好一点,不用每一句都输入$

attach (数据框) 连接到数据框

summary (列1) 

plot (列1,列2)

detach (数据框)移除。

with (mtcars,{

nokeepstats <- summary(mpg)

keepstats <<- summary (mpg)

}

因子:

函数:factor(),factor ( 向量名,order= ture (有序),level (1,2,3…对应的因子)),把任何一个类别值存储为向量。



原创粉丝点击