(二)R的数据类型

来源:互联网 发布:淘宝客服后台操作 编辑:程序博客网 时间:2024/05/24 20:07

一、R处理大数据的方式

  • 自带的数据包,如lm(),biglm()等
  • 与大数据处理平台的结合,如RHadoop,RHive等

二、R导入数据集

  1. 手动输入(数据较小)
  2. 外部导入
    数据集样式

三、R存储数据对象的类型

1 . 向量: c()
(1)一维数组。可存储数、字符、逻辑值。
ps:数组中的值需为相同数值类

 a <- c(1236)     b <- c("one","two","three")     c<- c(TRUE,FALSE) 


(2) 访问数组中的元素:

a[3]         访问a的第3个元素a[c(1,3)]    访问a中的第1个和第3个元素a[1:3]       访问a中的第1个到第3个元素

2 . 矩阵: matrix()
(1)二维数组,元素类型需相同

matrix(数据, nrow = 行数, ncol = 列数, byrow = FALSE为按列填充(默认),TRUE为按行填充,dimnames = 行列的名字(需要预先定义))

(2)访问元素
访问第3行

访问第2列

访问3行2列

3 . 数组: array()
(1)多维数组,元素类型需相同
array(数据,维度定义,维度名)
定义方式如下
数组如下
(2)访问元素
访问第一维第二行的第三个元素

4 . 数据框 data.frame()
每一行元素类型可以不同,但每一列数据类型需相同
这里写图片描述
这里写图片描述

访问元素
方法1:数据框名[下标]
这里写图片描述

方法2:数据框名[向量(列名)]
> patientsData[c("diabetes","status")]
这里写图片描述

方法3:数据框名$列名
这里写图片描述

方法4:attach(数据框名)
将数据框载入R的搜索路径中,遇到变量名之后,会自动定位到数据框中的变量,从而可以直接输入变量名获得相应的值
ps:需先执行清除缓存操作,否则会载入之前载入过的值

> attach(patientsData)

这里写图片描述

相对应的还有将数据框从R的搜索路径中移除detach()

detach(patientsData)

5 . 列表

原创粉丝点击