R语言iMooc笔记

来源:互联网 发布:立体照片制作软件 编辑:程序博客网 时间:2024/06/06 02:38
Chapter 1
1、数据结构:对象的五种基本类型:
字符:character
数值:numeric:real numbers
整数:integer
复数:complex:1+2i
逻辑:logical:True/False

赋值:
[1]代表x中的第一个数,1代表存储内容为1
x<-2L:则是整数类型
2.属性
属性包括名称、维度、类型、长度
3.向量:只能包含同一类型对象
创建向量的方式:vector(), c(), 强制转换:as.logical()/as.numeric()/as.character()
vector创建新的向量,
将一行选中,点击run,执行函数

命名:
运行后:在控制台
4、矩阵、数组:向量+维度属性
创建矩阵:matrix():先列后行
attributes()
vector()+dim()
cbind(),rbind()
数组
5、列表(list):与数组不同的是,可以是不同类型的向量
创建列表:list()

6、因子(factor):分类数据 有序或无序
整数向量+标签(优于整数向量),常用于Im(),glm()
创建因子:factor(), table(), unclass()

存成因子,可以对数据进行描述

7.缺失值:missing value
NA/NAN:NAN属于NA,NA不属于NAN
NA有类型属性:integer NA, character NA等
is,na()/is.nan()

8.数据框:data frame
存储表格数据(tabular data)
视为各元素长度相同的列表:每个元素代表一列数据,每个元素的长度代表行数,元素类型可不同


9.日期和时间(date,time)
日期:Date
1)距离1970-01-01的天数/date()/Sys.Date()
2)weekdays()/months()/quarters()

时间:POSIXct/POSIXIt
1)距离1970-01-01的秒数、Sys.time()
2)POSIXct:整数,常用于存入数据框

3)POSIXIt:列表,还包含星期、年、月、日等信息
日期与时间(date,time)
字符-日期/时间
as.Date()

as.POSIXct() /as.POSIXIt() / strptime()

Summary

Chapter 2
1.构建子集
原始数据(raw dataset) -> 预处理后的数据(clean dataset)
基本方法:
[]:提取一个或多个类型相同的元素
[[]]:从列表或数据框中提取元素
$:按名字从列表或数据框中提取元素
2.矩阵的子集
3.数据框子集
4.列表的子集
[[]]/$/[[]][]/[[]][[]]
嵌套列表/不完全匹配
在列表中拿到元素有两种方法:接连使用[[]],或x[[c(1,3)]]

5.处理缺失值

6.量化操作:可以作用于向量、矩阵等结构,是的代码简洁、易于阅读、效率高

Summary


chapter 3:重要函数的使用
处理循环:for/while, 一句话函数
排序
总结数据信息
1.lapply:lapply(列表,函数、函数名,其他参数)
1)可以循环处理列表中的每一个元素

2)总是返回一个列表

3)sapply:简化结果:结果列表元素长度均为1,返回向量
结果列表元素长度相同且大于1,返回矩阵

2.apply:apply(数组,维度,函数/函数名)
沿着数组的某一维度处理数据


3.mapply:mapply(函数/函数名,数据,函数相关的参数)
lapply的多元版本


4.tapply:tapply(向量,因子/因子列表,函数/函数名)
对向量的子集进行操作

5.split:split(向量/列表/数据框,因子/因子列表)
根据因子或因子列表将姓梁或其他对象分组
通常与lapply一起使用
6.排序
sort():对向量进行排序;返回排好序的内容
order():返回排好序的内容下标/多个排序标准
7.总结

Summary

chapter 4
1.数据基础

2.数值变量的特征和可视化











chapter 5:R的绘图系统


1.基本绘图系统

2.Lattice
lattice基于grid包创建
ggplot2