R语言学习

来源：互联网发布：数码宝贝网络侦探攻略编辑：程序博客网时间：2024/06/14 20:24

最近一段时间的R语言的笔记

1.R中对象的5种基本类型：

字符（character）
数值（numeric）[可为整数，小数]
整数（interger）[在数字后面加上大写的L]
复数（complex）
逻辑（logical）[逻辑值用大写]
2.属性：
名称（name）
维度（array）
类型（class）
长度（length）
3.赋值：x<-c();assign("x",c());c()->x;y<-c(x,o,x)表示将x中的数据复制两份，中间用0隔开
4.注释用#
5.NA为缺失值
6.as.numeric() as.logical() as.character()强制转换
7.帮助命令：help(solve) ?solve
特殊字符或关键字：放在单引号或双引号中
8.help.start()启动一个网页浏览器
9.?help.search命令
10.对于字符集而言，数字，字母，"."，"_"都可作为开头。若为命名，则"."或字母开头，以"."开头
第二位不能为数字
11.命令以";"隔开，或者另起一行；通过"{}"放在一起构成符合表达式
12.一条命令未结束，会显示+，并一直存在，直到修改
13.命令行编辑器
14.批处理文件和结果重定向
15.rm()删除对象
16.向量运算：rang得到一个长度为二的向量，即c(max(x),min(x));length(x)向量x的元素个数
sum(x),prod(x)得到乘积
17.mean（x）计算均值
var(x)计算样本方差
sort(x)升序排序
18.表达式 expression 公式 formulae 模式 mode 特征property 对象object
19.因子：一个对等长的其他向量元素进行分类的向量对象。R同时提供有序因子和无序因子
20.因子是一个符号。
21.因子是一个点，向量是一个有方向的范围。
2016年5月30日
1.ls()函数的功能显示所有在内存中的对象。
2.ls(pat="")表示显示含有某个指定字符的对象 ls(pat="^ ")表示以该字符开头的对象
3.ls.str()将内存对象的详细内容显示出来例如，数据类型，对象的内容
4.ls.str函数，max.level选项将规定显示所有关对象信息的详细级别，缺省情况下，将会列出关于对
象的所有信息包括数据框，矩阵，数据列表的列数信息
5.rm()函数，用于删除对象
6.Inf和-Inf分别表示正负无穷，NaN表示不是数字的值
7.若对象用双引号引起，那么句中出现双引号要用反斜杠转义，若用单引号引用则将单引号用反斜杠
转义
8.查看向量的某一个值，向量名[位置]注：-2表示出去第二个值外的其他值
9.数据框可以结合不同类型的数据
2016年5月31日
1.sum(..., na.rm = FALSE)sum(1, 2, 3, 4, 5) sum(1:5)结果相同
2.$符号是访问数据框中的变量的一种方法
3.mean函数求均值
4.read.table（）的用法，需要在前面使用setwd(路径，\\)
5.plot( , )前面的默认为x轴，main表示标题，xlab和ylab应用于标签，xlim和ylim为坐标轴上下限
2016年6月2日
1.names()输出名称
2.unique（）去掉重复的名称
问题：
3.paste函数、jpeg函数？
4.str函数可证实载入的数据是否是所需要的
5.read.table函数的dec选项的作用？
6.小数点或逗号分隔符的使用；
7.detach函数，取消数据框的绑定
8.访问数据框的变量的方法
9.cor的作用：计算相似度 cov：协方差
10.options
11.help.start（）开启帮助文档
12.summary()可以查看对象的基本信息（min, max, mean, etc.）
13.对有序因子和无序因子的解释：（网页上面找的）
因子是一种向量对象，它给自己的组件指定了一个离散的分类（分组），它的组件由其他等长的向量组成。R提供了有序因子和无序因子。
通俗点说，因子就是将对象的值分成不同的组（levels）。
用函数factor()创建一个因子，levels按序排列(字母序或数值序)。
例如province<-c("四川","湖南","江苏","四川","四川","四川","湖南","江苏","湖南","江苏")，为province创建因子：
> pf<-factor(province) 创建province的因子pf
> pf 打印出来
[1] 四川湖南江苏四川四川四川湖南江苏湖南江苏
Levels: 湖南江苏四川
函数levels()可以用来观察因子中有多少不同的levels。
假如我们拥有这些省份考生的分数：
> score<-c(95,86,84,92,84,79,86,99,85,90)
函数tappley()可以用来计算各省的平均分数，函数tapply()的作用是对它第一个参数的组件中所包含的每个组应用一个参数三指定的函数。
> smeans<-tapply(score,pf,mean)
> smeans
湖南江苏四川
85.66667 91.00000 87.50000
再例如，下面命令会给出各组的length
> tapply(score,pf,length)
湖南江苏四川
3 3 4
函数ordered()可以创建有序因子
> ordered(province)
[1] 四川湖南江苏四川四川四川湖南江苏湖南江苏
Levels: 湖南 < 江苏 < 四川

0 0