R语言学习(六)

来源:互联网 发布:255hh的新域名网站 编辑:程序博客网 时间:2024/05/22 05:26

1.R语言中可以通过下面的方式生成频数表和级联表,对数据进行基本的统计以便观察

table(para1,para2,...):生成para1,para2的二维表,para1和para2通常为因子,即类别量,table的结果即为para1和para2不同取值情况下数据的个数,当然table函数的参数还可以为更多个,这样生成的就会为相应的高维表

xtabs(~para1+para2...):和table一样的功能

prop.table(table结果):生成table结果的百分比形式

addmargins(table结果):为table结果添加统计和

2.rep(数据,each=每个数据元素重复的次数,times=次数,len=长度,length.out=.....):按照函数中相应参数的要求重复数据,如:

rep(c(1,2,3),times=2.lem=3)        1,2,3

rep(c(1,2,3),each=2,len=3)       1,1,2

each和times都规定了重复次数,只不过重复的顺序不同而已,each规定每个数据元素达到重复次数后再进行下一个数据元素的重复,而times是将所有的数据元素作为一个整体进行重复,如rep(c(1,2),each=2)   1,1,2,2   rep(c(1,2),times=2)  1,2,1,2

此外,若length.out=NA,则参数len的设置不起任何作用

3.cov(x,y):x和y的协方差

4.cor(x,y,use=..,method=..):x和y的相关系数,其中use和method默认参数分别为everything,pearson,通常这两个参数一般不进行设置

5.pcor(c(para1,para2,控制条件),cov(数据)):偏相关,即在一定的控制条件下,求para1和para2的相关系数

6.对连续区间数值变量的检验:t检验

t.test(x,y,data=数据源):独立样本

with(数据源,t.test(x,y,paired=TRUE)):非独立样本

7.两个变量的独立性检验

chisq.test(table生成的二维表):卡方独立性检验

fisher.test(table生成的二维表):fisher精确性检验

上述两个方法的检验结果中若p值太小,说明两个变量不独立,否则,两个变量独立,当两个变量不独立时,则可以通过assocstats(table生成的二维表)检验两个变量的相关性



0 0
原创粉丝点击