R之基本统计分析

来源：互联网发布：java开源的wiki系统编辑：程序博客网时间：2024/05/21 11:07

此博客主要评述用于生成基本的描述性统计量和推断统计量的R函数。

描述性统计分析：关注对连续型变量的中心趋势、变化性和分布形状的分析。
1.用summary（）函数来获取描述性统计变量
将得到最小值，最大值，四分位数和数值型变量的均值，以及因子向量和逻辑型向量的频数统计，结合apply（）和sapply（）函数计算所选择的任一描述性统计量。
扩展：
Hmisc包中的describe（）函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数以及五个最大的值和五个最小的值

library("Hmisc")vars <- c("mpg","hp","wt")describe(mtcars[vars])a <- describe(mtcars[vars])#通过a$来获取结果a$counts[1] 即为观测数量的值

pastecs包中有一个名为stat.desc（）函数，它可以计算种类繁多的描述性统计量，其格式为：

stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)

其中x是一个数据框或时间序列，若basic=TRUE（默认值），则计算其中所有值、空值、缺失值的数量，以及最小值、最大值、值域、还有总和，还有总和。若desc=TRUE（同样也是默认值），则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。最后，若norm=TRUE（不是默认的），则返回正态分布统计量，包括偏度和峰度（以及它们的统计显著程度）和Shapiro-Wilk正态检验结果。这里使用了p值来计算平均数的置信区间（默认置信度为0.95）

psych包

0 0