R Api

来源：互联网发布：Linux aria2 下载出错编辑：程序博客网时间：2024/05/21 07:54

sum(x, na.rm = TRUE)

na.omit() 删除不完整的观测（na jiqu）

date() Sys.Date()  as.Date(c("2007-06-22"), "%Y-%m-%d")

today <- Sys.Date() format(today, format="%B %d %Y") format(today, format="%A")

difftime(today, dob, units="weeks") strDates <- as.character(dates)

order(-age) 排序

数据集合并 merge(A, B, by="ID" c("ID", "Country"))

横向合并 cbind(A,B) A,B same row

纵向合并 rbind(A,B) A,B same col

paste("q","1:5",sep="")   names(l) %in% c("q3", "q4")  newdata <- leadership[!myvars]

subset(l, condition<20, select=cols)   l[which(condition), cols]

mysample <- l[sample(1:nrow(l), 3, replace=FALSE)]

install.packages("sqldf") sqldf("", row.names=TRUE)

mean(x, trim = 0.05, na.rm=TRUE<span style="font-family: Arial, Helvetica, sans-serif;">)</span>

<span style="font-family: Arial, Helvetica, sans-serif;">mean() Median() sd(x) var(x)  diff(x, lag=n)  scale(x, center=TRUE, scale=TRUE) 中心化 标准化</span>

<span style="font-family: Arial, Helvetica, sans-serif;">newdata <- transform(mydata, myvar = scale(myvar) * 10 + 50)  均值50 方差 10 标准化</span>

<span style="font-family: Arial, Helvetica, sans-serif;">beta binom 二项分布 cauchy chisq (非中心)卡方分布 exp 指数分布 f F分布   gamma Gamma分布  geom 几何分布  hyper 超几何分布 lnorm 对数正态分布</span>

<span style="font-family: Arial, Helvetica, sans-serif;">logis Logistic分布  multinom 多项分布 nbinom负二项分布 norm 正态分布  pois 泊松分布  signrank  Wilcoxon符号秩分布 t t分布 unif 均匀分布 weibull Weifull分布</span>

<span style="font-family: Arial, Helvetica, sans-serif;">wilcox Wilcoxon秩和分布</span>

d:密度分布density  p: 分布函数distribution function q 分位数函数 quantile  r 生成随机数（随机偏差） norm

pretty(c(-3,3), 30) 生成（-3,3）30个数 -3， -2.8.。2.8,3 30个数  y<-dnorm(x) plot(x,y, type="l", xlab="", ylab="", yaxs="i")

rnorm(50, mean=50, sd=10) 生成50个均值为50 方差为10的数

qnorm(.9, mean=500, sd=100)  均值500，方差100,0.9的分位数

pnorm(1.96) 标准分布 1.96左侧面积

runif(5) 生成5个0~1的均匀分布

mvrnorm(n, mean, sigma)  协方差矩阵sigma  mydata<- as.data.frame(mydata)

dim(data) 行数 列数  head(data, n=10) 取前10行

sigma<-matrix(c(), nrow=3, ncol=3)

grep(pattern, x, ignore.case=FALSE, fixed = FALSE)   fixed=TRUE pattern是一个字符串  fixed=FALSE pattern是一个正则表达式  返回值为匹配的下标

sub（pattern, replacement, x, ignore.case=FALSE, fixed=FALSE) 在xz中搜索pattern并以replacement替换

strsplit(x, split, fixed=FALSE) unlist(y)[2]  snapply(y, "[", 2)

paste(.., sep="") paste("x", 1:3, sep="") c("x1", "x2", "x3")

toupper() tolower()

seq(from, to, by) 生成序列

rep(x, n) 重复x n次

cut（x, n） 将连续型变量x分割为有着n个水平的因子

cat(...,file="myfile", append=FALSE) 连接。。并输出至myfile中

apply(x, MARGIN, FUN) MARGIN=1 行 MARGIN=2列  apply(x, MAGGIN, mean, trim=0.2)  矩阵 数组 数据框

lapply() snapply() 应用在列表上

switch(i,

  key1 = "I am",

  key2 = "test" ,

  cat(i, "is not a recognized type\n")

t(cars) 矩阵或数据框转置

reshape melt(mydata, id=c("id", "time")) cast(md, formula, FUN)  formula ~  rowvar1+rowvar2~colvar1+colvar2

0 0