R Api

来源:互联网 发布:Linux aria2 下载出错 编辑:程序博客网 时间:2024/05/21 07:54
sum(x, na.rm = TRUE)
na.omit() 删除不完整的观测(na jiqu)
date() Sys.Date()  as.Date(c("2007-06-22"), "%Y-%m-%d")
today <- Sys.Date() format(today, format="%B %d %Y") format(today, format="%A") 
difftime(today, dob, units="weeks") strDates <- as.character(dates)
order(-age) 排序
数据集合并 merge(A, B, by="ID" c("ID", "Country"))
横向合并 cbind(A,B) A,B same row
纵向合并 rbind(A,B) A,B same col
paste("q","1:5",sep="")   names(l) %in% c("q3", "q4")  newdata <- leadership[!myvars]
subset(l, condition<20, select=cols)   l[which(condition), cols]
mysample <- l[sample(1:nrow(l), 3, replace=FALSE)]
install.packages("sqldf") sqldf("", row.names=TRUE)
mean(x, trim = 0.05, na.rm=TRUE<span style="font-family: Arial, Helvetica, sans-serif;">)</span>
<span style="font-family: Arial, Helvetica, sans-serif;">mean() Median() sd(x) var(x)  diff(x, lag=n)  scale(x, center=TRUE, scale=TRUE) 中心化 标准化</span>
<span style="font-family: Arial, Helvetica, sans-serif;">newdata <- transform(mydata, myvar = scale(myvar) * 10 + 50)  均值50 方差 10 标准化</span>
<span style="font-family: Arial, Helvetica, sans-serif;">beta binom 二项分布 cauchy chisq (非中心)卡方分布 exp 指数分布 f F分布   gamma Gamma分布  geom 几何分布  hyper 超几何分布 lnorm 对数正态分布</span>
<span style="font-family: Arial, Helvetica, sans-serif;">logis Logistic分布  multinom 多项分布 nbinom负二项分布 norm 正态分布  pois 泊松分布  signrank  Wilcoxon符号秩分布 t t分布 unif 均匀分布 weibull Weifull分布</span>
<span style="font-family: Arial, Helvetica, sans-serif;">wilcox Wilcoxon秩和分布</span>
d:密度分布density  p: 分布函数distribution function q 分位数函数 quantile  r 生成随机数(随机偏差) norm
pretty(c(-3,3), 30) 生成(-3,3)30个数 -3, -2.8.。2.8,3 30个数  y<-dnorm(x) plot(x,y, type="l", xlab="", ylab="", yaxs="i")
rnorm(50, mean=50, sd=10) 生成50个均值为50 方差为10的数
qnorm(.9, mean=500, sd=100)  均值500,方差100,0.9的分位数
pnorm(1.96) 标准分布 1.96左侧面积
runif(5) 生成5个0~1的均匀分布
mvrnorm(n, mean, sigma)  协方差矩阵sigma  mydata<- as.data.frame(mydata)
dim(data) 行数 列数  head(data, n=10) 取前10行
sigma<-matrix(c(), nrow=3, ncol=3)
grep(pattern, x, ignore.case=FALSE, fixed = FALSE)   fixed=TRUE pattern是一个字符串  fixed=FALSE pattern是一个正则表达式  返回值为匹配的下标 
sub(pattern, replacement, x, ignore.case=FALSE, fixed=FALSE) 在xz中搜索pattern并以replacement替换
strsplit(x, split, fixed=FALSE) unlist(y)[2]  snapply(y, "[", 2)
paste(.., sep="") paste("x", 1:3, sep="") c("x1", "x2", "x3")
toupper() tolower()
seq(from, to, by) 生成序列
rep(x, n) 重复x n次
cut(x, n) 将连续型变量x分割为有着n个水平的因子
cat(...,file="myfile", append=FALSE) 连接。。并输出至myfile中
apply(x, MARGIN, FUN) MARGIN=1 行 MARGIN=2列  apply(x, MAGGIN, mean, trim=0.2)  矩阵 数组 数据框
lapply() snapply() 应用在列表上
switch(i, 
  key1 = "I am",
  key2 = "test" ,
  cat(i, "is not a recognized type\n")
)
t(cars) 矩阵或数据框转置
reshape melt(mydata, id=c("id", "time")) cast(md, formula, FUN)  formula ~  rowvar1+rowvar2~colvar1+colvar2
                                             
0 0
原创粉丝点击