R统计笔记(三):分组统计的几种方法
来源:互联网 发布:淘宝刷cf英雄级武器吗 编辑:程序博客网 时间:2024/06/07 02:58
1. 使用tapply函数
# INDEX相当于groupBytapply(salarys$SALARY, INDEX=salarys$SEX, FUN=sum)
如果出现参数的长度不一致的错误,如下:
Error in tapply(salarys$SALARY, INDEX = salarys$SEX, FUN = max) : 参数的长度必需相同
请仔细检查salarys
# 对数据进行处理,返回LISTsalarys$SEX <- lapply(salarys$SEX, function(x) switch(x, FEMALE='女', MALE='男'))# 返回向量salarys$SEX <- c(salarys$SEX, recursive = TRUE)
2. 使用by函数
使用by函数可以达到同样的效果,唯一需要注意的是,引用的数据必须全是数据列,例如在本例中,数据最多也只能是salarys[c(‘SALARY’, ‘ID’)]。
by(salarys[c('SALARY')], INDICES = list(salarys$SEX), FUN=max)
3. 使用aggregate函数
aggregate(x=salarys[c('SALARY')], by = list(salarys$SEX, salarys$ID), FUN=max)
聚合函数与group by更相似,例如以上语句就表示按SEX、ID进行分组,结果如下:
Group.1 Group.2 SALARY1 男 1 300002 男 2 2003 女 3 12004 女 4 3500
从以上的数据可以看出,分组的唯一性由(SEX,ID)决定,所以跟SQL一模一样。
阅读全文
0 0
- R统计笔记(三):分组统计的几种方法
- R 语言的分组统计
- R语言-分组统计
- 统计学习的几种方法
- 时间统计的几种方法
- 几种统计字符串个数的方法
- lucene实现分组统计的方法
- pandas python 分组统计的方法
- solr 的分组统计
- (R语言)R的统计模型
- R统计笔记(五):数据对象之间的转换
- 统计学习方法笔记(三)
- R统计笔记(一):获取统计数据
- R之分组计算描述性统计统计量
- 分组统计方法:用GroupBy
- 指定区间的素数统计的几种方法
- 闲谈GDP(4)-GDP统计的几种方法
- 闲谈GDP(4)-GDP统计的几种方法
- Freeline体验
- Linux Command Line and....ch5(理解shell)
- 交互设计师眼中的需求分析
- 2017年6月11日工作日志
- 40行代码的人脸识别实践
- R统计笔记(三):分组统计的几种方法
- linux下获得所有主机通信的ip包
- 记录一下ES6扩展运算符(三点运算符)...的用法
- ns3之节点默认使用的路由协议
- qt各个版本直接下载地址
- AndroidStudio2.2-2.3安装不了anko-plugin的解决方式
- Harris角点检测原理
- 非负矩阵分解(NMF)
- SpingBoot之旅(一)——从一个简单的Demo入手