hive中按照一个字段的区间进行统计
来源:互联网 发布:淘宝嘉年华怎么报名 编辑:程序博客网 时间:2024/05/18 21:40
1. question
给定一个hive表tmp,表中有一个字段result(double型);给定一个区间分类个数m,统计每个区间内的count(*)
的数量。
2. answer
在linux终端下,
# step1 设定区间分类个数,此处设置为10m=10# step2 求解字段 result 的最大值和最小值section=`hive -e "select max(result) as max_num, min(result) as min_numfrom tmp"`max_num=`echo -e "${section}" | cut -f1`min_num=`echo -e "${section}" | cut -f2`# step3 求解区间的长度len_section=`hive -e "select (${max_num} - ${min_num}) / ${m}from dual"`# step4 统计每个区间的个数hive -e "select ${min_num} + floor((result - ${min_num}) / ${len_section}) * ${len_section} as section_flag, count(*) as num from tmp"
最后的运行结果
0.0 11970.1 15870.2 14950.3 9810.4 10740.5 9470.6 4240.7 1730.8 1140.9 591.0 2
0 0
- hive中按照一个字段的区间进行统计
- Sqlserver 如何对一个字段的不同值进行统计
- mysql中按照多个字段进行排序
- SQL Server中按照时间进行分组统计
- Oracle 统计一个字段中某字符出现的次数
- MySQL按照月进行统计
- 按照列表中的某个字段的属性进行排序
- 按两个字段进行的分组统计
- 将一个对象集合按照对象的某个字段排序
- ORACLE 中 VARCHAR2 类型的字段长度是按照 byte 来定义的 一个容易被忽略的问题
- 解决Mysql数据库实现多表联合查询及按照其中一个字段进行排序问题
- 一个hive小案例:使用HIVE进行单词统计, 并把结果存入mysql
- php和mysql采用utf-8编码时实现按照一个文本字段的首字母的拼音顺序进行排序的方法
- lucene按照某个字段进行排序
- 对象列表按照某字段进行排序
- List集合按照日期字段进行排序
- List按照多个字段进行排序
- 练习5-17 增加字符段处理功能,以使得排序程序可以根据行内的不同字段进行排序,每个字段按照一个单独的选项集合进行排序
- JS全局变量和局部变量
- Android Studio 使用教程学习
- maven英文介绍
- js大发现
- 【SQL Server】触发器
- hive中按照一个字段的区间进行统计
- 点击提交以后,部分内容不可修改
- 数组和指针
- Machine Learning -- Linear Regression with Multiple Variables(Andrew Ng)
- 虚拟机ubuntu集群编译安装GROMACS(MPI版本)软件过程
- buntu安装MySql for Python的出错及解决
- 数据结构 的分类
- Android自定义电池控件
- Centos配置使用samba时出现的几个问题