hive经典应用
来源:互联网 发布:mac os x10.10 iso 编辑:程序博客网 时间:2024/05/22 01:33
dual的构造
自己构造即可一个函数几个,在随后的select 测试 from dual;
前后两行求时间差
1.Hive row_number() 函数的高级用法 row_num 按照某个字段分区显示第几条数据
select imei,ts,fuel_instant,gps_longitude,gps_latitude,row_number() over (PARTITION BY imei ORDER BY ts ASC) as row_num from sample_data_2
2.row_num 是相互连续的,join 自身,然后时间相减可求差
create table obd_20140101 as
select a.imei,a.row_num,a.ts,COALESCE(unix_timestamp(a.ts, ‘yyyy-MM-dd HH:mm:ss.S‘), 0) - unix_timestamp(b.ts, ‘yyyy-MM-dd HH:mm:ss.S‘) as intervel ,a.fuel_instant,a.gps_speed as obd_speed,a.gps_status,a.gps_longitude,a.gps_latitude,a.direct_angle,a.obdspeed from obddata_20140101 a join obddata_20140101 b on a.imei = b.imei and a.row_num = b.row_num +1
分组排序求每个类别的TOP10
语法:row_number() over (partition by 字段a order by 计算项b desc ) rank
--这里rank是别名
partition by:类似hive的建表,分区的意思;
order by :排序,默认是升序,加desc降序;
这里按字段a分区,对计算项b进行降序排序
实例:
要取top10品牌,各品牌的top10渠道,各品牌的top10渠道中各渠道的top10档期
1、取top10品牌
select 品牌,count/sum/其它() as num
select
from
where
select
from
where
待续
- hive经典应用
- hive经典例子
- Hive总结(六)hive入门经典
- Hive总结(六)hive入门经典
- Hive总结(六)hive入门经典
- Hive深入应用总结
- Hive高级应用
- hbase+hive应用场景
- hive分析函数应用
- hive应用实例1
- HIVE 应用集锦摘录
- Hive高级应用
- Hive应用实例:WordCount
- hive over函数应用
- hbase+hive应用场景
- hive经典的入门流程操作
- 经典推荐 - hive编程指南[书签版]
- thrift在hive中的应用
- Arm汇编 位置无关代码 adr 指令
- 【C++】C++和Java的区别
- github上关于iOS的各种开源项目集合
- 面向对象之方法
- 设置虚拟内存
- hive经典应用
- 集合0921
- Maven本地仓库安装自定义JAR包
- NOIP提高组【JZOJ4799.】我的快乐时代
- Python中while和for的区别
- java程序的可移植性
- 浅谈200M光纤宽带
- Python简单知乎爬虫--爬取页面的图片并下载到本地
- 第三方支付SDK入门使用2