Hive Join的几种方式
来源:互联网 发布:nginx 反向代理403 编辑:程序博客网 时间:2024/04/29 18:12
下面实验几种hive中常用到的join操作
首先创建两个文件用于导入表中
hadoop@master:~/17$ cat data11,a2,b3,c4,d5,e8,u9,r
hadoop@master:~/17$ cat data21,aa2,gg7,www19,ee
实验步骤:
1.创建hive表create table a(id int, name string) row format delimited fields terminated by ',';create table b(id int, name string) row format delimited fields terminated by ',';
2.导入数据load data local inpath '/home/hadoop/17/data1' into table a;load data local inpath '/home/hadoop/17/data2' into table b;
备注:
如果导入的文件有空行的情况,就会出现为NULL的行,判断条件为int用is NULL或者is not NULL判断,string 类型用='NULL'或者!='NULL'来判断
如果想把为NULL的行删除,可以这样
insert overwrite table a select * from a where id is not NULL;
3.inner join hive> select * from a inner join b on a.id=b.id;1a1aa2b2gg
4.left joinhive> select * from a left join b on a.id = b.id;1a1aa2b2gg3cNULLNULL4dNULLNULL5eNULLNULL8uNULLNULL9rNULLNULL
备注:左连接就是保留全部左表,连接on条件下的部分右表
5.right joinhive> select * from a right join b on a.id = b.id;1a1aa2b2ggNULLNULL7wwwNULLNULL19ee
备注:右连接就是保留全部右表,连接on条件下的部分左表
6.full outer joinhive> select * from a full outer join b on a.id = b.id;1a1aa2b2gg3cNULLNULL4dNULLNULL5eNULLNULLNULLNULL7www8uNULLNULL9rNULLNULLNULLNULL19ee
全连接:就是全部保留左右表
备注:left outer join 和 left join本质上是一个东西,同理于right outer join和right join
7.left semi joinhive> select * from a left semi join b on a.id = b.id;1a2b备注:left semi join相当于是in的操作
0 0
- Hive Join的几种方式
- Hive的三种Join方式
- Hive的三种Join方式
- Hive的三种Join方式
- Hive中join的三种方式
- Hive的三种join方式
- SQL JOIN 连接的几种方式
- MySQL数据库join的几种方式
- 浅谈MapRuduce的几种Join方式
- 一目了然的几种join方式举例
- MYSQL 的几种join连接方式
- java连接Hive的几种方式
- Hive 参数设置 的几种方式
- Hive创建表的几种方式
- hive导出数据的几种方式
- Hive客户端调用的几种方式
- hive入门学习:join的三种优化方式
- 几种 hive join 类型简介
- maven jetty9.2 插件使用
- 石子归并 动态规划 递归&递推
- 纯真IP数据库导入 MS SQL SERVER
- 它比吸二手烟还可怕,却是孩子的最爱吃的东西
- 3.12 12!配对
- Hive Join的几种方式
- .Net MVC框架使用ajax做局部刷新
- Android实验任务——打招呼
- L2-005. 集合相似度
- JZOJ 3.18 1510——【普及模拟】剪草
- 461. Hamming Distance
- 【普及模拟】数列 (jzoj)
- API文档
- Select2练习