hive中 join与where

来源:互联网 发布:mate8新机如何连接网络 编辑:程序博客网 时间:2024/05/19 12:41

HiveQL与标准SQL的区别:

陷阱1:

SELECT * FROM first_table t1JION second_table t2ON t1.id = t2.idwhere t1.date = "2016-06-01"

在hive里面,没有SQL优化器,则这样些的后果是,直接将t1表与t2表全量连接,产生大量的MapReduce操作再进行过滤

正确写法:

SELECT * FROM (SELECT *FROM first_tableWHERE date = "2016-06-01")t1JOIN second_table t2ON t1.id = t2.id;


0 0
原创粉丝点击