HIVE 小技巧

来源:互联网 发布:8080端口是tcp还是udp 编辑:程序博客网 时间:2024/05/22 11:03

1.hive 从虚拟表查询多行记录。

在初始化特定数据的时候,可以作为一个子查询表做关联动作。

SELECT explode(ARRAY(1,2,3)) FROM dual;

2.hive 的join 的优化

在关联表的时候,为了让查询更有效率,我们应该保证连续的查询的表的大小从左往右是依次增加的,使用了/*+STREAMTABLE(S)*/ 将直接告诉查询优化器那张表是大表,S表就是大表。

SELECT/*+STREAMTABLE(S)*/ s.ymd,s.symbol,s.price_close,d.dividend FROM  stocks JOIN dividends d ON s.ymd AND s.symbol = d.symbol WHERE s.symbol


0 0