hive理解streamtable使用
来源:互联网 发布:hadoop数据挖掘实例 编辑:程序博客网 时间:2024/05/29 11:51
今天看别人的博客,发现streamtable这个东西,作者描述是:
将大表放在JION的右边,这是就需要指定使用/*+ STREAMTABLE(..) */:
- hive> SELECT /*+ STREAMTABLE(b) */ a.val, b.val, c.val FROM a JOIN b
- > ON (a.key = b.key1) JOIN c将大表放在JION的右边,这是就需要指定使用/*+ STREAMTABLE(..) */:hive> SELECT /*+ STREAMTABLE(b) */ a.val, b.val, c.val FROM a JOIN b > ON (a.key = b.key1) JOIN c ON (c.key = b.key1) ON (c.key = b.key1)
有点懵懂,看完另一个哥们写的才若有所悟From my understanding, when you have the join happening in map or reduce, the values corresponding to a key from all all table's except one (if two tables are involved in join on same key, then just one table here) are buffered in memory and the left out one is streamed. Usually it is the largest table to be streamed, else the larger data can go into the memory(buffer) and create OOM errors.This stream table hint is used to specify which table to be streamed. By default it is the table that comes on the right is streamed and the other is buffered. But if you wan't other than right table to be streamed you go for this hint.If you are joining more tables on different keys, then for every join set just specify the larger table on the right of ON condition. No need of stream table hint here.
0 0
- hive理解streamtable使用
- hive的中streamtable 流式表简介.
- Hive join优化(mapjoin,streamtable)
- streamtable关键字
- hive mapjoin 使用 和个人理解
- hive mapjoin 使用 和个人理解
- HIVE理解
- smmu学习笔记之streamtable
- 深入理解 Hive
- Hive用户权限管理理解
- Hive用户权限管理理解
- hive的理解
- Hive使用
- hive 使用
- Hive 使用
- 使用Hive
- 理解Hive表(Hive Table)
- smmu学习笔记之streamtable 2
- Tuple:元组对象在.net中的实用
- 动态代理机制 invoke方法调用
- C# 打印整个窗体(不包括边栏)
- 制作一体化的安装包
- GIS制作地理底图/变化监测
- hive理解streamtable使用
- 云计算阅读笔记
- IOS判断版本之编译期和运行时
- c#派生类继承构造函数
- FLEX 与 .net wcf /web services通信
- Visual Studio源码管理器Team Foundation Service
- Visual Studio源码管理器Team Foundation Service
- 源代码管理:TFS
- 源代码管理:TFS