pig JOIN 的replicated后标

来源:互联网 发布:润桐数据 编辑:程序博客网 时间:2024/06/04 19:48
PIG 在2个表JOIN的时候,如果使用Using 'replicated' 会将后面的表分段读到内存中,从而加快JOIN的效率。但是如果load 到内存的数据超过JVM的限制就会报错==>

java.lang.OutOfMemoryError: Java heap space 
0 0
原创粉丝点击