大数据Spark “蘑菇云”行动第100课:Hive性能调优之企业级Join、MapJoin、GroupBy、Count、数据倾斜彻底解密和最佳实践

来源:互联网 发布:淘宝店铺过户近亲属 编辑:程序博客网 时间:2024/04/26 07:31

大数据Spark “蘑菇云”行动第100课:Hive性能调优之企业级Join、MapJoin、GroupBy、Count、数据倾斜彻底解密和最佳实践



 hive.mapjoin.smalltable.filesize=25000000 
hive.mapjoin.followby.gby.localtask.max.memory.usage; 默认值:0.55

 hive.map.aggr=true 

0 0
原创粉丝点击