第143课: Spark面试经典系列之Reduce端OOM和shuffle file not found如何解决?
来源:互联网 发布:苏州天魂网络面试题 编辑:程序博客网 时间:2024/05/16 14:15
第143课: Spark面试经典系列之Reduce端OOM和shuffle file not found如何解决?
1 reduce端的OOM如何解决?
2 shuffle file not found如何解决?
reducer:默认堆大小为20%
cache:每个Task有缓存,缓存层的大小可以设置为24M,48M,96M。。。
reducer端 OOM的解决方案:
如原来是48M,分配的内存有限,会出现过多的对象,造成OOM,因此调小缓存大小,就改为24M,让程序先跑起来,但调小会造成shuffle的次数变多了,造成性能降低了。这个需后来再优化,慢慢再调,增加executor,加内存。
spark.reducer.maxSizeInFlight
单机版本的OOM,搞一个很大的数组集,就会造成oom,那把数组改小就可以了。
2 shuffle file not found如何解决?诡异,不太容易复现,可能遇到了gc,系统忙,没有理会拉文件。。spark.shuffle.io.maxRetries设置为3次,spark.shuffle.io.maxRetries每次5秒钟。15秒钟还没有拉掉数据,就会出现shuffle file notfound
shuffle file not found解决办法:调整这2个参数:
spark.shuffle.io.maxRetries 调大30次,或50次;
spark.shuffle.io.retryWait 设置30s 就象拜访一个人,他比较忙,那就多等一会儿。
如果15分钟还抓不到, 那就有问题了
0 0
- 第143课: Spark面试经典系列之Reduce端OOM和shuffle file not found如何解决?
- 第143课:Spark面试经典系列之Reduce端OOM和shuffle file not found如何解决
- 第137课: Spark面试经典系列之数据倾斜解决之Map 端Reduce及问题思考
- 第147课: Spark面试经典系列之Shuffle的性能调优问题
- 第147课:Spark面试经典系列之Shuffle的性能调优问题
- 第146课:Spark面试经典系列之Yarn Cluster生产环境下JVM的OOM和Stack Overflow问题
- 第138课: Spark面试经典系列之数据倾斜解决之采样分而治之解决方案
- Spark-troubleshooting-shuffle reduce端缓冲大小以避免OOM
- spark troubleshooting--shuffle reduce端缓冲大小以避免OOM
- 第139课: Spark面试经典系列之数据倾斜解决之对于两个RDD数据量都很大且倾斜的Key特别多如何解决?
- 第139课: Spark面试经典系列之数据倾斜解决之对于两个RDD数据量都很大且倾斜的Key特别多如何解决?
- 第142课: Spark面试经典系列之Cache和Checkpoint
- 第142课:Spark面试经典系列之Cache和Checkpoint
- 136课: Spark面试经典系列之数据倾斜解决原理和方法总论.
- 第140课: Spark面试经典系列之数据倾斜解决之并行度的深度使用
- 第135课: Spark面试经典系列之数据倾斜:数据倾斜是多么痛?!
- 第144课: Spark面试经典系列之NULL值问题及序列化错误
- 第135-141课:Spark面试经典系列之数据倾斜
- NYOJ 91 阶乘之和
- java生成任意随机值,字符,数字,其它的都有你来
- nyoj 6 喷水装置(一)
- 微信开发学习总结
- jQuery数组API【笔记】
- 第143课: Spark面试经典系列之Reduce端OOM和shuffle file not found如何解决?
- 浏览器内核的解析和对比
- UWP开发字符串编码格式问题-GBK/GB2312
- java绘制五环图形
- 快速排序(C语言实现)
- sublime text3的CSS格式化----HTML-CSS-JS Prettify
- 关于Spring的问题之Failed to read schema document
- CM13 安卓6.0.1编译教程(以小米4C为例)
- CCNU ACM 2016夏季集训·day3比赛