ODPS数据倾斜导致的问题
来源:互联网 发布:tensorflow gpu配置 编辑:程序博客网 时间:2024/05/19 22:26
前面转自:https://help.aliyun.com/knowledge_detail/43141.html#MaxCompute的MapReduce报错FAILED: ODPS-0123144: Fuxi job failed - WorkerRestart
MaxCompute的MapReduce报错FAILED: ODPS-0123144: Fuxi job failed - WorkerRestart
问题现象
执行MapReduce或者UDF的时候,有如下报错:
FAILED: ODPS-0123144: Fuxi job failed - WorkerRestart errCode:252,errMsg:kInstanceMonitorTimeout, usually caused by bad udf performance.
Exception in thread "main" com.aliyun.odps.OdpsException: ODPS-0123144: Fuxi job failed - WorkerRestarterrCode:252,errMsg:kInstanceMonitorTimeout, usually caused by bad udf performance.
问题原因
这个问题是由于集群的Slave节点在计算的过程中出现了超时了,导致Master节点认为子节点死掉的报错。目前的超时时间为10分钟,暂时不支持用户配置。这个报错比较常见的原因是Reduce里做了大循环,比如是存在长尾数据或者做笛卡尔积。用户需要尽量减少这种大循环的情况。对于长尾数据,可以考虑拿出来单独处理。或者用户可以手工发心跳,调用context.progress(); 但是这个有性能问题,不适合调用太频繁。
案例分析
先用group by查看数据倾斜状况
例如 select devmac,merchantid,isencrypt,count(1) as num from wi_passer_flow_log where dt = '2016-08-02' group by devmac,merchantid,isencrypt order by num desc limit 50;
可以看到客流统计日志表2016-08-02分区,存在严重的数据倾斜–最多一天之中一台设备到达|认证|离开一家店铺的次数达到了45w条
解决
修改map或者reduce程序,过滤掉脏数据。
阅读全文
0 0
- ODPS数据倾斜导致的问题
- hive中join导致的数据倾斜问题排查
- hive的数据倾斜问题
- GPDB的数据倾斜问题
- Spark优化-数据倾斜解决方案 聚合源数据以及过滤导致倾斜的key
- spark 数据倾斜解决方案 (二)聚合源数据以及过滤导致倾斜的key
- spark的数据倾斜问题的解决
- spark中遇到的数据倾斜问题
- Hive数据倾斜问题
- spark 数据倾斜问题
- HIVE数据倾斜问题
- spark 数据倾斜问题
- hive数据倾斜问题
- 倾斜数据的处理
- hive调优 数据倾斜问题
- Hive数据倾斜问题总结
- Hive数据倾斜问题总结
- 让人头痛的大数据倾斜问题
- Arch配置和美化
- 阿里OTS表格存储单挑与批量多行插入--javaSDK
- C#窗体控件大小随窗体变化而变化的一种改进方法
- gradle 编译jar包+混淆
- 代码 Openblas 源码架构 和 调用过程
- ODPS数据倾斜导致的问题
- js通过读取外部的txt文件,给html的标签赋值
- Spring Aop 初探(2)
- 为何会发生java.util.ConcurrentModificationException?
- iOS开发——UITableView优化之缓存cell高度
- 【机器学习】Tensorflow概率编程:线性混合模型
- 从 JavaScript 到 TypeScript
- 学习硬解码视频过程(安卓)中参考的一些文档
- 阻止冒泡