spark-troubleshooting-网卡流量激增问题
来源:互联网 发布:知峰保暖内衣价格 编辑:程序博客网 时间:2024/05/16 05:03
最近做大数据项目过程中,发现在集群上某个节点从第三方ftp服务器下载日志数据的时候,网络突然变慢,从5M降到1M左右,但是通过与运维沟通发现网络流量一直在满负荷传输,
与第三方反复沟通,发现两方服务器的配置完全正常,后来细心排查发现,原因是从hdfs读取数据的脚本以及spark使用client模式的任务占用大量的带宽
所以在spark生产环境最好采用cluster模式
原理分析:
使用了client模式后,Driver 启动在本地机器 Driver全权负责所在任务的调度的,跟yarn集群上运行的多个executor进行频繁的通信,中间有task的启动消息 task的执行 统计 task的运行状态 shuffle的输出结果,网络负载非常高,导致本地机器的网卡流量激增。
而使用了yarn-cluster模式后,yarn选择在集群中某个节点运行Driver,负责task调度,而本地机器只做提交动作
阅读全文
0 0
- spark-troubleshooting-网卡流量激增问题
- Spark-troubleshooting-yarn-client模式导致的网卡流量激增问题
- spark troubleshooting--yarn-client模式导致的网卡流量激增问题
- troubleshooting之解决yarn-client模式导致的网卡流量激增问题
- Spark TroubleShooting
- Spark优化-troubleshooting 解决算子函数返回NULL导致问题
- spark troubleshooting--算子函数返回NULL导致问题
- spark-troubleshooting-OOM
- spark-troubleshooting-常用问题解决
- 专家:数据业务激增带来挑战 三策略破解流量困局
- 应对流量激增——ANS有妙招!
- Spark优化-troubleshooting-解决yarn-cluster模式的JVM栈内存溢出问题
- spark troubleshooting--解决yarn-cluster模式的JVM栈内存溢出问题
- 查看网卡当前流量
- 查看网卡流量
- iftop 监控 网卡流量
- 监控网卡实时流量
- VC获取网卡流量
- 安卓自定义View基础——颜色
- POI 实现word和html互转
- MediaPlayer代码分析(2)-处理返回机制Notify
- 常用的设计模式及例子(三)
- 如何抽取一个通用的Android Loading页面快速实现加载功能
- spark-troubleshooting-网卡流量激增问题
- SwitchButton按钮效果
- Is Subsequence
- centos 7 docker 使用填坑
- C++使用OpenSSL证书API
- 解决ajax浏览器历史状态管理
- Android通讯录模糊查询搜索(号码,姓名,首字母简拼,全拼),批量选取联系人
- android 广播个人总结
- 限制input输入类型(多种方式实现)