HDP学习--YARN Component Failure

来源:互联网 发布:四糸乃cosplay淘宝网 编辑:程序博客网 时间:2024/05/16 16:58

一、YARN的故障

  即使完美的软件也会有故障, YARN 是为了减少停机时间,而不是组件故障。
这里写图片描述

二、 YARN Failure Monitoring Communication

  下图显示YARN中故障监控时, 各组件的通信来确保都存活的, 在故障发生时, 每个组件都有中重启机制。
这里写图片描述

三、修改Ambari中的故障检测行为

这里写图片描述

四、ResourceManager的设置检查

为了检查各组件是否存活, 定期巡检, 并处理故障组件。
这里写图片描述

五、NodeManager的检查设置

这里写图片描述

六、Container / Task and ApplicationMaster 的恢复

这里写图片描述

七、NodeManager and ResourceManager 的恢复

这里写图片描述

八、YARN Work-Preserving Restarts

这里写图片描述

YARN Work-Preserving Restarts 相关配置:

这里写图片描述

九、YARN Log Aggregation

  • Enabled by default in HDP 2.3
  • Enables long-term
  • storage of NodeManager logs by storing them in a central location in HDFS
    -Avoids the need to truncate logs in order to conserve space on a local file system
    -Provides ability to centrally view log files via a single web UI (the Job History Server)

YARN Log Aggregation 默认配置:

这里写图片描述

十、 知识回顾

这里写图片描述

十一、 总结

这里写图片描述

0 0
原创粉丝点击