大数据-Hadoop 启动 YARN
来源:互联网 发布:python用户手册 编辑:程序博客网 时间:2024/06/05 19:20
(伪分布式不启动 YARN 也可以,一般不会影响程序执行)
有的读者可能会疑惑,怎么启动 Hadoop 后,见不到书上所说的 JobTracker 和 TaskTracker,这是因为新版的 Hadoop 使用了新的 MapReduce 框架(MapReduce V2,也称为 YARN,Yet Another Resource Negotiator)。
YARN 是从 MapReduce 中分离出来的,负责资源管理与任务调度。YARN 运行于 MapReduce 之上,提供了高可用性、高扩展性,YARN 的更多介绍在此不展开,有兴趣的可查阅相关资料。
上述通过 ./sbin/start-dfs.sh
启动 Hadoop,仅仅是启动了 MapReduce 环境,我们可以启动 YARN ,让 YARN 来负责资源管理与任务调度。
首先修改配置文件 mapred-site.xml,这边需要先进行重命名:
- mv ./etc/hadoop/mapred-site.xml.template ./etc/hadoop/mapred-site.xml
然后再进行编辑,同样使用 gedit 编辑会比较方便些 gedit ./etc/hadoop/mapred-site.xml
:
- <configuration>
- <property>
- <name>mapreduce.framework.name</name>
- <value>yarn</value>
- </property>
- </configuration>
接着修改配置文件 yarn-site.xml:
- <configuration>
- <property>
- <name>yarn.nodemanager.aux-services</name>
- <value>mapreduce_shuffle</value>
- </property>
- </configuration>
然后就可以启动 YARN 了(需要先执行过 ./sbin/start-dfs.sh
):
- ./sbin/start-yarn.sh # 启动YARN
- ./sbin/mr-jobhistory-daemon.sh start historyserver # 开启历史服务器,才能在Web中查看任务运行情况
开启后通过 jps
查看,可以看到多了 NodeManager 和 ResourceManager 两个后台进程,如下图所示。
启动 YARN 之后,运行实例的方法还是一样的,仅仅是资源管理方式、任务调度不同。观察日志信息可以发现,不启用 YARN 时,是 “mapred.LocalJobRunner” 在跑任务,启用 YARN 之后,是 “mapred.YARNRunner” 在跑任务。启动 YARN 有个好处是可以通过 Web 界面查看任务的运行情况:http://localhost:8088/cluster,如下图所示。
但 YARN 主要是为集群提供更好的资源管理与任务调度,然而这在单机上体现不出价值,反而会使程序跑得稍慢些。因此在单机上是否开启 YARN 就看实际情况了。
如果不想启动 YARN,务必把配置文件 mapred-site.xml 重命名,改成 mapred-site.xml.template,需要用时改回来就行。否则在该配置文件存在,而未开启 YARN 的情况下,运行程序会提示 “Retrying connect to server: 0.0.0.0/0.0.0.0:8032” 的错误,这也是为何该配置文件初始文件名为 mapred-site.xml.template。
同样的,关闭 YARN 的脚本如下:
- ./sbin/stop-yarn.sh
- ./sbin/mr-jobhistory-daemon.sh stop historyserver
自此,你已经掌握 Hadoop 的配置和基本使用了。
- 大数据-Hadoop 启动 YARN
- Hadoop - YARN 启动流程
- Hadoop 启动 YARN
- 大数据hadoop学习之---Yarn 体系架…
- 大数据Hadoop Yarn 框架原理及运作机制_02_02
- 大数据学习7:Hadoop Yarn 的调优整理
- 大数据(三) - YARN
- 启动hadoop、yarn等服务
- 决胜Hadoop&Spark大数据时代:Hadoop&Yarn&Spark企业级最佳实践
- 大数据生态系统基础:Hadoop(七):Hadoop MapReduce 工作原理和 YARN架构
- 大数据组hadoop集群启动
- 大数据处理技术-基于Hadoop/Yarn的大数据技术实战
- 大数据之yarn体系结构
- 大数据(4)YARN
- 决胜大数据时代:Hadoop&Yarn&Spark企业级最佳实践(3天)
- 大数据学习笔记之二十九 Hadoop的第二代MapReduce YARN
- 大数据 (八)Hadoop-MapReduce 运行环境之 yarn环境搭建
- 互联网大数据框架介绍(一)Hadoop,HDFS,yarn,Mapreduce
- man 精讲
- 《道德经》第四十七章
- 分布式Dal
- java知识点
- 神经网络中的激活函数
- 大数据-Hadoop 启动 YARN
- 自动化工具Ansible:基于Jenkins+Ansible+GitLab的部署实践
- iOS 25个性能优化/内存优化常用方法
- php开启多线程下载
- 建立一个数组并比较他们的最值问题
- jsp常用核心标签实例
- logback配置示例
- POJ 2996 Help Me with the Game(模拟)
- java基础小知识