5-3 hadoop集群搭建

来源：互联网发布：js方法参数为对象编辑：程序博客网时间：2024/06/06 01:51

在我们伪分布式里面hdfs老大只有一个，现在，hdfs为了高可靠性，要有多个namenode【如果一个namenode死了之后，整个就瘫痪了】，进行实时切换，

hadoop2.0把namenode进行了一个抽象，变成了一个nameservice，在一个nameservice里面，有两个namenode。

但是，有两个namenode是不是得有个“人”来协调，否则要不都是active，要不都是stand by。这个协调就是zookeeper进行的一个选举，确保整个nameservice只有一个活跃的namenode。

zookeeper可以用来进行切换，把某个standby变成active

namenode的瓶颈是内存，无法存储千亿以上的数据，我们还可以通过水平扩展来解决，【即由一个nameservice变成了两个nameservice】，

hadoop保持高可靠性的原理

这个是hadoop保持高可靠性的原因：

一个namenode是active，另一个是stand by，他们的进程协调依赖ZK，每个namenode所在的机器都有一个JKFC【FaloverControler】，它给namenode发送指令，一个是切换，也要监控namenode的状态，一旦down掉之后，FC会把信息发送给ZooKeeper，另一个【右边一个】JKFC从ZK里面得到这个信息，它给namenode发送一个命令，让它从stand by切换到active状态。

总结：

在没有出现问题之前，在nameservice下面有两个namenode，活跃状态namenode会把edits写入到中间那个绿色的东西里【是什么忘了，叫介质】，实时同步到standby，一旦介质发生变化，stand by从里面读，FC会监控namenode的状态，将信息发送给ZK，而且ZK里面的信息是同步的，从另一边得到之后，给stand by发送指令，让他完成切换，因此，我的FC必须要依赖ZooKeeper

Hadoop在中间的介质里，一种是使用NFS【网络文件系统】，一种是使用jornal node，用来存放edits文件。

原理介绍清楚之后，开始搭建集群：

集群规划：
主机名 IP 安装的软件运行的进程
itcast01 192.168.1.201 jdk、hadoop NameNode、DFSZKFailoverController
itcast02 192.168.1.202 jdk、hadoop NameNode、DFSZKFailoverController
itcast03 192.168.1.203 jdk、hadoop ResourceManager
itcast04 192.168.1.204 jdk、hadoop、zookeeperDataNode、NodeManager、JournalNode、QuorumPeerMain
itcast05 192.168.1.205 jdk、hadoop、zookeeperDataNode、NodeManager、JournalNode、QuorumPeerMain
itcast06 192.168.1.206 jdk、hadoop、zookeeperDataNode、NodeManager、JournalNode、QuorumPeerMain