Hadoop2.x配置HA

来源：互联网发布：知识点归纳软件编辑：程序博客网时间：2024/04/29 20:07

各节点配置参考表

主机 NameNode DataNode Zookeeper ZKFC JournalNode ResourceManager NodeManager node1 1 1 1 1 node2 1 1 1 1 1 1 node3 1 1 1 1 node4 1 1 1

文件配置：
core-site.xml

    <property>        <name>hadoop.tmp.dir</name>        <value>/csh/hadoop/hadoop2.7.2/tmp</value>    </property>    <property>        <name>fs.defaultFS</name>        <value>hdfs://mycluster</value>    </property>    <property>        <name>dfs.journalnode.edits.dir</name>        <value>/csh/hadoop/hadoop2.7.2/journal</value>    </property>    <property>        <name>ha.zookeeper.quorum</name>        <value>node1:2181,node2:2181,node3:2181</value>    </property>

hdfs-site.xml

    <property>        <name>dfs.nameservices</name>        <value>mycluster</value>    </property>    <property>        <name>dfs.ha.namenodes.mycluster</name>        <value>nn1,nn2</value>    </property>    <property>        <name>dfs.namenode.rpc-address.mycluster.nn1</name>        <value>node1:8020</value>    </property>    <property>        <name>dfs.namenode.rpc-address.mycluster.nn2</name>        <value>node2:8020</value>    </property>    <property>        <name>dfs.namenode.http-address.mycluster.nn1</name>        <value>node1:50070</value>    </property>    <property>        <name>dfs.namenode.http-address.mycluster.nn2</name>        <value>node2:50070</value>    </property>    <property>        <name>dfs.namenode.shared.edits.dir</name>        <value>qjournal://node2:8485;node3:8485;node4:8485/mycluster</value>    </property>    <property>        <name>dfs.client.failover.proxy.provider.mycluster</name>        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>    </property>    <property>        <name>dfs.ha.fencing.methods</name>        <value>sshfence</value>    </property>    <property>        <name>dfs.ha.fencing.ssh.private-key-files</name>        <value>/root/.ssh/id_dsa</value>    </property>    <property>        <name>dfs.ha.fencing.ssh.connect-timeout</name>        <value>30000</value>    </property>mapred-site.xml    <property>        <name>mapreduce.framework.name</name>        <value>yarn</value>    </property>

yarn-site.xml

   <property>        <name>yarn.resourcemanager.hostname</name>        <value>node1</value>    </property>    <property>        <name>yarn.nodemanager.aux-services</name>        <value>mapreduce_shuffle</value>    </property>    <property>         <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>         <value>org.apache.hadoop.mapred.ShuffleHandler</value>    </property>

masters

node2

slaves

node2node3node4

启动

安装Zookeeper请看：Zookeeper安装以及集群搭建

1.启动 zookeeper（在node1，node2，node3中执行以下命令）
(在zookeeper/bin目录下)

./zkServer.sh start

通过以下命令检查是否启动成功

./zkServer.sh status

成功会显示以下数据

ZooKeeper JMX enabled by defaultUsing config: /csh/software/zookeeper-3.4.8/bin/../conf/zoo.cfgMode: follower //这里会有一个节点是：leader，其余2个节点是：follower

2.启动journalnode（在node1中执行以下命令）

./hadoop-daemons.sh start journalnode

在node2、node3、node4运行jps命令检查journalnode是否启动成功
成功会有出现

2601 JournalNode

3.格式化zkfc,让在zookeeper中生成ha节点（在node1中执行）

hdfs zkfc –formatZK

格式化成功后可以查看zookeeper得到

./zkCli.sh -server node1:2181[zk: node1:2181(CONNECTED) 0] ls /hadoop-ha[mycluster]

4.格式化hdfs（在node1中执行）

hadoop namenode –format

5.启动NameNode
先在node1上启动active结点（在node1中执行）

[root@node1 sbin]# hadoop-daemon.sh start namenode

在node2中同步namenode数据，同时启动standby的namenode

#把NameNode的数据同步到node2上  hdfs namenode –bootstrapStandby  #启动node2上的namenode作为standby  hadoop-daemon.sh start namenode

6.启动DataNode（在node1中执行）

./hadoop-daemons.sh start datanode

7.启动yarn
（在作为资源管理器上的机器上启动，我这里是node1,执行如下命令完成yarn的启动）

./start-yarn.sh

8.启动ZKFC（在node1、node2中分别执行）

hadoop-daemon.sh start zkfc

各节点的情况

//node117827 QuorumPeerMain18179 NameNode25431 Jps19195 ResourceManager19985 DFSZKFailoverController//node29088 QuorumPeerMain13250 Jps9171 JournalNode10360 NodeManager10985 DFSZKFailoverController9310 NameNode9950 DataNode//node37108 NodeManager7926 Jps6952 DataNode6699 JournalNode6622 QuorumPeerMain//node46337 JournalNode6755 NodeManager7574 Jps6603 DataNode

个人博客原文：
Hadoop2.x配置HA

0 0