hadoop2.7.2安装部署教程

来源：互联网发布：迅雷9登录网络错误编辑：程序博客网时间：2024/05/24 15:37

参考博客：http://jingyan.baidu.com/article/f00622283a76c0fbd3f0c839.html

http://www.it165.net/admin/html/201404/2728.html

http://blog.csdn.net/caizhongda/article/details/7947480

1.配置命名服务：hdfs-site.xml

<name>dfs.nameservices</name>

<value>hearain</value>

</property>

<name>dfs.ha.namenodes.hearain</name>

</property>

<name>dfs.namenode.rpc-address.hearain.nn1</name>

<value>namenode1的地址：8020</value>

</property>

<name>dfs.namenode.rpc-address.hearain.nn2</name>

<value>namenode1的地址：8020</value>

</property>

<name>dfs.namenode.http-address.hearain.nn1</name>

<value>namenode1的地址：50070</value>

</property>

<name>dfs.namenode.http-address.hearain.nn2</name>

<value>namenode1的地址：50070</value>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://地址加端口，机器以分号相隔</value>

</property>

<name>dfs.client.failover.proxy.provider.hearain</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/hadoop/journal/data</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

2.配置core-site配置文件

<name>fs.defaultFS</name>

<value>hdfs://hearain(集群名字)</value>

</property>

<name>ha.zookeeper.quorum</name>

<value>集群地址加端口号，机器之间以逗号分隔node1:2181</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/hadoop/tmp/</value>

</property>

3.配置和安装zookeeper

tickTime=2000dataDir=/opt/zookeeper/tmp（若没有这个目录，则自己创建）clientPort=2181initLimit=5syncLimit=2server.1=node1:2888:3888server.2=node2:2888:3888server.3=node3:2888:3888

然后在相应的机器上创建myid文件，里面写上server后面带的相应的数字

4.分别在journal机器上启动

启动journalnode:

./hadoop-daemon.sh start journalnode

5.启动后在任意一台namenode机器上执行格式化(bin目录下)：

hostname node1

./hdfs namenode -format

6.启动刚格式化的namenode机器

./hadoop-daemon.sh start namenode

7.在没有格式化的namenode上去执行

./hdfs namenode -bootstrapStandby

8.运行./dfs-stop.sh

9.运行./dfs-start.sh

10.运行jps发现ZKFC没有启动，原因有可能是没有格式化

11.在其中一个namenode上面格式化ZKFC，在bin目录下执行

./hdfs zkfc -format

12.重新执行8和9即可

13.配置mapreduce的配置文件

<name>mapreduce.framework.name</name>

</property>

14.配置yarn的配置文件

<name>yarn.resourcemanager.hostname</name>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

15.开启resourcemanager和nodemanager命令：

./start-yarn.sh

namenode1:http://192.168.4.176:50070/dfshealth.html#tab-overview

namenode2:http://192.168.4.87:50070/dfshealth.html#tab-overview

集群：http://192.168.4.176:8088/cluster

jps查看是否都运行成功：如果其中一个进程运行失败，则去logs里面去查看详细日志

node1:

node2:

node3:

0 0