Hadoop集群搭建文档

来源:互联网 发布:网络安全措施 编辑:程序博客网 时间:2024/06/05 07:44

Hadoop集群搭建文档
以下为本文介绍目录:

1.环境搭建2.常见安装问题以及解决思路

环境

Linux系统 Ubuntu12.0.4 64 bit JDK jdk-linux-i586.tar.gz Hadoop hadoop-1.2.1.tar.gz

一.环境搭建:

1.安装完成Ubuntu12.0.4,需要安装JDK,(注意:安装JDK需要处理一些其他问题,JDK必须是Linux版本的,还有就是JDK要和操作系统的位数相符合,比如32位、64位都有对应的安装包):JDk的安装路径,我直接解压到/opt/jdk这个目录下;

2.安装完JDK需要配置环境变量,具体如下截图所示: 需要修改两个地方/etc/environment 和 /etc/profile文件;
这里写图片描述
这里写图片描述

3.由于Ubuntu中一般安装有默认的JDK,如openjdk,所以,为了使默认使用的是我们安装的jdk,还要进行如下工作。

//设置java对应的版本sudo update-alternatives --install /usr/bin/java java /opt/jdk/jdk1.7.0_17/bin/java 300sudo update-alternatives --install /usr/bin/javac javac/opt/jdk/jdk1.7.0_17/bin/javac 300

4.在终端输入

java –version / javac

测试安装JDK是否成功;
这里写图片描述

5.每当Ubuntu安装成功时,我们的机器名都默认为:Ubuntu,但为了以后集群中能够容易分辨各台服务器,需要给每台机器取个不同的名字。机器名由 /etc/hostname文件决定。输入此命令,在打开的文件中修改机器名,我的机器名是Master;

6 先关闭防火墙

sudo service iptables stop或者 sudo ufw disable

安装SSH服务,实现无密码登陆;

sudo apt-get install ssh openssh-server 

安装完成SSH后,可以查看SSH是否启动等;
这里写图片描述

7.安装SSH服务完成后就需要配置无密码登录,具体如下图所示:
这里写图片描述
进入安装目录:
这里写图片描述
刚开始可能没有authorized_keys和known_hosts文件,需要执行该命令;将产生的公钥加入到该文件中,可以打开看id_rsa.pub文件:
这里写图片描述
有关ssh公钥与密钥的具体问题可以百度;执行如下命令将authorized_keys文件分发给其他节点;注意每个节点都需要生成公钥,然后将三个节点的公钥合并在一个文件中,三个节点的authorized_keys必须一致。如下图所示:
这里写图片描述
注意文件的权限修改有可能导致ssh无密码登录配置失效,此处修改文件需要慎重;配置完成后就可实现无密码登陆;如下图所示:
这里写图片描述

8.安装hadoop,安装包拷贝到安装目录下
将安装包解压到该目录;执行如下命令:

tar -zxvf hadoop-1.2.1.tar.gz

9.安装完成后,需要配置hadoop,具体操作如下所示:需要修改的文件都在/opt/hadoop/hadoop-0.20.2/conf/目录下.

10.修改hadoop-env.sh文件:
这里写图片描述
加入JDK的路径;

11.修改core-site.xml:
这里写图片描述

12.修改hdfs-site.xml:
这里写图片描述

13.修改mapred-site.xml:
这里写图片描述

14.配置masters文件:
这里写图片描述
节点机上需要配置Slaves文件,与该文件类似;

15.此时已完成hadoop配置;

16.在虚拟机的Manager-Clone中克隆新的节点,也可以不克隆,自己安装,安装完成需要将Master中的JDK、hadoop的文件拷贝过去。

17.我采用的是分布式;一个电脑安装了一个虚拟机做为Master,另外一个电脑安装了虚拟机,在虚拟机上安装的两个Ubuntu,即该机器模拟了两个节点,此实验需要三个节点。

机器名 ip地址 Master 10.18.12.47 Slave1 10.18.12.48 Slave2 10.18.12.254

18.虚拟机之间需要能ping通;此结果代表可以ping通;
这里写图片描述

19.做完所有的准备工作现在就可以启动hadoop集群,执行命令如下:
这里写图片描述
启动:
这里写图片描述

20.查看集群是否启动;
Master节点
这里写图片描述
Slave1节点
这里写图片描述
Slave2节点
这里写图片描述

21.也可以用该命令查看:
这里写图片描述

22.通过jsp页面查看:hTTP://master:50030
http://master:50070

这里写图片描述

这里写图片描述

23.至此关于集群搭建结束。

二.常见问题及解决思路

1.当重复多次安装时,务必将之前安装目录下namenode目录删除,否则可能出现文件系统序列号不一致的问题。

2.记得实验环境下,最好关闭本机防火墙,因为涉及到ssh远程登录访问的问题。

3.出现问题时,如果以上2个思路仍然不能解决问题时,我们需要到hadoop安装目录下找到log日志,在这里你可以看到所有节点上进程启动的信息,将找到的对应的错误信息baidu一下,基本可以找到解决方案。

原创粉丝点击