(二)配置hadoop-------安装配置hadoop并且设置ssh

来源:互联网 发布:数据采集费发票 编辑:程序博客网 时间:2024/05/02 00:48

(一)配置hadoop-------vm虚拟机中安装CentOS5.5,并且安装和配置jdk1.6

上面一文介绍了安装CentOS和JDK,现在接着安装和配置hadoop并且配置ssh。

step一、安装并并且配置hadoop。

1、下载hadoop。

连接:http://archive.apache.org/dist/hadoop/core/hadoop-0.20.0(这个地址时不时的抽风,偶尔还是可以打开的),我安装的是hadoop0.20.0版本,大约40M左右。

2、在/usr/java文件夹下新建文件夹命名为hadoop(名字随意啦),将下载好的hadoop-0.20.0.tar.gz拷贝到该文件夹下,右击解压到此文件夹,随后会生成一个叫做hadoop-0.20.0的文件夹。

3、cd 进入/usr/java/hadoop/hadoop-0.20.0/conf,配置Hadoop配置文件。


(1)配置java环境:修改Hadoop-env.sh文件:

cd 进入/usr/java/hadoop/hadoop-0.20.2/conf,执行命令:vim hadoop-env.sh

然后在打开的文件输入如下的内容:

#set java environment

export JAVA_HOME=/usr/java/jdk1.6.0_31


(2)配置Namenode的三个配置文件core-site.xml, hdfs-site.xml, mapred-site.xml。

 (2.1)配置core-site.xml:


(2.2)配置hdfs-site.xml:


(2.3)配置mapred-site.xml:


                                                                     

step二、SSH无密码验证配置:

hadoop需要使用SSH 协议。namenode 将使用SSH 协议启动 namenode和datanode 进程,配置 SSH localhost无密码验证。

(1)生成密钥对:

         输入命令:ssh-keygen  -t  dsa  -P  ‘’  -f  ~/.ssh/id_dsa

         以上命令将在/root/.ssh/ 目录下生成id_dsa私钥和id_rsa.pub公钥

(2)进入/root/.ssh目录在namenode节点下做如下配置:

         输入命令:cat  id_dsa.pub > authorized_keys

可以用键入ssh localhost命令来看已经连接:

         输入命令:ssh localhost

注意最后一行!跟第一行比较,发现我们用ssh进入到localhost了!但已不需要输入密码了。

step三、启动hadoop:

格式化namenode,cd 进入/usr/java/hadoop/hadoop-0.20.0文件夹下,输入命令:bin/hadoop namenode -format

step四、启动hadoop守护进程:

cd 进入/usr/java/hadoop/hadoop-0.20.0文件夹下,输入命令:bin/start-all.sh

cd 进入/usr/java/hadoop/hadoop-0.20.0/bin文件夹下,输入命令:jps,出现如下情况:

这就表示你配置成功了,上面的一个都不能少

这时候你就可以点击进入下面的网站了。

NameNode - http://localhost:50070/

JobTracker - http://localhost:50030/

到此,linux CentOS下hadoop伪分布模式的环境就搭建好了,完成此次搭建重点参考了如下连接,

介绍的相当详细:http://www.linuxidc.com/Linux/2011-07/37992.htm