Hadoop-2.3.0学习(1)——伪分布式搭建

来源:互联网 发布:淘宝的唐麦耳机怎么样 编辑:程序博客网 时间:2024/06/13 23:25
第一步,下载hadoop(注意:如果没有配置java,左上角后退参见博客java配置)
hadoop下载地址:

http://www.apache.org/dyn/closer.cgi/hadoop/core/


第二步,安装ssh,设置免密码登陆:

$ sudo apt-get install ssh

安装完成后,需要确认可以用ssh免密码登录localhost
$ ssh localhost
如果需要密码才能登录,则需要:
进入~/.ssh/目录下,将id_rsa.pub追加到authorized_keys授权文件中,开始是没有authorized_keys文件的。

(也可以:$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys


第三步,安装rsync

$ sudo apt-get install rsync


第四步,修改配置文件

1.解压:
$ tar -zxvf  hadoop-1.0.3.tar.gz


2.设置JAVA_HOME。

先找到hadoop-env.sh(我的在~/hadoop-2.3.0/etc/hadoop/下),对其进行编辑:

# export JAVA_HOME={JAVA_HOME}
修改为:
export JAVA_HOME=/usr/lib/jvm/java-7-sun(jdk所在路径)



3.修改一系列配置文件:

留在上一条目录,继续修改。

修改conf/core-site.xml:

<configuration><property><name>fs.default.name</name><value>hdfs://localhost:9000</value></property></configuration>


修改conf/hdfs-site.xml:
<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>hadoop.tmp.dir</name><value>/home/work/hadoop_tmp</value></property></configuration>


修改conf/mapred-site.xml.template:
<configuration><property><name>mapred.job.tracker</name><value>localhost:9001</value></property></configuration>


第五步,启动hadoop

1.进入/home/hadoop-2.3.0/bin/,初始化hadoop Namenode:
$bin/
hadoop namenode -format

2.启动:.../sbin$ start-all.sh

3.确认启动:jps





0 0