伪分布式安装Hadoop

来源:互联网 发布:ly51s单片机开发板 编辑:程序博客网 时间:2024/05/10 10:11

适用于只有一台电脑并且想学hadoop的用户。伪分布式可以使用户方便的学习hadoop。本文以ubuntu14.04和hadoop2.6.0为例介绍hadoop的伪分布式安装过程。

  1. 首先安装ssh和jdk。

  2. 下载hadoop2.6.0。

  3. 安装hadoop。首先创建Hadoop的文件夹,使用指令sudo mkdir /usr/local/hadoop ,将hadoop安装到该文件夹,使用指令tar -zxvf hadoop-2.6.0.tar.gz -C /usr/local/hadoop

  4. 修改hadoop的配置文件。首先进入配置文件所在的文件夹,使用指令cd /usr/local/hadoop/hadoop-2.6.0/etc/hadoop

hadoop-env.sh文件:使用指令vim hadoop-env.sh(如果不会使用vim可以使用gedit来替换vim) 找到文件中java位置并修改为export JAVA_HOME=你的java所在目录

hdfs-site.xml:在<configuration ></configuration >标签之间添加指令<property>
<name>dfs.replication</name>
<value>1</value><!--此处是分片复制个数,因为伪分布只有一台主机所以此处是1-->
</property>

yarn-site.xml:在<configuration ></configuration >标签之间添加指令<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value><!--此处修改为自己的主机名-->
</property>
<!-- reducer获取数据的方式 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

core-site.xml:在<configuration ></configuration >标签之间添加指令<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value><!--将master改为自己的主机名-->
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/hadoop-2.6.0/data/</value>
</property>

mapred-site.xml:原配置文件中无此文件需要使用指令mv mapred-site.xml.template mapred-site.xml生成一个。在<configuration ></configuration >标签之间添加指令<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

5. 将hadoop添加到环境变量vim /etc/proflie添加三行代码
export JAVA_HOME=你自己的java目录
export HADOOP_HOME=/usr/local/hadoop/hadoop-2.6.0
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
然后使用指令source /etc/profile使修改生效。

6.格式化namenode(是对namenode进行初始化)
指令为hdfs namenode -format (hadoop namenode -format)注意会在格式化中出现一条success的提示说明安装成功。

7.启动hadoop
使用指令sbin/start-all.sh

8.验证是否启动成功
使用jps命令验证,如果出现以下六条进程则说明hadoop安装成功。
NameNode
Jps
SecondaryNameNode
NodeManager
ResourceManager
DataNode

0 0
原创粉丝点击