Hadoop学习之二《Hadoop环境伪分布式环境搭建》

来源：互联网发布：vulcan软件编辑：程序博客网时间：2024/05/15 20:12

问题？Hadoop学习之二《Hadoop环境伪分布式环境搭建》

一、Hadoop定义

二、环境搭建

(1)资源下载

JDK1.7-Linux-64:点击下载链接

Hadoop2.2版本:点击下载链接

(2)配置过程

首先是，虚拟机要先安装好，而且网路要配置好。详情请看环境配置

1.设置网络，并且网络service networkrestart

2.创建组，并且创建hadoop用户设置密码（放到这个组中）

3.下载jdk1.7及hadoop2.2压缩包，并且使用WinSCP软件移动这两个文件到/usr/local下

解压jdk：tar –zxvf …… 并且重命名为jdk1.7

解压hadoop，并且移动到用户主目录下(这个时候这个文件只有root有权限，hadoop还没有，后面会给予权限)

在hadoop程序目录下创建文件夹:都是以后放一些数据文件的

给hadoopGroup组分配对此hadopp2.2文件的操作权限

给组分配读写执行权限

配置jdk的环境变量

查看是否配置成功

修改hadoop环境变量

查看是否生效

修改hadoop2.2里面etc下的配置文件，这个非常重要。配置不成功，后面的文件系统就会出错。

修改环境变量：export JAVA_HOME=/usr/local/jdk1.7/ (就只改这个，有些有#号的别去掉了。)

修改slaves文件

修改core-site.xml

<configuration> <property>       <name>fs.defaultFS</name>       <value>hdfs://node:9000</value>       <description>configerate hostnameand port</description> </property> <property>       <name>hadoop.tmp.dir</name>       <value>/home/hadoop/hadoop2.2/tmp/hadoop-${user.name}</value>        <description>storethe temp dir</description> </property> <property>       <name>hadoop.proxyuser.hadoop.hosts</name>       <value>*</value> </property><property>       <name>hadoop.proxyuser.hadoop.groups</name>       <value>*</value></property></configuration>

修改mapred-site.xml.temp

<configuration>       <property>              <name>mapreduce.framework.name</name>              <value>yarn</value>       </property>       <property>              <name>mapreduce.jobhistory.address</name>              <value>node:10020</value>       </property>       <property>              <name>mapreduce.jobhistory.wabapp.address</name>              <value>node:19888</value>       </property></configuration>

修改yarn-site.xml

<configuration> <!--Site specific YARN configuration properties -->       <property>              <name>yarn.resourcemanager.hostname</name>              <value>node</value>       </property>        <property>              <name>yarn.nodemanager.aux-services</name>              <value>mapreduce_shuffle</value>       </property>              <property>              <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>              <value>org.apache.hadoop.mapred.ShuffleHandler</value>       </property>             <property>              <name>yarn.resourcemanager.address</name>              <value>node:8032</value>       </property>             <property>              <name>yarn.resourcemanager.scheduler.address</name>              <value>node:8030</value>       </property>             <property>              <name>yarn.resourcemanager.resource-tracker.address</name>              <value>node:8031</value>       </property>             <property>              <name>yarn.resourcemanager.admin.address</name>              <value>node:8033</value>       </property>        <property>              <name>yarn.resourcemanager.webapp.address</name>              <value>node:8088</value>       </property></configuration>

修改hdfs-site.xml

<configuration>       <property>              <name>dfs.namenode.http-address</name>              <value>node:50070</value>              <description>namenodeaddress and port</description>       </property>        <property>              <name>dfs.namenode.secondary.http-address</name>              <value>node1:50090</value>              <description>seconde addressand port</description>       </property>        <property>              <name>dfs.replication</name>              <value>3</value>              <description>configeratehdfs store dir number,default :3</description>       </property>             <property>              <name>dfs.namenode.name.dir</name>              <value>file:///home/hadoop/hadoop2.2/hdfs/name</value>              <description>namnode is usedto keep storing namespace and exchange the path of local log file</description>       </property>             <property>              <name>dfs.datanode.data.dir</name>              <value>file:///home/hadoop/hadoop2.2/hdfs/data</value>              <description>datanode isstore local dir</description>       </property>        <property>              <name>dfs.namenode.checkpiont.dir</name>              <value>file:///home/hadoop/hadoop2.2/hdfs/namesecondary</value>              <description>secondarynamenode</description>       </property>             <property>              <name>dfs.webhdfs.enabled</name>              <value>true</value>                     <description>is it alowedto  view web hdfsfile</description>       </property>             <property>              <name>dfs.stream-buffer-size</name>              <value>131072</value>              <description>buffer:4kb</description>       </property>      </configuration>

修改主机名：这个只要在hdfs开启前改就行了，可以一开始就把主机名改了