Hadoop集群安装部署---单节点伪分布式

来源：互联网发布：新媒体网络部面试问题编辑：程序博客网时间：2024/05/22 02:07

一：linux服务器环境配置

1、设置静态ip（manual）
IP地址：192.168.77.70
子网掩码：255.255.255.0
网关：192.168.77.2

2、修改主机名：
vi /etc/sysconfig/network

3、ip地址与主机名对应：
vi /etc/hosts

**在windows下也要修改（如果在win下用到master和slave01）：

C:\Windows\System32\drivers\etc

4、关闭图形化界面
vi /etc/inittab
将id:5:initdefault:-----> id:3:initdefault:

5、关闭防火墙
service iptables stop
chkconfig iptables off

二：安装jdk

1、用sftp（alt+p）将jdk传入Linux中

2、解压jdk
mkdir /usr/local/apps 创建安装目录
tar -zxvf jdk-7u65-linux-i586.tar.gz -C /usr/local/apps/ 解压到安装目录中

3、检查jdk是否存在问题
cd /usr/local/apps/jdk1.7.0_65
bin/java -version （java要小写）

4、修改配置文件
cd /usr/local/apps/jdk1.7.0_65
vi /etc/profile
在最后一行后面添加：
export JAVA_HOME=/usr/local/apps/jdk1.7.0_65
export PATH=$PATH:$JAVA_HOME/bin

5、让配置生效
cd /usr/local/apps/jdk1.7.0_65
source /etc/profile

三：安装hadoop

1、用sftp（alt+p）将hadoop传入Linux中

2、解压hadoop
tar -zxvf hadoop-2.4.1.tar.gz -C /usr/local/apps/

3、修改配置文件
cd /usr/local/apps/hadoop-2.4.1/etc/hadoop

vi hadoop-env.sh
修改JAVA_HOME=jdk安装目录

vi core-site.xml

<configuration><property><name>fs.default.name</name><!-- namenode的URI --><value>hdfs://192.168.77.70:9000/</value></property><property><name>hadoop.tmp.dir</name><!-- Hadoop的默认临时文件存放路径 --><value>/usr/local/apps/hadoop-2.4.1/tmp/</value></property></configuration>

vi hdfs-site.xml

<configuration><property>   <name>dfs.replication</name><!-- 副本个数 -->   <value>1</value></property><property>   <name>dfs.data.dir</name><!--datanode的工作目录  -->   <value>/usr/local/apps/hadoop-2.4.1/tmp/dfs/data</value></property><property>   <name>dfs.name.dir</name><!--namenode的工作目录  -->   <value>/usr/local/apps/hadoop-2.4.1/tmp/dfs/name</value></property></configuration>

先将mapred-site.xml.template改为mapred-site.xml
mv mapred-site.xml.template mapred-site.xml

然后vi mapred-site.xml

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property></configuration>

vi yarn-site.xml

<configuration><!-- Site specific YARN configuration properties --><property><name>yarn.resourcemanager.hostname</name><value>master</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property></configuration>

vi slaves

（文件 slaves，配置datanode的主机名）

四：启动hadoop

1、格式化namenode
cd /usr/local/apps/hadoop-2.4.1/bin
./hadoop namenode -format

2、无密登录
a、生成密钥对：ssh-keygen
三次回车键（选择默认）

b、ssh-copy-id master

验证是否能无密登录：

3、自动化脚本启动

***在任何目录下都能运行下面的命令，需要改下配置文件：

vi /etc/profile

export JAVA_HOME=/usr/local/apps/jdk1.7.0_65
export HADOOP_HOME=/usr/local/apps/hadoop-2.4.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin