hadoop伪分布式配置

来源:互联网 发布:最终幻想战略版 知乎 编辑:程序博客网 时间:2024/05/21 17:52

1,下载并安装vmware、下载ubuntu-64位镜像。
2、新建虚拟机,步骤:

首先,选择“典型”,点击“下一步”
这里写图片描述

然后,
这里写图片描述

接着,
这里写图片描述

然后,
这里写图片描述

接着,
这里写图片描述

最后,点击“完成即可”。

3、设置虚拟机。
选择“虚拟机”->“设置”->”cd/dvd”,改为“使用iso镜像文件”。然后点击“确定”。
这里写图片描述

4、开启虚拟机,一直点继续即可。

5、安装增强工具
这里写图片描述

将vmwaretool.tar复制到桌面。
这里写图片描述
用鼠标解压vmwaretool.tar文件,再使用命令执行python文件:

sudo ./vmware-install.pl

一连串的回车。虚拟机增强工具安装完成。先关闭虚拟机。

6、添加共享文件夹
这里写图片描述
开启虚拟机。

7、安装JDK
将本地的jdk.tar包复制到linux下的“/下载/”目录。
这里写图片描述
进入到下载目录,使用如下命令解压:

tar -xzvf jdk-8u111-linux-x64.tar.gz

把解压后的文件移动到根目录的usr/soft/文件夹下

先创建soft文件夹:mkdir soft/再移动文件:sudo  mv  ~/下载/jdk1.8.0_111/  soft/

配置java_home和path路径:
进入根目录的/etc/目录

cd /etc/

打开environment文件,

nano  environment

然后加入JAVA_HOME和追加Path

JAVA_HOME=/usr/soft/jdk1.8.0_111(注意要大写)

在path后面追加/usr/soft/jdk1.8.0_111/bin
然后ctrl+o, 回车,ctrl+x退出即可。

然后使用命令让文档立即生效

source environment

最后测试jdk是否安装成功

java -version

如下图表示安装成功
这里写图片描述

8、安装hadoop
先将hadoop.tar复制到下载目录。
这里写图片描述
解压,并将解压后的文件移动到根目录的usr/soft/文件夹下

tar -xzvf  hadoop-3.0.0-alpha1.tar.gz sudo mv hadoop-3.0.0-alpha1 /usr/soft/

配置hadoop环境变量,在根目录中的etc/,
打开environment

sudo  gedit  environment
HADOOP_INSTALL=/usr/soft/hadoop-3.0.0-alpha1

在path后面追加/usr/soft/hadoop-3.0.0-alpha1/bin:/usr/soft/hadoop-3.0.0-alpha1/sbin

然后让它立即生效

source environment

重新启动客户机。。。
然后输入命令

hadoop version

如果出现hadoop的版本信息,则说明配置成功。

9、修改hadoop的配置文件
进入hadoop文件夹里的etc目录里面

cd   /usr/soft/hadoop-3.0.0-alpha1/etc/hadoop

复制hadoop文件夹为hadoop_presudo,

cp -R hadoop hadoop_presudo

分别修改core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml文件。

core-site.xml:

<configuration>    <property>       <name>fs.defaultFS</name>       <value>hdfs://localhost/</value>    </property></configuration>

hdfs-site.xml

<configuration>    <property>       <name>dfs.replication</name>       <value>1</value>        </property></configuration>

mapred-site.xml

<configuration>    <property>        <name>mapreduce.framework.name</name>        <value>yarn</value>    </property></configuration>

yarn-site.xml

<configuration>    <property>       <name>yarn.resourcemanager.hostname</name>       <value>localhost</value>    </property>     <property>       <name>yarn.nodemanager.aux-services</name>       <value>mapreduce_shuffle</value>    </property></configuration>

10、安装ssh

安装ssh服务

sudo  apt-get  install  ssh

生成ssh密钥

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

进入.shh文件夹里面,把公钥放入authorized_keys里面

cd ~/.sshcat id_rsa.pub >> authorized_keys

这时该隐藏文件夹下面多了些文件
这里写图片描述

登陆ssh:

ssh localhost

这时多了个known_hosts
这里写图片描述

使用exit断开连接

exit

记得每次登录最后都要退出

11、格式化namenode

hadoop namenode -formate

12、启动hadoop

start-dfs.sh --config $HADOOP_INSTALL/etc/hadoop_presudostart-yarn.sh --config $HADOOP_INSTALL/etc/hadoop_presudo

查看守护进程

jps

这里写图片描述

13、第一个hadoop程序
导出到jar包,复制到虚拟机里面
执行指令:

hadoop jar hadoopdemo.jar test/ out/

成功:
这里写图片描述

0 0