centos下搭建单机和伪分布式hadoop环境-(2)下载安装所需软件+测试hadoop的单机模式

来源:互联网 发布:户外广告数据 编辑:程序博客网 时间:2024/05/01 22:30

说明:linux终端下的操作均在root权限下

步骤一:下载安装hadoop开发环境所需软件

1.下载安装vmware player

下载地址:https://my.vmware.com/web/vmware/free#desktop_end_user_computing/vmware_player/7_0

安装:纯傻瓜式安装,一路next就好。

说明:这里也可安装vmware workstation,由于vmware player较小巧简洁,故这里选择使用vmware player。

2.下载centos镜像

下载地址:http://isoredirect.centos.org/centos/7/isos/x86_64/CentOS-7-x86_64-DVD-1503-01.iso

3.在vmware player中加载镜像

方法:启动vmware player,点击界面中的新建虚拟机进入到新建虚拟机向导后,安装来源选择安装程序光盘映像文件(iso),在本地选择上2

中所下载的iso镜像文件,然后点击下一步,进入到个性化linux的设置(虚拟机的全名,用户名,密码的设置),设置好进入到下一步后为虚拟机命名,选择虚拟机存放的位置,

下一步,指定好磁盘的大小(这里建议是20GB),下一步,进入自定义硬件设置,这里只需要修改下虚拟机的内存即可,设置为1GB,保存后,点击完成,即可自动加载虚拟机镜

像,此刻需要等待5分钟左右,加载好后会自动开启虚拟机。

4.下载安装jdk1.7

下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html

说明:这里需要去下载rpm包或者tar.gz包,本文安装以rpm包的安装为例

安装:3中自动开启虚拟机后,将本地下载的jdk1.7 copy到虚拟机中,之后进入到下载的jdk1.7目录,此时你可以:

(1)点击下载的jdk的rpm包来自动install(rpm文件是centos默认的可执行文件,就像windows下的exe文件类似)

(2)打开linux终端,进入到当前jdk的rpm包目录,然后输入rpm -ivh jdk-xxx.rpm,就会自动安装jdk了,默认安装到/usr/java目录。

配置环境变量的方法:在终端下输入vi /etc/profile命令后,进入后按 i ,在文件末尾输入如下内容,输入后按esc后,按 :wq,enter保存退出,之后回到终端输入source /etc/profile(source命令用来强制刷新该文件,使修改的内容立即生效)

(我这里配置的如下)

JAVA_HOME=/usr/java/jdk1.7.0_79PATH=$JAVA_HOME/bin:$PATHCLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jarexport JAVA_HOME PATH CLASSPATH
检查java是否安装完成,配置的环境变量是否可用的方法:在终端输入java -version命令若显示java版本相关信息即为成功安装配置。

注:在安装下载的jdk之前,一定要删除centos自带的openjdk

删除方法:在终端中输入rpm -qa grep|java ,来查看系统文件中含有java字符串的文件,删除用yum -y remove 文件名,执行后,相关的依赖包也会被删除掉。

检查是否已删除干净:在终端中输入find /name jdk或find /name java,若无列出文件,则表明centos自带的openjdk删除完毕。

5.下载安装hadoop

下载地址:http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.6.0/

说明:这里需要下载hadoop-2.6.0.tar.gz 文件

安装:下载后从本地copy到虚拟机中,打开Linux终端,进入到下载的hadoop文件目录,输入tar -zxvf hadoop-2.6.0.tar.gz,将解压缩后的文件移动到/usr/local/hadoop目录下。

配置hadoop环境变量的方法(主要是为了方便使用hadoop相关命令):终端下输入vi /etc/profile,在文件末尾添加如下内容,保存退出后记得source一下该文件。

export HADOOP_HOME=/usr/local/hadoop/hadoop-2.6.0export ${HADOOP_HOME}/bin:$PATH
检查:在终端下输入hadoop version正确显示hadoop版本则表明配置成功。

hadoop配置java环境(hadoop的运行是依赖于java环境的):在终端下输入cd /usr/local/hadoop/hadoop-2.6.0/etc/hadoop,进入到该目录后,输入vi hadoop-env.sh,在文件末尾输入如下内容,保存退出后,记得source一下。

export JAVA_HOME=/usr/java/jdk1.7.0_79


至此,centos下搭建单机hadoop环境的已全部完成!

接下来,测试一下hadoop的单机模式是否可运行hadoop自带的wordcount:

方法步骤:

(1)首先在终端下输入cd /usr/local/hadoop/hadoop-2.6.0,进入后,输入mkdir input,创建一下input目录

(2)输入cp etc/hadoop/*.sh input,将文件copy到input目录中

(3)输入hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-example-2.6.0.jar wordcount input output,等待命令执行完毕

(4)输入cat output/*命令,查看程序执行的结果

ok,hadoop的单机模式已经搭建成功了!

0 0
原创粉丝点击