[学习笔记]Hadoop安装_配置

来源:互联网 发布:腾讯云和阿里云的区别 编辑:程序博客网 时间:2024/05/21 05:44
  1. 需要一个Linux系统,可以采用虚拟机,也可以租用云主机
  2. 安装JDK环境
    在命令行输入javac,看是否已经有JAVA环境,没有则继续按照提示安装JDK环境,安装完JDK之后,在命令行输入 vim /etc/profile ,进行设置环境变量。
    javac验证时候有JAVA环境:
    javac验证时候有JAVA环境
    配置环境变量:配置的变量包含JAVA_HOME、CLASSPATH、PATH,按照自己的安装目录进行配置
    这里写图片描述
    配置完成后输入以下命令让其生效
    这里写图片描述

如何配置Hadoop?

  1. 首先安装hadoop
    下载hadoop ,命令如下:
    wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-1.2.1/hadoop-1.2.1.tar.gz
    这里写图片描述

    这里写图片描述

    这里写图片描述
    这里写图片描述

这里写图片描述
conf里面需要配置的文件有(下图中红色框起来的):
这里写图片描述
第一个修改hadoop-env.sh中的配置
vim hadoop-env.sh 进入文件配置JAVA_HOME 变量 和之前配置JAVA环境的JAVA_HOME路径是一样的,如果不知道JAVA_HOME的路径,可以通过echo $JAVA_HOME来查看路径
这里写图片描述
接下来配置其他是三个XML文件,第一个看core-site.xml,打开之后它是一个空的配置文件,如下图:
这里写图片描述
配置后的(注意:下图中的localhost为自己本机的名字比如我的就是:Cherise):
这里写图片描述

<name>hadoop.tmp.dir</name><value>/hadoop</value> //配置Hadoop的临时工作目录</property><property><name>dfs.name.dir</name><value>/hadoop/name</value> //dfs.name.dir的目录在/hadoop/name下</property><property><name>fs.default.name</name>//文件系统的DataNode该如何访问<value>hdfs://localhost:9000</value>//用这个方式访问(本机)</property>

再来看vim hdfs-site.xml 配置文件,配置前的(它也是一个空的配置文件,同样也需要一些属行需要配置):
这里写图片描述
配置后的:
这里写图片描述

<property><name>dfs.data.dir</name>//文件系统的数据<value>/hadoop/data</value>//放在这个目录下</property>

最后看第三个配置文件: mapred-site.xml ,用命令vim mapred-site.xml 进入文件,配置前的:
这里写图片描述
配置后的(注意:下图中的localhost为自己本机的名字比如我的就是:Cherise):
这里写图片描述

<property><name>mapred.job.tracker</name>//任务调度器该如何访问<value>localhost:9001</value>//这样访问本机:端口号</property>

到此,配置文件已经配置完毕!
然后我们还要告诉系统Hadoop安装到哪了
命令 vim /etc/profile
在配置环境变量的地方加上 HADOOP_HOME的路径配置,以及在PATH中加上$HADOOP_HOME/bin: 如下图所示:
这里写图片描述
温馨提示:保存之后记得生效,命令为:source /etc/profile
然后用hadoop命令看是否能找到Hadoop这个执行程序,也就是说看配置好着没有:
这里写图片描述
其实这个Hadoop的可执行程序在哪呢?如下图:
这里写图片描述
我们在执行之前需要对namenode先进行格式化操作,命令:hadoop namenode -format
这里写图片描述
然后在任何地方都可以启动 start-all.sh 然后用jps 来查看Hadoop运行是否正常 ,如下图(如果有以下进程(红色框中的那6个进程)在运行则运行Hadoop运行正常):
这里写图片描述
这里写图片描述
看看Hadoop下面有什么文件系统
这里写图片描述
安装到此结束!
华丽分割线


安装小结

  1. 在linux下安装JDK,并设置环境变量 ,安装命令:apt-get install openjdk-7-jdk
  2. 在 /etc/profile中设置环境变量
  3. 下载Hadoop,并设置Hadoop的环境变量
  4. 修改4个配置文件。
    a):修改hadoop-env.sh ,设置JAVA_HOME;
    b):3个xml文件(都在hadoop-1.2.1目录下的conf目录下):
    第一个:core-site.xml(设置属性 hadoop.tmp.dir、dfs.name.dir、fs.default.name)
    第二个:hdfs-site.xml(设置属性 dfs.data.dir)
    第三个:mapred-site.xml(设置属性 mapred.job.tracker)

  5. 格式化 hadoop namenode -format

  6. 启动start-all.sh
  7. 用jps命令查看 hadoop是否安装成功
原创粉丝点击