Hadoop安装调试

来源:互联网 发布:咸鱼不退不换淘宝介入 编辑:程序博客网 时间:2024/06/05 08:39

本文介绍在CentOS7下安装Hadoop的基本步骤,并在安装结束时运行Hadoop自带的word count程序测试安装是否成功。

系统环境:CentOS7、Hadoop2.7.1、java1.7

Hadoop安装

  1. Hadoop安装目录结构
    可以不按照下面的配置来,但是配置的时候路径要改成自己安装的相应路径。

    /home
    —-/hadoop(hadoop用户目录)
    ——–/hadoop_install
    ————/hadoop-2.7.1
    —————-…(hadoop核心文件)
    ————/dfs
    —————-/data
    —————-/name
    ————/tmp
    ————/mapred
    —————-/local
    —————-/system

  2. 配置hadoop_env.sh
    这里写图片描述

  3. 配置yarn_env.sh
    这里写图片描述
  4. 配置core-site.xml
    这里写图片描述
  5. 配置hdfs-site.xml
    这里写图片描述
  6. 配置mapred-site.xml
    hadoop-install
  7. 配置yarn-site.xml
    hadoop-install
  8. 运行hdfs namenode –format(旧hadoop namenode -format)
    这里写图片描述
    由上图可见,HDFS分布式文件系统已经成功格式化。
  9. 运行sbin/start-all.sh (用jps确认进程已开启)
    这里写图片描述
    由上图可见,HDFS和MapReduce已经正常启动。

Word Count程序运行

  1. 本文使用Python任意抓取的英文Wiki百科网页数据为测试数据,数据经过去除HTML标签处理后存储为txt文件,具体数据如下:
    这里写图片描述
  2. 将测试数据拷贝到HDFS文件系统上,执行wordcount程序:
    这里写图片描述
  3. 程序执行结束后,在浏览器输入localhost:8088查看作业状态。
    这里写图片描述
    由上图可见,程序已成功执行完毕。
  4. 将HDFS文件系统上的结果数据拷贝回本地,用vim打开查看:
    这里写图片描述
  5. 当然,从MapReduce结束后的提示也可获知相关统计数据:
    这里写图片描述
    由上图可知,词频统计过程中查找到了13299个单词(或数字等其他符号)。
原创粉丝点击