配置Hadoop伪分布式模式并运行WordCount示例操作实例演示步骤
来源:互联网 发布:淘宝客贷款申请条件 编辑:程序博客网 时间:2024/05/20 11:49
该篇博客是基于hadoop单机模式的构建成功的前提下,进行直接操作的,关于 hadoop单机模式的构建可以参考为上一篇博文:http://blog.csdn.net/henni_719/article/details/77718642
PS:全程以root的角色进行配置安装
第一部分:伪分布式配置
伪分布模式主要涉及一下配置信息:
(1)修改hadoop的核心配置文件core-site.xml,主要配置hdfs的地址和端口号。
(2)修改hadoop中hdfs的配置文件hdfs-site.xml,只要配置replication(复制或备份)。
(3)修改hadoop中MapReduce的配置文件mapred-site.xml,主要配置JobTracker的地址和端口。
具体的操作步骤如下:
step_1:创建几个配置文件需要的目录,执行截图如下:
Step_2:配置core-site.xml文件
进入到相关目录下,打开core-site.xml文件,操作截图如下:
在文件中添加配置信息,添加后的内容同如下截图所示:
配置信息包括,hdfs默认端口号地址,临时文件存放目录信息!
Step_3:配置hdfs-site.xml文件
进入到相关目录下,打开hdfs-site.xml文件,操作截图如下:
在文件中添加配置信息,添加后的内容同如下截图所示:
设置hdfs的节点个数和信息,包括hdfs的节点路径、数据路径!
Step_4:配置mapred-site.xml文件
进入到相关目录,打开mapred-site文件,操作截图如下:
在打开的文件中添加相关配置信息,截图如下:
设置jobtracker的地址和端口号!
通过对上面三个文件的配置,最简单的伪分布式配置完成了!
第二部分:验证伪分布式开发环境是否搭建成功
通过第一部分对文件的修改,配置好了最简单的伪分布式,但不知道是否成功,第二部分,通过运行wordcount实例,用来测试是否配置成功!
Step_1:对hadoop的namenode格式化:
输入Y,完成格式化过程:
Step_2:启动hadoop并查询服务是否启动
使用java自带的jps命令查询出所有的守护进程:
Step_3:hadoop中用于监控集群的web页面:
dfs运行状态:http://localhost:50070/dfshealth.jsp
JobTracker信息界面:http:/localhost:50030/jobtracker.jsp
上述hadoop运行状态监控页面表明伪分布开发环境完全搭建成功!
第三部分:在伪分布式平台运行wordcount程序
通过第二部分,表明伪分布式开发环境搭建成,该部分通过实例,来测试伪分布式开发环境是否可以正常使用?
Step_1:在dfs中创建input目录:
此时创建的文件因为没有指定hdfs具体目录,所有会在当前用户下,创建input目录,查看web控制,操作截图如下:
Step_2:复制本地目录下的文件到dfs的input目录下:
可以在web端查看input目录下的文件,如下图所示
Step_3:在伪分户式模式下运行wordcount程序
由于之前单机模式下运行过,在目录下存储output目录,在执行中需要进行删除处理,运行wordcoutn程序,操作截图如下(注意操作目录)截图如下:
Step_4:查看程序运行结果:
在web端查看,截图如下:
通过命令行,显示运行结果截图:
此时在hadoop的web控制台会发现提交并运行成功的任务,截图如下:
第四部分:关闭Hadoop服务
通过四个部分,操作演示,Hadoop伪分布式环境搭建和测试完全成功,意味伪分布式能够正常使用!
阅读全文
0 0
- 配置Hadoop伪分布式模式并运行WordCount示例操作实例演示步骤
- 配置Hadoop伪分布模式并运行Wordcount示例
- hadoop伪分布式运行wordcount 实例Fedora14
- 配置Hadoop分布模式并运行Wordcount示例
- 伪分布式环境下命令行正确运行hadoop示例wordcount
- 2.2hadoop伪分布式---Wordcount.java配置和运行
- 配置Hadoop单机模式并运行Wordcount
- Hadoop伪分布式模式安装配置步骤
- 【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群-配置Hadoop伪分布模式并运行Wordcount示例(1)
- Hadoop伪分布式运行wordcount小例子
- Hadoop伪分布式运行wordcount小例子
- Hadoop伪分布式运行wordcount例子
- 运行Hadoop伪分布式实例
- hadoop on yarn 入门系列1-伪分布式环境搭建并运行wordcount
- hadoop - hadoop2.6 伪分布式 示例 wordcount 分词 和 hdfs常用操作命令
- Hadoop在Linux下伪分布式的安装 wordcount实例的运行
- Hadoop在Linux下伪分布式的安装 wordcount实例的运行
- Hadoop在Linux下伪分布式的安装 wordcount实例的运行
- git的一些命令
- 多线程编程-互斥锁/条件变量/关卡的使用实例
- Linux复用I/O-poll-server代码
- 我是一只IT小小鸟
- java设计模式简单介绍
- 配置Hadoop伪分布式模式并运行WordCount示例操作实例演示步骤
- cadence学习(一)封装制作
- Python 文件I/O和File方法
- 当数组遇到mybatis in 的时候
- jQuery源码分析(版本1.6.1)
- nigx.conf
- 7个有益的编程习惯
- 关于三缓存机制的使用
- Java Regular (二) 去 掉 排 除 词