使用Hadoop运行WorldCount示例

来源:互联网 发布:淘宝大学教程百度云 编辑:程序博客网 时间:2024/06/05 23:53

使用Hadoop运行WorldCount示例

上一节中我们搭建好了Hadoop的运行环境,虽然还没开始学习Hadoop各个组件的框架原理,但是我先来通过hadoop运行自带的worldcount示例来熟悉一下它的操作流程。
1.首先找到hadoop自带worldcount jar包示例的路径:
这里写图片描述
2.准备工作,需要创建输入输出路径以及上传的文件:
(1)创建目录

 hadoop fs -mkdir -p /data/wordcount 

这里写图片描述

hadoop fs -mkdir -p /output/

这里写图片描述
(2)新建输入文件inputWord:

vim /usr/inputWord

这里写图片描述
将本地准备的输入文件上传到hdfs中:

hadoop fs -put /usr/inputWord /data/wordcount

上传成功后可以通过命令查看hdfs里的文件

hadoop fs -ls /data/wordcounthadoop fs -text /data/wordcount/inputWord

这里写图片描述
3.准备工作做完之后就可以运行实例了,执行命令

hadoop jar hadoop-mapreduce-examples-2.8.0.jar wordcount /data/wordcount /output/wordcountresult

可以看到控制台输出信息如下:
这里写图片描述

4.查看执行结果

 hadoop fs -text /output/wordcountresult/part-r-00000

这里写图片描述
以上hadoop自带的wordcount实例运行结束

原创粉丝点击