一个Hadoop的小例子

来源:互联网 发布:java程序设计竞赛 编辑:程序博客网 时间:2024/05/12 23:31
 1.    创建输入文件  echo "Hello World" > file1.txt  echo "Hello Hadoop" > file2.txt

这里写图片描述
2. 在HDFS上创建输入文件夹
hadoop fs -mkdir input
3. 上传本地文件到集群的input目录下
hadoop fs -put ~/bingjie/file*.txt input
查看input下的文件: hadoop fs -ls input
这里写图片描述
4. 在集群上运行WordCount程序
hadoop jar ~/hadoop-2.2.0/share/hadoop/mapreduce/hadoop-mapreduce-example-2.2.0.jar wordcount input output
这里写图片描述

5.查看结果
(1) hadoop fs -ls output
(2) hadoop fs -cat output/part-r-00002
这里写图片描述
这里写图片描述

自己总结了一下mr的开发步骤:
1.创建一个maven项目
2. 添加hadoop依赖,修改pom.xml文件
3.导入项目到eclipse中
mvn eclipse:eclipse
4. 开发后打包生成jar包
mvn package
5. Put到hadoop上执行jar包

0 0
原创粉丝点击