Hadoop渐进二:自动与手动实例wordcount运行

来源:互联网 发布:js隐藏input标签 编辑:程序博客网 时间:2024/05/16 16:16

一、自动运行

hadoop fs是调用文件系统的命令(bin/hadoop fs <args>)

1、创建输入文件(数据块)

(1)、hadoop fs -mkdir /input 


(2)、删除文件块

hadoop fs -rm -r /filename/(文件夹)

hadoop fs -rm /filename(文件)

3、查看创建的文件块

hdfs dfs -ls / 


4、本地文件导入到hdfs

hadoop fs -put wordcount.txt /input    





5、查看创建文件块内的文件及内容

hadoop fs -ls /input 


hadoop fs -cat /input/wordcount.txt 


6、执行mapreduce程序

hadoop jar hadoop-mapreduce-examples-2.8.0.jar wordcount /input /output 


7、查看输出结果 



二、手动运行

1、添加环境变量(否则会出现错误can't find symbol...)

2、编写WordCount.java
... ...
3、运行:javac WordCount.java



4、将*.class打包成.jar:jar -cvf WordCount.jar ./WordCount*.class

5、Hadoop集群运行:hadoop jar WordCount.jar WordCount /input /output
6、结果:



三、linux下java程序运行




0 0