Hadoop 程式編譯

来源:互联网 发布:mac键盘皮肤带按键音 编辑:程序博客网 时间:2024/06/08 06:46

Hadoop 程式編譯

 

  1. 練習 0 : hello : 印出我們的 key value 為何
  2. 練習 1 : Word Count 初級版
  3. 練習 2 : Word Count 進階版

 

練習 0 : hello : 印出我們的 key value 為何¶

  • 下載 nchc-example.jar
    $ wget http://trac.nchc.org.tw/cloud/raw-attachment/wiki/Hadoop_Lab4/nchc-example.jar
  • 執行客製化的hadoop 程式
$ bin/hadoop jar nchc-example.jar
  • 輸出結果
    ******************************************歡迎使用 NCHC.Hadoop 的運算功能指令:  Hadoop jar nchc-example-*.jar <功能>功能:  wordcount: 計算輸入資料夾內分別在每個檔案的字數統計  mwc:       統合計算所有輸入檔的字數統計  grep:      算出包指定字串的個數  nchcgrep:  整合來源檔內的每個字與其所有出現的所在列  hello:     印出內容並統計累進字數******************************************
  • 使用hello
    $ bin/hadoop jar nchc-example.jar hello
  • 使用提示:
    hello <inDir> <outDir> <m> <r>
  • 範例:
$ bin/hadoop jar nchc-example.jar hello lab3_input lab4_out6 1 1

練習 1 : Word Count 初級版¶

  • 上傳內容到hdfs內
$ cd /opt/hadoop$ mkdir lab4_input$ echo "I like NCHC Cloud Course." > lab4_input/input1$ echo "I like nchc Cloud Course, and we enjoy this course." > lab4_input/input2$ bin/hadoop fs -put lab4_input lab4_input$ bin/hadoop fs -ls lab4_input
  • 下載 WordCount.java 並存到/opt/hadoop;
    $ wget http://secuse.nchc.org.tw/class/WordCount.java
  • 運作程式
$ mkdir MyJava$ javac -classpath hadoop-*-core.jar -d MyJava WordCount.java$ jar -cvf wordcount.jar -C MyJava .$ bin/hadoop jar wordcount.jar WordCount lab4_input/ lab4_out1/$ bin/hadoop fs -cat lab4_out1/part-00000
  • lab4_out1 執行結果
    Cloud 2Course, 1Course. 1I 2NCHC  1and 1course. 1enjoy 1like  2nchc  1this  1we  1

練習 2 : Word Count 進階版¶

$ echo "/." >pattern.txt && echo "/," >>pattern.txt$ bin/hadoop fs -put pattern.txt ./$ mkdir MyJava2
  • 下載 WordCount2.java 並存到/opt/hadoop;
    $ wget http://trac.nchc.org.tw/cloud/raw-attachment/wiki/Hadoop_Lab4/WordCount2.java
$ javac -classpath hadoop-*-core.jar -d MyJava2 WordCount2.java$ jar -cvf wordcount2.jar -C MyJava2 .$ bin/hadoop jar wordcount2.jar WordCount2 lab4_input lab4_out2 -skip pattern.txt$ bin/hadoop fs -cat lab4_out2/part-00000
  • lab4_out2 執行結果
    Cloud 2Course  2I 2NCHC  1and 1course  1enjoy 1like  2nchc  1this  1we  1
$ bin/hadoop jar wordcount2.jar WordCount2 -Dwordcount.case.sensitive=false lab4_input lab4_out3 -skip pattern.txt$ bin/hadoop fs -cat lab4_out3/part-00000
  • lab4_out3 執行結果
    and 1cloud 2course  3enjoy 1i 2like  2nchc  2this  1we  1

Attachments

  • WordCount2.java (4.2 kB) - added by waue 4 days ago.
  • nchc-example.jar (23.2 kB) - added by waue 4 days ago.
  • WordCount.java (2.6 kB) - added by waue 2 days ago.
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 和老师吵架了怎么办 孩子初中转学学籍怎么办 孩子上初中学籍怎么办 18孩子不想上学怎么办 宝宝不爱吃蔬菜怎么办 孩子总丢东西怎么办 孩子经常丢东西怎么办 孩子总是丢东西怎么办 孩子负能量太多怎么办 不要孩子老了怎么办 父母都内向孩子怎么办 孩子不喜欢读课外书怎么办 学习学不进去怎么办 小孩停不下来怎么办 小孩老爱玩不爱学习怎么办 小孩子不喜欢吃菜怎么办 孩子初中不爱学习怎么办 大学不爱学家长怎么办 小孩子不爱读书不听话怎么办 小孩不爱读书写字怎么办 一年级学生不爱学习怎么办 孩子练字怕累怎么办 孩子不愿意学英语怎么办 生了儿子 不喜欢 怎么办 养两个儿子的怎么办 看诗词记不住怎么办 经常读书记不住怎么办 孩子不爱记数字怎么办 考研学不进去怎么办 读了职高后悔怎么办 不喜欢看书的人怎么办 生的儿子不喜欢怎么办 孩子上网不回家怎么办 儿子不想读书了怎么办 中考体育考不好怎么办 小孩突然没礼貌怎么办 小孩读书记忆差怎么办 这几天不爱吃饭怎么办 读书读到不懂的怎么办 读书很多词不懂怎么办 看书看不进去怎么办