Hadoop日记1:初探linux、JDK、Hadoop2、Hello World
来源:互联网 发布:vue.js 动态添加dom 编辑:程序博客网 时间:2024/06/08 08:06
环境:Wmware 12.5.7、Ubuntu 16.04 LTS、java 1.8.0_144、Hadoop 2.7.4。
今天在linux下尝试了hadoop的操作,首先是配置java环境,过程有点繁琐,好在linux可以直接在终端下载软件,期间配置环境变量时误删了profile下的一个词还找了很久错。然后是安装SSH,配置SSH的无密码登陆,这个具体用处暂时不懂。下一步就是安装Hadoop2了,然后就是一个很奇怪的“找不到JAVA_HOME” 问题,后来经过排查需要将hadoop-env.sh和hadoop-config.sh等文件中的JAVA_HOME改成显式的jdk安装路径,问题得以解决。下一步是Hadoop伪分布式配置,使得Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既作为 NameNode 也作为 DataNode,同时,读取的是 HDFS 中的文件。这个需要修改2个配置文件core-site.xml 和 hdfs-site.xml。 最后是运行实例,统计单词的个数,这里准备了两个文件file1.txt和file2.txt。
hadoop@hadoop-virtual-machine:/usr/local/hadoop$ echo "hello world" > ./input/file1.txthadoop@hadoop-virtual-machine:/usr/local/hadoop$ echo "hello hadoop" > ./input/file2.txt在hdfs里建个input文件夹,在hdfs原有的input和output文件都要-rmr删掉。
hadoop@hadoop-virtual-machine:/usr/local/hadoop$ bin/hdfs dfs -mkdir input将txt文件上传到hdfs中
hadoop@hadoop-virtual-machine:/usr/local/hadoop$ bin/hdfs dfs -put ./input/test*.txt input调用jar
hadoop@hadoop-virtual-machine:/usr/local/hadoop$ bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.4.jar wordcount input output最后输出output
hadoop@hadoop-virtual-machine:/usr/local/hadoop$ bin/hdfs dfs -cat output/part-r-00000hadoop1hello2world1还可以将结果导到文件中,注意需要将本地原有的output文件夹删掉,不可以覆盖。
./bin/hdfs dfs -get output ./output部分资料参考网友:http://www.powerxing.com/install-hadoop/
阅读全文
0 0
- Hadoop日记1:初探linux、JDK、Hadoop2、Hello World
- linux hello world 1
- Hadoop hello world
- Hadoop Hello World
- hadoop之hello world
- Hadoop “Hello World” 示例
- 初探react-native Hello World
- Unity学习日记-hello world
- hadoop之"hello world"--wordCount
- hadoop版的Hello,World
- Hadoop的“Hello world”---WordCount
- Linux C再次从零开始(1)--hello world
- linux驱动学习1---Hello World模块
- Linux C编程----1(hello world!)
- Linux-Qt Quick学习1-Hello world
- Linux "Hello World !"
- linux NASM Hello, world!
- Linux hello world 驱动
- filter2D
- 第八届服创大赛有感
- 为什么说《让子弹飞》是古今中外的神片
- Java垃圾回收详解
- html5/css3响应式布局
- Hadoop日记1:初探linux、JDK、Hadoop2、Hello World
- B1011.A+B和C(值溢出问题)
- 微信扫码支付
- 拓扑排序
- 从React和React Native中学习Facebook在开源项目中的行为准则
- Lintcode回文数
- 数据库——SQL中union与union all的使用
- Gradle基本使用(3):依赖管理
- 顺序表应用6:有序顺序表查询