第122讲:实战WordCount测试Hadoop集群环境学习笔记
来源:互联网 发布:燕十八php教程怎么样 编辑:程序博客网 时间:2024/06/07 23:54
第122讲:实战WordCount测试Hadoop集群环境学习笔记
WordCount是对众多文件中每一个文件中每一个单词出现次数进行统计。
每一个并行单位都是mapper,mapper会对自己处理的split进行单词计数,最后reducer会对mapper结果再次进行全局统计,最后得出每一个单词在所有文件中出现的次数。
WordCount在hadoop-2.6.0中的share/hadoop/mapreduce/ 下。
通过如下方法执行:
./hadoop jar hadoop-mapreduce-examples-2.6.0.jar wordcount /library/wordcount/input/Data /library/wordcount/output/dt_wordcount1
在8088端口可以看到进程
在worker节点上可以看到YarnChild进行
通过命令查看结果:
hdfs dfs -cat wordcount/output/dt_wordcount1/part-r-00000
以上内容是从王家林老师DT大数据课程第121讲的学习笔记。
DT大数据微信公众账号:DT_Spark
王家林老师QQ:1740415547
王家林老师微信号:18610086859
王家林的第一个中国梦:免费为全社会培养100万名优秀的大数据从业人员!
您可以通过王家林老师的微信号18610086859发红包捐助大数据、互联网+、O2O、工业4.0、微营销、移动互联网等系列免费实战课程, 目前已经发布的王家林免费视频全集如下:
1,《大数据不眠夜:Spark内核天机解密(共100讲)》: http://pan.baidu.com/s/1eQsHZAq
2,《Hadoop深入浅出实战经典》http://pan.baidu.com/s/1mgpfRPu
3,《Spark纯实战公益大讲坛》http://pan.baidu.com/s/1jGpNGwu
4,《Scala深入浅出实战经典》http://pan.baidu.com/s/1sjDWG25
5,《Docker公益大讲坛》http://pan.baidu.com/s/1kTpL8UF
6,《Spark亚太研究院Spark公益大讲堂》http://pan.baidu.com/s/1i30Ewsd
7,DT大数据梦工厂Spark、Scala、Hadoop的所有视频、PPT和代码在百度云网盘的链接:
http://pan.baidu.com/share/home?uk=4013289088#category/type=0&qq-pf-to=pcqq.group
王家林免费在51CTO发布的1000集合大数据spark、hadoop、scala、docker视频:
1,《Scala深入浅出实战初级入门经典视频课程》http://edu.51cto.com/lesson/id-66538.html
2,《Scala深入浅出实战中级进阶经典视频课程》http://edu.51cto.com/lesson/id-67139.html
3,《Akka深入浅出实战经典视频课程》http://edu.51cto.com/lesson/id-77672.html
4,《Spark亚太研究院决胜大数据时代公益大讲堂》http://edu.51cto.com/lesson/id-30815.html
5,《云计算Docker虚拟化公益大讲坛 》http://edu.51cto.com/lesson/id-61776.html
6,《Spark 大讲堂(纯实战手动操作)》http://edu.51cto.com/lesson/id-78653.html
7,《Hadoop深入浅出实战经典视频课程-集群、HDFS、Yarn、MapReduce》http://edu.51cto.com/lesson/id-77141.html
8,《从技术角度思考Hadoop到底是什么》http://edu.51cto.com/course/course_id-1151.html
“DT大数据梦工厂”团队第一个中国梦:免费为社会培养100万名优秀的大数据从业人员。每天早上4点起持续分享大数据、互联网+、O2O、工业4.0、微营销、移动互联网等领域的
第122讲视频网站地址:
51CTO
http://edu.51cto.com/lesson/id-77772.html
- 第122讲:实战WordCount测试Hadoop集群环境学习笔记
- 第121讲:Hadoop集群的格式化、集群运行实战解析等学习笔记
- 第127讲:Hadoop集群管理之安全模式解析及动手实战学习笔记
- 第128讲:Hadoop集群管理工具dfsadmin实战详解学习笔记
- 第129讲:Hadoop集群管理工具fsck实战详解学习笔记
- 第131讲:Hadoop集群管理工具均衡器Balancer 实战详解学习笔记
- Hadoop集群环境测试-WordCount.java-上篇
- Hadoop集群环境测试-WordCount.java-下篇
- 第116讲:Hadoop集群之安装Java、创建Hadoop用户、配置SSH等实战学习笔记
- 第114讲:Hadoop集群安装解析学习笔记
- 第132讲:Hadoop集群监控:日志、Metrics学习笔记
- 第123讲:Hadoop集群管理之Namenode目录元数据结构详解学习笔记
- 第124讲:Hadoop集群管理之fsimage和edits工作机制内幕详解学习笔记
- 第126讲:Hadoop集群管理之Datanode目录元数据结构详解学习笔记
- 第133讲:Hadoop集群监控Ganglia架构设计和运行机制详细解析学习笔记
- 第120讲:Hadoop的MapReduce和Yarn的配置实战详解学习笔记
- Hadoop集群搭建及wordcount测试
- 第2讲 zookeeper 集群环境的搭建与测试
- ——黑马程序员——OC中简单单列模式的实现
- 用SQL语句写某一月份的日历
- Android 动态添加view
- java.lang.NoSuchFieldError: INSTANCE
- 开始的源头
- 第122讲:实战WordCount测试Hadoop集群环境学习笔记
- [kuangbin带你飞]专题一 简单搜索 H - Pots poj 3414
- 2015.11.12_正则表达式笔记
- Swift 函数嵌套
- nyoj--891--找点(贪心)
- Mybatis传入多参数查询ParameterType=Map问题
- CSS基础学习七:属性选择器
- 获取实体类属性名和值
- 【BLE4.0】CC254x-读取RSSI的理解