Hadoop学习笔记(二)——MapReduce
来源:互联网 发布:龙献文天下数据 编辑:程序博客网 时间:2024/06/06 02:39
学习资料
慕课网——Hadoop大数据平台架构与实践–基础篇
MapReduce原理
分而治之,一个大任务分成多个小的子任务(map),并行执行后,合并结果(reduce)。
MapReduce运行流程
基本概念
- Job & Task
一个Job分成多个Task- MapTask
- ReduceTask
- JobTracker
- 作业调度
- 分配任务、监控任务执行进度
- 监控TskTracker的状态
- TaskTracker
- 执行任务
- 汇报任务状态
部署时TaskTracker一般和HDFS中的DataNode放一起
MapReduce的容错机制
处理TaskTracker在执行过程中可能发生的宕机、故障。
- 重复执行,默认4次仍失败,则放弃
- 推测执行,如果某一个TaskTracker速度很慢,则另开一个TaskTracker与它执行相同的任务,谁先执行完,使用谁的数据。
0 0
- Hadoop学习笔记(二)——MapReduce
- hadoop 学习笔记 二 ----MapReduce
- Hadoop学习笔记——MapReduce
- 【Hadoop学习笔记】——MapReduce
- Hadoop学习笔记—4.初识MapReduce
- Hadoop学习笔记—4.初识MapReduce
- Hadoop-hdfs和mapreduce学习笔记二
- Hadoop学习笔记---MapReduce
- Hadoop学习笔记---MapReduce
- Hadoop学习笔记---MapReduce
- Hadoop MapReduce学习笔记
- Hadoop 学习笔记——mapreduce框架详解
- Hadoop学习笔记—11.MapReduce中的排序和分组
- Hadoop学习笔记—12.MapReduce中的常见算法
- Hadoop学习笔记—12.MapReduce中的常见算法
- Hadoop MapReduce 学习笔记(二) 序言和准备2
- hadoop学习笔记之二:MapReduce基本编程
- hadoop 1.2.1 Eclipse mapreduce hello word 学习笔记(二)
- 【深度学习】caffe结构解析(一)
- Android应用程序的自动更新升级(自身升级、通过tomcat)
- javascript之正则表达式
- 信息传递(NOIP2015提高组Day1T2)
- Python中使用不同编码读写txt文件详解
- Hadoop学习笔记(二)——MapReduce
- 常见对象_StringBuffer类的构造方法
- Java之异常处理与工具类
- freq 结构体
- 二元成员函数适配器
- Hibernate 安装配置
- 样式和主题
- 用c语言实现ping命令的原理及代码
- Android启动过程详解(3)——Zygote