Hadoop学习笔记
来源:互联网 发布:耳机声道测试软件 编辑:程序博客网 时间:2024/04/28 14:30
NameNode中目录/文件的元数据为FsImage
FsImage+内存元数据+EditLog = 效率 + 安全
HDFS的容错:节点、网络、存储
监测节点错误:datanode向namanode定时返回心跳
监测网络错误:数据传送后返回ACK
监测存储错误:①传输数据损坏,通过数据的checksum监测;
②硬盘存储数据损坏,通过每个block的checksum监测
MapReduce作业的运行流程
Shuffle处理过程
partition、sort、combine。
- partition:将map的结果发送到相应的reduce,确保相同的key进入相同reduce。
sort:map后有两次排序。
第一次:文件内部快速排序(sort)。每次spill时,会将中间数据存入本机的一个或几个文件中,并且针对这些文件内部的记录进行一次快速排序;
第二次:多个文件归并排序(merge)。map任务执行完成后会对这些内部排好序的文件做一次归并排序,并将排好序的结果输出到一个大的文件中。combine:合并map输出的中间数据,减少数据传输,提高处理效率。
MapReduce设计模式
定义:设计模式(Design Pattern)是一套被反复使用、经过分类编目的代码设计经验总结。
目的:使用设计模式是为了提高编码效率、提高代码重用率、让代码更容易被他人理解、保证代码可靠性。
0 0
- Hadoop学习笔记-Hadoop初识
- hadoop学习笔记-hadoop起源
- hadoop学习笔记 Hadoop进程
- 【hadoop】hadoop学习笔记-回收站
- hadoop学习笔记hadoop学习笔记
- [转]Hadoop学习笔记
- Hadoop学习笔记
- [转]Hadoop学习笔记
- [转]Hadoop学习笔记
- [转]Hadoop学习笔记
- Hadoop学习笔记
- hadoop学习笔记
- Hadoop学习笔记汇总
- hadoop学习笔记
- hadoop学习笔记
- Hadoop 学习笔记
- Hadoop学习笔记
- Hadoop学习笔记
- Android开发,关于一些我没用过,突然知道后相见恨晚的UI组件
- 十六进制转换RGB显示颜
- LINUX重启MYSQL的命令
- Hibernate注解映射联合主键的三种主要方式
- 你连追求自己喜欢的事物与人的勇气都没有,你注定是个失败者。
- Hadoop学习笔记
- inet_ntoa编译提示警告: 格式 ‘%s’ expects argument of type ‘char *’, but argument 2 has type ‘int’ [-Wformat]
- OPPO竞拍巴萨签名版R9 你猜卖了多少钱?
- Boost智能指针
- Prevent to cancel Action Mode by press back button
- 当页面一片空白时的解决方法
- 【Algothrim】动态规划实例三(Domino Tiling )
- Chrome 控制台console的用法
- Unity UGUI基础之Image