【读书笔记—Hadoop实战】认识hadoop
来源:互联网 发布:android 启动速度优化 编辑:程序博客网 时间:2024/05/17 20:24
认识hadoop:
- hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据。
- hadoop与其他分布式系统的比较
其他分布式系统:把数据移动计算即将发生的地方——》计算——》返回数据——》存储数据
hadoop:把可执行代码移动到数据所在的机器——》计算——》存储数据
注:网络上移动数据的时间>加载代码的时间
- hadoop与SQL的比较
SQL:针对结构化数据设计
hadoop:针对非结构化数据(如,文本)
- 认识MapReduce——数据处理模型
优点:容易扩展到多个计算节点上处理数据
理解:Map和Reduce其实是两种操作。
We want to count all the books in the library. You count up shelf #1, I count up shelf #2. That's map. The more people we get, the faster it goes.
我们要数图书馆中的所有书。你数1号书架,我数2号书架。这就是“Map”。我们人越多,数书就更快。
Now we get together and add our individual counts. That's reduce.
现在我们到一起,把所有人的统计数加在一起。这就是“Reduce”。 ——注:这里也并不仅仅是一个人在统计,可以很多人参与
我们要数图书馆中的所有书。你数1号书架,我数2号书架。这就是“Map”。我们人越多,数书就更快。
Now we get together and add our individual counts. That's reduce.
现在我们到一起,把所有人的统计数加在一起。这就是“Reduce”。 ——注:这里也并不仅仅是一个人在统计,可以很多人参与
map:输入过滤及转换
reduce:完成聚合
—————————————————————————————————————————————————————————————————————————————
hadoop的构造模块
运行hadoop=在网络分布的不同服务器上运行一组守护进程
- NameNode——名字节点
- 最重要
- 位于HDFS的主端,指导从端的DataNode执行底层的I/O任务
- 跟踪文件如何被分割成文件块,这些块又被哪些节点存储,以及分布式文件系统的整体运行状态是否正常
- DataNode——数据节点
- Secondary NameNode(SNN)——次名字节点
监测HDFS集群状态的辅助守护进程
- JobTracker——作业跟踪节点
应用程序和Hadoop之间的纽带。用于确定执行计划,若任务失败,则自动重启任务。
- TaskTracker——任务跟踪节点
与存储守护进程一样,计算的守护进程也遵循主/从架构. JobTracker作为主节点,监测MapReduce作业的整个执行过程,同时,TaskTracker管理各个任务在每个节点上的执行情况。
—————————————————————————————————————————————————————————————————————————————
为hadoop集群安装SSH
∵如上图,主端要去联络并激活从端上的守护进程(DataNode&TaskTracker)
∴采用无口令的SSH协议来支持远程访问(公钥存在集群的每个节点上,私钥存在主节点)
验证SSH安装:
生成密钥对:
将公钥分布并登陆验证
运行hadoop
1 0
- 【读书笔记—Hadoop实战】认识hadoop
- 读书笔记--《hadoop实战》--第一章
- 《hadoop实战2》读书笔记(1)
- 《Hadoop实战》(陆嘉恒著) 读书笔记
- 认识Hadoop
- 认识hadoop
- 认识Hadoop
- Hadoop认识
- 认识Hadoop
- hadoop实战
- hadoop实战
- Hadoop实战
- Hadoop读书笔记——基础知识
- Hadoop实战之一~Hadoop概述
- hadoop实战(一) hadoop基本概念
- Hadoop实战之一~Hadoop概述
- hadoop(一):认识
- hadoop 认识1
- 用strcmp比较大小
- matlab 稀疏矩阵
- 南京青奥会志愿者标识物揭晓 4条志愿彩最抢眼
- 黑马程序员 C语言常见的一些注意4
- webBrowser获取验证码内存图片到picturebox中
- 【读书笔记—Hadoop实战】认识hadoop
- 阿里云ubuntu系统图形化访问
- 通过 Autostereograms 案例学习 OpenGL 和 OpenCL 的互操作性
- Scrapy研究探索(七)——如何防止被ban之策略大集合
- VS2010编译QT4.8.4遇到“LINK : fatal error LNK1123: 转换到 COFF 期间失败: 文件无效或损坏 “问题
- POJ 2407 Relatives 欧拉函数题解
- MFC设置TAB控件次序的简易方法
- errorLNK1123:转换到COFF期间失败:文件无效或损坏的解决方案
- QByteArray