【Hadoop--01】Hadoop简介

来源:互联网 发布:魔力宝贝宠物达标数据 编辑:程序博客网 时间:2024/06/08 07:31

Hadoop可运行于一般的商用服务器上,具有高容错、高可靠性、高扩展性等特点特别适合写一次,读多次的场景。

适合
大规模数据
流式数据(写一次,读多次)
商用硬件(一般硬件)

不适合
低延时的数据访问
大量的小文件
频繁修改文件(基本就是写1次)

Hadoop架构

这里写图片描述

HDFS: 分布式文件存储
YARN: 分布式资源管理
MapReduce: 分布式计算
Others: 利用YARN的资源管理功能实现其他的数据处理方式
内部各个节点基本都是采用Master-Woker架构

原创粉丝点击