HDFS--笔记

来源:互联网 发布:mac 删除文件夹的命令 编辑:程序博客网 时间:2024/06/05 00:10
HDFS的简介
分布式的文件系统,基于流数据模式访问和处理超大文件的分布式文件系统


Hadoop Distributed File System




HDFS的优点
处理超大文件
流数据访问
运行廉价的商用服务器上


HDFS的缺点
无法高效存储大量的小文件(元数据信息增大会造成NameNode的压力增大)
不适合处理低延迟的数据访问
不支持多用户对同一个文件的写入
不支持任意的修改


HDFS的特点
高容错性,三个副本,
可扩展和配置性(可以任意增加节点)
夸平台
机架感知
负载均衡
shell命令接口
安全模式(不允许写,监测数据块,不允许执行JOB)


HDFS的核心设计
数据块(Block):数据以块固定大小的方式进行存储,128M
数据复制:以块来进行复制,可以配置复制因子 默认是3个
数据副本的存放策略:
分布存储在不同的节点上
每个数据块保存默认是3个副本
同一个数据的三个副本的存放
第一个副本存在离客户端近的机架上的某一台节点上
第二个副本存在相邻或者另外一个机架上的某一台节点上
机架感知
心跳机制:从节点通过NodeManager 向主节点ResourceManager每隔3秒钟发送心跳数据(从节点的cup 内存 磁盘等等资源使用情况)
ResourceManager在心跳的返回值中分配任务和指令给从节点的NodeManager




HDFS的体系结构
主从架构
Master/Slave
NameNode(元数据管理和存放)
SecondaryNameNode(辅助NameNode将edit和fsimage文件进行合并,生成新的fsimage,然后将文件返回给NameNode)
DataNode 从节点,用来存放数据的

Write:向HDFS写入文件
客户端-------》ResourceManager
NameNode  DataNode
Client-----》NameNode (提供blockId的列表)
Client-----》DataNode

Read:向HDFS读取文件
Client-----》ResourceManager
NameNode  DataNode
Client-----》NameNode(文件的名字...)
Clinet-----》DataNode
HDFS的设计目标
监测故障和快速恢复
大规模数据集的处理
流式数据访问
简化一致性模型,一次写入,多次读取
移动计算要比移动数据的代价要低
在异构的平台上可以移植
通信协议是基于tcpip的ipc rpc协议







0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 孑母奸情在线播放 大嫂中文字幕129视频在线 做饭的时候儿子从后面 艳姆1-6无删减完整 儿子你不能这样啊国语 在线 在厕所里肉妈咪第一章 儿子你不能这样啊国语17分钟 不行 我们不能这样 征服护士妈全文目录34章 迷糊故意穿超短裙坐公交 大妈咪女教师全集 雪白短裙教师妈咪风雨夜 母亲轮陷公交 客厅弄醒穿花裙子午睡的妈 沙发午睡花裙子在线资源 公交上的妈咪 儿子你要高就快点你国语 花裙子母亲午睡 儿子你不能这样啊国语高清 被要求穿超级短的超短裙 穿花裙子躺在沙发上 客厅弄醒午睡的妈连接 家庭毋HH伦s线视频中字 客厅弄硬午睡的儿子短文 客厅搞午睡的母亲 弄醒客厅午睡的母亲在线播放 弄醒午睡的妈视频连接 在客厅睡的午的母亲电影 客厅午睡的母亲在线下载 韩国午睡弄醒午睡的妈 在客厅弄醒午睡的 客厅午睡的母亲穿裙子在线播放 客厅午睡的母亲自拍 客厅里硬搞午睡的母亲视频 对白搞硬沙发午睡的儿子 客厅沙发儿子碎花裙 电影客厅午睡的母亲 客厅午睡以为你是爸爸 客厅弄醒午唾的儿子 客厅搞硬午睡的儿子小说 客厅弄醒穿花裙子午睡的妈电影