hdfs工作机制及读写数据简要流程图

来源:互联网 发布:mac版金蝶友商智慧记 编辑:程序博客网 时间:2024/06/05 19:09

概述

  1. hdfs是一个分布式文件系统,它所管理的文件被切块存储在若干台datanode服务器上
  2. hdfs提供了一个统一的目录树,用来定位hdfs中的文件,客户端访问文件是只要指定目录数即可,不用关心文件的具体物理存放位置
  3. 每一个文件的切块在hdfs的集群中都可以保存多个副本(默认3个)
  4. hdfs中有一个关键服务进程namenode,它维护了一个hdfs的目录树 及 hdfs目录结构与文件真实存储位置之间的映射关系(元数据),还有一个datanode服务进程专门负责接收和管理“文件块”– block,block的默认大小为128M(可配置) dfs.blocksize

作业简图

hdfs工作机制图

写数据

hdfs写数据

读数据

hdfs读数据

0 0
原创粉丝点击