程序博客网 > 深圳网络服务公司

HDFS中的数据存储路径——StorageDirectory

来源：互联网发布：深圳网络服务公司编辑：程序博客网时间：2024/05/14 13:39

在HDFS中，无论是NameNode节点还是DataNode节点都需要使用它们所在的本地文件系统来存储与自己相关的数据，如：NameNode节点存储系统命名空间的元数据，DataNode节点存储文件的数据块数据。对于NameNode节点或是DataNode节点，我们多可以为它们配置多个本地文件系统的存储路径，不同的是，NameNode节点中的所有存储路径存储的数据基本上是一样的，而DataNode节点中的存储路径会分别存储不同的文件数据块。HDFS对节点存储路径的实现被抽象成了一个StorageDirectory类。

StorageDirectory类主要包含三个属性：

root：节点存储目录所在本地文件系统的目录；

lock：排它锁，同步控制节点对该存储目录的操作；

dirType：存储路径所属的节点类型(NameNode/DataNode)；

无论是NameNode节点还是DataNode节点，StorageDirectory都会把它们出过来的数据保存到自己的子目录current/下，同时为了保证数据的一致性，在子目录current/下都会有一个版本文件VERSION。但是，NameNode节点和DataNode节点的存储目录下的版本文件VERSION的内容有一点不同，如

NameNode存储目录的版本文件：

DataNode存储目录的版本文件：

在HDFS集群中，每一个DataNode节点的每一个存储路径的namespaceID必须与NameNode节点的namespaceID保持一致，否则该DataNode节点将中止启动，NameNode节点的namespaceID在它format是生成，也就是说NameNode节点没格式化一次，就会产生一个新的namespaceID。另外，storageID是DataNode节点向NameNode节点第一次注册时，NameNode为它分配的一个分布式存储器标识，一个DataNode节点中所有存储路径的storageID是一样的。当然，NameNode和DataNode的存储路径中存储的数据文件也是不一样的。

NameNode存储目录current/中的文件包括：

DataNode存储目录current/中的文件包括：

StorageDirectory除了提供保存节点数据的功能外，还提供了对存储数据的粗粒度事务操作如：备份/恢复/提交等。那么，StorageDirectory是如何实现这些事务性操作的呢？

通过上面操作流程图，对于存储路径中的数据的备份(升级)/恢复/提交操作可以说是一目了然，但是还有一个问题就是当节点在执行上面操作的某一个过程中突然宕机了，那么这个节点在下一次启动如何进行恢复上一次的中断操作呢？其实，StorageDirectory在在恢复它存储的数据之前会先分析自己所出的状态(analyzeStorage()方法)，然后根据自己当前作出的状态来执行相应的恢复操作(doRecover()方法)。这个分析过程及对应的恢复操作如下：

深圳网络服务公司

深圳网络服务公司

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子平和精英暗夜危机哪里可以躲平和灵通岩风景区上海平和双语学校平和蜜柚价格平和是什么意思平年和闰年怎么计算琯溪蜜柚蜜柚红心蜜柚化痰平喘片平喘药止咳平喘糖浆平喘固本汤止咳平喘小儿止咳平喘远红外止咳平喘贴北京平四平四交谊舞平四炮七平四交谊舞平四西平四季北京平四交谊舞杨艺北京平四花样全集什么不平四字成语北京平四基本步教学平四步舞基本步教学北京平四花样全集平四步基本步教学分解动作交谊舞平四步花样全集平四基本步分解动作杨艺北京平四1一10分解动作交际舞平四步分解动作双人舞平四步分解动作杨艺平四舞步交谊舞北京平四杨艺北京平四全部花样舞步武平四星酒店平四舞曲经典老歌平四步舞分解动作平四步双人舞