GFS笔记

来源:互联网 发布:递归算法流程图 编辑:程序博客网 时间:2024/05/21 19:02

     一个GFS集群包含一个Master节点(逻辑上的)和多台Chunk服务器。如图:

       这些chunk服务器通常是普通的Linux机器。GFS中的每个文件被划分成为多个Chunk,每个Chunk默认为64MB,Chunk服务器存储的是Chunk的副本,副本以文件形式存储。

       master管理所有文件系统的元数据,包括:文件名字空间;Chunk与文件名字的映射以及Chunk副本的位置信息。

       GFS客户端以库的形式连接到应用程序中,客户端代码实现了GFS文件系统的API。客户端首先访问Master节点,获取交互的ChunkServer信息,然后访问这些
ChunkServer,完成数据存取工作。这种设计方法实现了控制流和数据流的分离。 Client与Master之间只有控制流,而无数据流,极大地降低了Master的负载。Client与ChunkServer之间直接传输数据流,同时由于文件被分成多个Chunk进行分布式存储,Client可以同时访问多个ChunkServer,从而使得整个系统的I/O高度并行,系统整体性能得到提高。