构建分布式系统必学：Linux系统中元数据使用计数机制

来源：互联网发布：怎么用dw制作淘宝网页编辑：程序博客网时间：2024/06/05 03:42

在 Linux 文件系统中，元数据的引用计数主要用于管理元数据（如 inode, dentry 结构）在内存中的创建、使用和释放。了解这部分的机制，有利于深入认识文件系统的运行机制，以及Linux如何在内存中管理元数据。这部分内容也是构建分布式文件系统所必须的知识，由此才能保证元数据在分布式文件系统中的正确使用。

概述

元数据是一个文件系统的重要部分。很多书籍和文章都介绍过 dentry 和 inode 在 Linux 中的作用和机制，但却很少有文献涉及到它们的使用计数（ usage counter ）。使用计数的机制看似很简单：使用了一个元数据就递增，用完了就递减。但在这句简单的描述后面，具体的过程到底是如何进行的呢？这实际上贯穿了整个元数据的操作以及元数据在内存中的管理。了解这部分的机制，是一个很有意思的过程，可以让你看到 Linux 严谨缜密的思路，可以深入认识 Linux 文件系统的运行机制。这部分内容也是构建分布式文件系统所必须的知识。

本文仍然从两方面来介绍使用计数：增加和减少。最后再看一下在分布式环境中有哪些变化。

这里所引用的代码依据的是 Linux 内核 2.6.20 的版本。

回页首

使用计数的增加

创建操作

元数据的创建主要可以分为对文件的创建和对目录的创建。不管是文件还是目录，它们都对应同样的元数据结构，在内存中都有 inode 和 dentry 。

下面我们分别看一下主要的两个创建操作：创建文件和创建目录。

（1）创建文件

创建文件是通过系统调用 sys_open() ，并设置 O_CREATE 标志位来实现的。其调用过程如下：

sys_open() > do_sys_open() > do_filp_open() > open_namei()

在 open_namei() 中，会创建出 dentry 和 inode 结构。先看关于 dentry 的路径：

open_namei() > lookup_hash() > __lookup_hash()

这里会分成3种情况：

在 dcache 中查找： __lookup_hash() > cached_lookup() > d_lookup() > __d_lookup()
分配新的 dentry： __lookup_hash() > d_alloc() > atomic_set(&dentry -> d_count, 1);
在具体文件系统中查找： __lookup_hash() > i_op -> lookup()

和查找有关的内容我们在后面介绍，这里只看创建，也就 d_alloc() ，它会分配一个新的 dentry 结构，在分配的过程中，就会把 dentry 的使用计数初始化为1。在 d_alloc() 中，还会通过函数 dget() 递增父目录的使用计数，这是为了防止父目录在该 dentry 删除前被删除。（“/”除外，它没有父目录）：

d_alloc() > dget(parent) > atomic_inc(&dentry->d_count);

我们再看关于 inode 的路径：

本文转自IBM Developerworks中国

请点击此处查看全文