数据缓冲区高速缓冲区学习总结1

来源:互联网 发布:c 程序员面试宝典 编辑:程序博客网 时间:2024/06/05 02:18

转载:http://blog.chinaunix.net/uid-20729583-id-1884567.html

下面所分析是linux早期内核的缓冲区结构,这里仅仅是为了用来了解缓冲区的基本应用,对于目前的2.6内核有着很大的区别,但是,从这里可以逐步地对linux内核进行深入学习。这里仅仅是一个简单的介绍。


    一个缓冲头结构中标志了对应缓冲块的相关性质,采用缓冲头结构组来对整个缓冲区的缓冲块进行管理,操作方便。在缓冲区中,低端存储区存放的是对应缓冲头结构,高端区对应的是缓冲区数据结构,这是在进行缓冲区初始化过程中,初始化程序从整个缓冲区的两端开始,分别同时设置缓冲区头结构和对应的缓冲区。即第一个缓冲区头结构所对应的是最后一个缓冲数据块,如此递推下去。(缓冲块是1024个字节的块)

缓冲头结构的结构分析:
设备号、块号、状态(含有当前缓冲区状态)以及其他一些算法所需要的数据。
高速缓冲块采用hash表和包含所有缓冲区块的链表来进行管理操作。
1块缓冲区即1024个字节,低端(对应各缓冲块的缓冲头结构)分别建立起对应各缓冲块的缓冲头结构buffer_head,这些缓冲头连接成链表,从而对整个缓冲区进行操控。
下面这个是linux0.11内核中所定义的缓冲区头结构:
struct buffer_header{
    char *b_data;
    unsigned short b_dev;
    unsigned char b_uptodate;
    unsigned char b_dirt;
    unsigned chart b_count;
    unsigned char b_lock;
    struct task_struct * b_wait;    
    struct buffer_head *b_prev;
    struct buffer_head *b_next;
    struct buffer_head *b_prev_free;
    struct buffer_head *b_next_free;
}
(我们所研究的缓冲区是磁盘块在主存中的拷贝,一个缓冲区的数据与文件系统上一个逻辑磁盘块中的数据想对应,并且内核是通过考察缓冲区头部中的标识字符来识别缓冲区内容的。缓冲区的内容并不是永久存在的,而是每隔一定时间间断就会发生更新的区域。)

b_block锁定标志,表示驱动程序正在对该缓冲区内容进行操作,此时该缓冲区不能被第二者访问。这里可以发现,对缓冲区的直接操作是驱动程序,而不是应用程序,应用程序通过调用系统调用来对缓冲区进行相应的操作。

思考:向缓冲块中写数据的写操作不由CPU控制,CPU起到 的只是控制管理功能而已。而缓冲块中写数据写操作则是由硬件来完成,如何为完成???

b_count缓冲buffer使用之计数值,表示相应缓冲块正被各个进程使用的次数,主要用于对缓冲块的程序引用计数管理,所谓空闲块指b_count=0的块。

b_update是数据更新标志,说明缓冲块中数据是否有效。b_dirt和b_update标志的应用是很重要的,同时一很容易弄混淆,b_dirt所起到的作用是当缓冲区中的数据被改变时,相应的b_dir被赋值为1,表明此时缓冲区中的数据与磁盘块中的数据是不同的,这就意味着磁盘中的数据需要重新写,即更新,所使用的是延迟写。而b_update说明缓冲块中的数据是否有效。当我们将释放块时,这两个值被赋为0,表明该缓冲区中的数据无效,这里的释放块指的是将缓冲区的数据进行了释放更新,缓冲区中的数据已经不再被当前进程使用,而磁盘中的数据并没有丢失,只是缓冲区中的数据丢失了而已。当b_dir比指明为1时,用通俗的话说这个块脏了,需要将其中的内容写入磁盘块中,但是此时还没有将其放入到磁盘中,所以数据是无效的。只有当数据被写入到磁盘设备或者是从块设备中读入缓冲块时,数据才是变为有效的。

接下来,来看看缓冲头结构buffer_head结构中字段类型为buffer_head的几个字段的用法,下面这个函数是从linux0.11内核代码中摘录下来的,主要是使用了buffer_head这几个字段来进行操作,很容易理解:
函数的功能是:将缓冲块插入空闲链表尾部,同时放入hash队列中。
static inline void insert_info_queues(struct buffer_head * bh)
{
   bh->b_next_free=free_list;//将bh指向的下一个节点指定为free_list,即空闲表的头指针;
   bh->b_prev_free=free_list->b_prev_free;//将bh的后指针指向为之前空闲表的最后一个节点;
   free_list->b_prev_free->b_next_free=bh;
   free_list->b_prev_free=bh;
   bh->b_prev=NULL;
   bh->b_next=NULL;
   if(!bh->b_dev)
          return;
   bh->b_next=hash(bh->b_dev,bh->b_blocknr);
   hash(bh->b_dev,bh->b_blocknr)=bh;
   bh->b_next->b_prev=bh;
}
以上的代码程序就是对buffer_head中buffer_head字段的使用,这就是这些字段作用之一,有趣吧!


现在来分析缓冲区所使用的两个数据结构:散列表和空闲表。
缓冲区中的所有块是通过散列表进行管理和操作的,对于磁盘而言,如果要使用散列表来进行管理,其散列表是不变的。但是,高速缓冲区中的散列表是变化着的。散列表的控制操作是由对应的散列函数进行实施的。要注意的是,缓冲块所存在的散列表并不是规定的,可以结合实际来安排,当然,系统所追求的是一种均衡的分配方式,这样做只是为了更好地对缓冲块进行管理,同时效率也是很高的!
一个缓冲块可以存在于两个链表中:散列表或者是空闲表。如果我们需要寻找一个特定的缓冲块,我们可以在散列表中寻找,举个例子:在一个操作系统中,有多个进程在执行着,现在进程1在使用一个缓冲块,此时进程2也需要访问相应的块,那么进程2就会在散列表中进行寻找,而不是到空闲表中寻找。
而buffer_head结构的字段:b_next、b_prev、b_prev_free、b_next_free就是用来对散列表和空闲表进行操作的。
这仅仅是对缓冲区头结构进行的一个简单的学习总结,还有相应算法会频繁使用到这些字段,相应的总结将在后面的总结中列出。

如果相对高速缓冲有更直接的认识,了解内存结构是很有好处的,所以,要把内存管理弄明白。呵呵!
0 0
原创粉丝点击