Linux 3.2中回写机制的变革

writeback机制模型

在Linux-3.2新内核中，page cache和buffer cache的刷新机制发生了改变。放弃了原有的pdflush机制，改成了bdi_writeback机制。这种变化主要解决原有pdflush机制存在的一个问题：在多磁盘的系统中，pdflush管理了所有磁盘的page/buffer cache，从而导致一定程度的IO性能瓶颈。bdi_writeback机制为每个磁盘都创建一个线程，专门负责这个磁盘的page cache或者buffer cache的数据刷新工作，从而实现了每个磁盘的数据刷新程序在线程级的分离，这种处理可以提高IO性能。

writeback机制的基本原理可以描述如下：

在Linux内核中有一个常驻内存的线程bdi_forker_thread，该线程负责为bdi_object创建writeback线程，同时检测如果writeback线程长时间处于空闲状态，bdi_forker_thread线程便会将其进行销毁。bdi_forker_thread在系统中只有一个，其会被定时唤醒，检查全局链表bdi_list队列中是否存在dirty的数据需要刷新到磁盘。如果存在dirty数据并且对应bdi的writeback线程还没有被创建，bdi_forker_thread会为该bdi创建一个writeback的线程进行写回操作。

writeback线程被创建之后会处理等待的work。writeback线程拥有一个定时器会周期性唤醒这个线程处理相应的work。当用户（page cache/buffer cache）有需要处理的inode时，将inode挂载到writeback-> b_dirty链表中，然后唤醒writeback线程去处理相应的dirty_page。inode链表就是writeback线程需要处理的数据；work链表就是控制处理过程中的一些策略，不同的策略可以定义成不同的任务。

通过上述模型，对于块设备或者文件系统而言，实现dirty page的后台刷新主要做如下几个方面的工作：

1，将自己的bdi注册到系统的bdi链表中，通过bdi_forker_thread实现对bdi对象的管理，从而可以实现writeback线程的动态创建、销毁。每个块设备和文件系统都有自己的bdi对象。Ext3文件系统在创建的时候会生成superblock对象，系统会将底层块设备的backing_device关系到这个superblock对象上（在set_bdev_super函数中完成）。如果是块设备的话，在add_disk的时候直接从request_queue中得到bdi对象，然后对其进行初始化。注册bdi对象使用bdi_register_dev函数，对于ext3之类的文件系统不需要重新注册bdi对象，因为其本身就采用了底层块设备的bdi对象。

2，将需要刷新的inode节点挂载到bdi对象所属的writeback->b_dirty上，如果有特殊的work需要writeback线程完成，那么提交一个work即可；如果是通常的周期性刷新，writeback线程会自动创建相应的work。

3，操作writeback的唤醒定时器延迟唤醒writeback线程，或者直接唤醒线程，从而使得inode中radix tree上的dirty page刷新到磁盘。

bdi对象的注册

每个块设备在创建的时候会注册bdi对象（参见add_disk函数），这是Linux-3.2内核不同的地方。文件系统在mount的时候会创建superblock对象，并且通过底层块设备的request queue获取bdi对象（mount_bdev->sget->set_bdev_super）。所以，像ext3之类的文件系统都不需要重新注册bdi对象。当然，如果文件系统重新创建了一个bdi对象，那么还需要调用bdi_register_dev函数注册bdi对象。

小结

本文对linux-3.2中的writeback机制模型进行了阐述，后面还会对writeback机制中的关键函数进行分析说明。该机制是对老系统（Linux-2.6.23等）中pdflush机制的替代，其最重要的变化是每个块设备都分配了writeback线程，使得回写的IO流在各个磁盘之间独立，从而从机制上提高了IO的吞吐量。

出处:http://alanwu.blog.51cto.com/3652632/1109952

时间： 2024-08-31 08:05:55

Linux 3.2中回写机制的变革

Linux 3.2中回写机制的变革的相关文章

linux中的tasklet机制【转】

pdflush linux kernel-磁盘回写内核线程pdflush数量为0

利用Linux和UNIX中的一种最常用的进程间通信机制

Linux系统调用详解（实现机制分析）--linux内核剖析（六）

FreeBSD 5.0中强制访问控制机制的使用与源代码分析(1)

简述Linux 2.6 中的直接 I/O 技术

详解Linux系统内存寻址的分页机制

阿里云课堂：云计算安全体系中的沙箱机制和技术剖析

Android中的IPC机制