Linux内存管理 - slab分配器详解

linux相关视频解析：

Linux有个叫伙伴系统的分配算法，这个算法主要解决分配连续个内存页的问题。伙伴分配算法主要以内存页（4KB）作为分配单位，就是说伙伴分配算法每次可以分配 2order 个内存页（order为0、1、2…9）。但有时候我们只需要申请一个很小的内存区（如32字节），这时候使用伙伴分配算法就显得浪费了。为了解决小内存分配问题，Linux使用了slab分配算法。

slab分配器初始化

slab分配器的初始化由kmem_cache_init()函数完成，如下：

这个函数主要用来初始化cache_cache这个变量，cache_cache是一个类型为kmem_cache_t的结构体变量，定义如下：

为什么需要一个这样的对象呢？因为本身kmem_cache_t结构体也是小内存对象，所以也应该有slab分配器来分配的，但这样就出现“鸡蛋和鸡谁先出现”的问题。在系统初始化的时候，slab分配器还没有初始化，所以并不能使用slab分配器来分配一个kmem_cache_t对象，这时候只能通过定义一个kmem_cache_t类型的静态变量来来管理slab分配器了，所以cache_cache静态变量就是用来管理slab分配器的。

从上面的代码可知，cache_cache的objsize字段被设置为sizeof(kmem_cache_t)的大小，所以这个对象主要是用来分配不同类型的kmem_cache_t对象的。

kmem_cache_init()函数调用了kmem_cache_estimate()函数来计算一个slab能够保存多少个大小为cache_cache.objsize的对象，并保存到cache_cache.num字段中。一个slab中不可能全部都用来分配对象的，举个例子：一个4096字节大小的slab用来分配大小为22字节的对象，可以划分为186个，但还剩余4字节不能使用的，所以这部分内存用来作为着色区。着色区的作用是为了错开不同的slab，让CPU更有效的缓存slab。当然这属于优化部分，对slab分配算法没有多大的影响。就是说就算不对slab进行着色操作，slab分配算法还是可以工作起来的。

kmem_cache_t对象申请

kmem_cache_t是用来管理和分配对象的，所以要使用slab分配器时，必须先申请一个kmem_cache_t对象，申请kmem_cache_t对象由kmem_cache_create()函数进行：

kmem_cache_create()函数比较长，所以上面代码去掉了一些不那么重要的地方，使代码更清晰的体现其原理。

在kmem_cache_create()函数中，首先调用kmem_cache_alloc()函数申请一个kmem_cache_t对象，我们看到调用kmem_cache_alloc()时，传入的就是cache_cache变量。申请完kmem_cache_t对象后需要对其进行初始化操作，主要是对kmem_cache_t对象的所有字段进行初始化：1) 计算需要多少个页面来作为slab的大小。2) 计算一个slab能够分配多少个对象。3) 计算着色区信息。4) 初始化slab_full / slab_partial / slab_free链表。5) 把申请的kmem_cache_t对象保存到cache_chain链表中。

对象分配

申请完kmem_cache_t对象后，就使用通过调用kmem_cache_alloc()函数来申请指定的对象。kmem_cache_alloc()函数代码如下：

kmem_cache_alloc()函数被我展开之后如上代码，kmem_cache_alloc()函数的主要步骤是：1) 从kmem_cache_t对象的slab_partial列表中查找是否有slab可用，如果有就直接从slab中分配一个对象。2) 如果slab_partial列表中没有可用的slab，那么就从slab_free列表中查找可用的slab，如果有可用slab，就从slab分配一个对象，并且把此slab放置到slab_partial列表中。3) 如果slab_free列表中没有可用的slab，那么就调用kmem_cache_grow()函数申请新的slab来进行对象的分配。

一个slab的结构如下图：

灰色部分是着色区，绿色部分是slab管理结构，黄色部分是空闲对象链表的索引，红色部分是对象的实体。我们可以看到slab结构的s_mem字段指向了对象实体列表的起始地址。

分配对象的时候就是先通过slab结构的free字段查看是否有空闲的对象可用，free字段保存了空闲对象链表的首节点索引。

对象释放

对象的释放比较简单，主要通过调用kmem_cache_free()函数完成，而kmem_cache_free()函数最终会调用kmem_cache_free_one()函数，代码如下：

对象释放的时候首先会把对象的索引添加到slab的空闲对象链表中，然后根据slab的使用情况移动slab到合适的列表中。1) 如果slab所有对象都被释放完时，把slab放置到slab_free列表中。2) 如果对象所在的slab原来在slab_full中，那么就把slab移动到slab_partial中。