Linux内核架构浅谈44-Linux slab分配器：通用缓存与专用缓存的创建与使用

在Linux内核中，内存管理是保障系统高效运行的核心模块之一。当内核需要分配小于一页（通常为4KB）的内存块时，伙伴系统（负责大内存块分配）的效率会显著下降。为解决这一问题，Linux引入了slab分配器，一种基于对象池思想的内存分配机制，通过预分配和复用内存对象，减少内存碎片并提升分配效率。本文将深入解析slab分配器的核心设计，并重点讲解通用缓存与专用缓存的创建、使用及技术细节。

一、slab分配器的核心设计理念

slab分配器的设计灵感源于"对象复用"思想：内核中许多对象（如task_struct、inode、file结构体等）会被频繁创建和销毁，若每次都直接从伙伴系统申请/释放内存，会产生大量内存碎片且耗时较长。slab分配器通过以下方式优化：

对象缓存池：为每种频繁使用的对象创建专属"缓存池"（slab cache），缓存池中预分配多个相同大小的对象实例，分配时直接从池中取，释放时归还给池，避免频繁与伙伴系统交互。
分层管理：slab缓存分为"slab页"和"对象"两级------slab页是从伙伴系统申请的连续物理页，每个slab页内部划分多个相同大小的对象；多个slab页组成一个缓存池，按"满/部分满/空"状态分类管理。
减少碎片：同一缓存池的对象大小固定，且slab页内对象紧密排列，从根本上避免了"内存碎片"问题；同时，对象复用减少了内存分配/释放的次数，降低了CPU开销。

注意：Linux内核为适配不同场景，提供了slab分配器的两种备选方案------slub（针对大系统优化可扩展性）和slob（针对嵌入式系统优化内存开销），但三者接口统一，核心思想一致。本文以标准slab分配器为例展开。

二、slab缓存的两种类型：通用缓存与专用缓存

根据缓存的用途，slab分配器将缓存分为两类：通用缓存（Generic Cache）和专用缓存（Specialized Cache）。二者的核心区别在于"是否绑定特定对象类型"，下面分别讲解其设计场景与使用方式。

2.1 通用缓存：应对任意小内存块分配

通用缓存是内核预定义的一组"固定大小"缓存池，涵盖从几十字节到几KB的常见内存块尺寸（如32B、64B、128B、256B等）。当内核需要分配任意大小的小内存块（且无需绑定特定对象）时，可直接使用通用缓存，无需手动创建缓存池。

核心接口函数

void *kmalloc(size_t size, gfp_t gfp_flags)：从通用缓存中分配指定大小的内存块，gfp_flags指定内存分配标志（如GFP_KERNEL表示可睡眠等待内存，GFP_ATOMIC表示原子分配不可睡眠）。
void kfree(const void *objp)：释放由kmalloc分配的内存块，自动将对象归还给对应的通用缓存池。
size_t ksize(const void *objp)：查询由kmalloc分配的内存块的实际大小（因通用缓存按固定尺寸分配，实际大小可能大于申请大小）。

示例：使用通用缓存分配/释放内存

复制代码

#include <linux/slab.h>  // 包含kmalloc/kfree声明
#include <linux/gfp.h>  // 包含内存分配标志定义

// 内核模块初始化函数
static int __init kmalloc_example_init(void) {
    char *buf1, *buf2;

    // 1. 分配128字节内存（可睡眠等待，适用于非中断上下文）
    buf1 = kmalloc(128, GFP_KERNEL);
    if (!buf1) {  // 内存分配失败检查（内核必须做！）
        pr_err("kmalloc buf1 failed\n");
        return -ENOMEM;
    }

    // 2. 分配64字节内存（原子分配，适用于中断上下文）
    buf2 = kmalloc(64, GFP_ATOMIC);
    if (!buf2) {
        pr_err("kmalloc buf2 failed\n");
        kfree(buf1);  // 释放已分配的buf1，避免内存泄漏
        return -ENOMEM;
    }

    // 3. 使用内存（示例：写入调试信息）
    snprintf(buf1, 128, "kmalloc buf1: size=%zu, actual_size=%zu\n", 128, ksize(buf1));
    snprintf(buf2, 64, "kmalloc buf2: size=%zu, actual_size=%zu\n", 64, ksize(buf2));
    pr_info("%s", buf1);
    pr_info("%s", buf2);

    // 4. 释放内存
    kfree(buf1);
    kfree(buf2);

    return 0;
}

// 内核模块退出函数
static void __exit kmalloc_example_exit(void) {
    pr_info("kmalloc example exit\n");
}

module_init(kmalloc_example_init);
module_exit(kmalloc_example_exit);
MODULE_LICENSE("GPL");  // 内核模块必须声明许可证

输出说明 ：加载模块后，通过dmesg可查看调试信息，其中actual_size可能为128B（buf1）和64B（buf2），即通用缓存按申请大小匹配了最近的固定尺寸池。

2.2 专用缓存：绑定特定对象类型

当内核需要频繁创建/销毁某一特定类型的对象（如inode结构体、socket结构体）时，通用缓存的"固定大小"特性可能导致内存浪费（如对象大小为150B，通用缓存需分配256B块）。此时，可创建"专用缓存"------与该对象类型绑定的缓存池，每个对象大小严格匹配类型定义，且支持对象的"构造/析构"回调（初始化/清理对象数据）。

核心接口函数

struct kmem_cache *kmem_cache_create(const char *name, size_t size, size_t align, unsigned long flags, void (*ctor)(void *, struct kmem_cache *, unsigned long), void (*dtor)(void *, struct kmem_cache *, unsigned long))：创建专用缓存池。
- name：缓存名称（用于调试，如"inode_cache"）；
- size：对象大小（通常用sizeof(struct 类型名)获取）；
- align：对象对齐要求（如0表示默认对齐，8表示8字节对齐）；
- flags：缓存标志（如SLAB_HWCACHE_ALIGN表示按CPU缓存行对齐，提升访问速度）；
- ctor/dtor：对象的构造/析构函数（可选，用于初始化/清理对象数据）。
void *kmem_cache_alloc(struct kmem_cache *cachep, gfp_t gfp_flags)：从专用缓存中分配一个对象。
void kmem_cache_free(struct kmem_cache *cachep, void *objp)：将对象归还给专用缓存。
void kmem_cache_destroy(struct kmem_cache *cachep)：销毁专用缓存（需确保缓存中无未释放对象）。

示例：创建专用缓存管理自定义对象

复制代码

#include <linux/slab.h>
#include <linux/module.h>

// 1. 定义自定义对象类型（示例：设备信息结构体）
struct dev_info {
    int dev_id;         // 设备ID
    char dev_name[32];  // 设备名称
    unsigned long status; // 设备状态
};

// 2. 声明专用缓存指针（全局变量，便于模块内访问）
static struct kmem_cache *dev_info_cache;

// 3. 对象构造函数（创建对象时自动调用，初始化默认值）
static void dev_info_ctor(void *obj, struct kmem_cache *cache, unsigned long flags) {
    struct dev_info *dev = (struct dev_info *)obj;
    dev->dev_id = -1;                  // 默认ID为-1（未初始化）
    memset(dev->dev_name, 0, 32);      // 清空设备名称
    dev->status = 0;                   // 默认状态为0（未激活）
    pr_debug("dev_info object constructed\n");
}

// 4. 对象析构函数（释放对象时自动调用，清理资源）
static void dev_info_dtor(void *obj, struct kmem_cache *cache, unsigned long flags) {
    struct dev_info *dev = (struct dev_info *)obj;
    pr_debug("dev_info object destroyed: dev_id=%d\n", dev->dev_id);
    // 若对象持有其他资源（如指针、锁），需在此处释放
}

// 模块初始化：创建缓存并分配对象
static int __init dev_info_cache_init(void) {
    struct dev_info *dev1, *dev2;

    // 4.1 创建专用缓存
    dev_info_cache = kmem_cache_create(
        "dev_info_cache",          // 缓存名称
        sizeof(struct dev_info),    // 对象大小（匹配struct dev_info）
        0,                         // 默认对齐
        SLAB_HWCACHE_ALIGN | SLAB_POISON,  // 按CPU缓存行对齐 + 内存填充（调试用）
        dev_info_ctor,             // 构造函数
        dev_info_dtor              // 析构函数
    );
    if (!dev_info_cache) {
        pr_err("kmem_cache_create failed\n");
        return -ENOMEM;
    }
    pr_info("dev_info_cache created successfully\n");

    // 4.2 从专用缓存分配对象
    dev1 = kmem_cache_alloc(dev_info_cache, GFP_KERNEL);
    dev2 = kmem_cache_alloc(dev_info_cache, GFP_KERNEL);
    if (!dev1 || !dev2) {
        pr_err("kmem_cache_alloc failed\n");
        // 释放已分配对象，避免内存泄漏
        if (dev1) kmem_cache_free(dev_info_cache, dev1);
        if (dev2) kmem_cache_free(dev_info_cache, dev2);
        kmem_cache_destroy(dev_info_cache);  // 销毁缓存
        return -ENOMEM;
    }

    // 4.3 使用对象（设置设备信息）
    dev1->dev_id = 1;
    strncpy(dev1->dev_name, "eth0", 31);
    dev1->status = 1;  // 标记为激活

    dev2->dev_id = 2;
    strncpy(dev2->dev_name, "sda", 31);
    dev2->status = 1;

    pr_info("dev1: id=%d, name=%s, status=%lu\n", dev1->dev_id, dev1->dev_name, dev1->status);
    pr_info("dev2: id=%d, name=%s, status=%lu\n", dev2->dev_id, dev2->dev_name, dev2->status);

    // 4.4 释放对象（归还给专用缓存）
    kmem_cache_free(dev_info_cache, dev1);
    kmem_cache_free(dev_info_cache, dev2);

    return 0;
}

// 模块退出：销毁专用缓存
static void __exit dev_info_cache_exit(void) {
    if (dev_info_cache) {
        kmem_cache_destroy(dev_info_cache);
        pr_info("dev_info_cache destroyed\n");
    }
}

module_init(dev_info_cache_init);
module_exit(dev_info_cache_exit);
MODULE_LICENSE("GPL");

关键说明：

构造函数dev_info_ctor在对象分配时自动调用，确保对象初始状态一致，避免"野指针"问题；
缓存标志SLAB_POISON会在对象释放时用特定值（如0xa5）填充内存，便于调试"使用已释放对象"的错误；
销毁缓存前必须确保所有对象已释放，否则内核会触发BUG警告。

三、slab分配器的底层交互：与伙伴系统的协作

slab分配器并非独立工作，而是基于伙伴系统实现"大内存块"的申请与释放，二者协作流程如下：

缓存创建阶段 ：调用kmem_cache_create时，slab分配器会向伙伴系统申请若干连续物理页（组成slab页），并将每个slab页划分为多个固定大小的对象，存入缓存池。
对象分配阶段 ：
- 若缓存池中有空闲对象，直接返回对象地址；
- 若缓存池无空闲对象，slab分配器向伙伴系统申请新的slab页（通常为1页或2页），划分对象后再分配。
对象释放阶段 ：
- 将对象标记为空闲，归还给缓存池；
- 若某个slab页内所有对象均已空闲，slab分配器可将该slab页归还给伙伴系统（减少内存占用）。

性能优化点：slab分配器会根据系统负载动态调整缓存池大小------当对象分配频繁时，保留更多slab页减少与伙伴系统的交互；当内存紧张时，主动释放空闲slab页给伙伴系统，提升内存利用率。

四、调试与监控：查看slab缓存状态

Linux内核提供了proc文件系统接口，用于查看slab缓存的运行状态，便于调试和性能分析：

/proc/slabinfo：显示所有slab缓存的详细信息，包括缓存名称、对象大小、slab页数量、空闲对象数量等。例如：
复制代码
```
# 查看inode缓存状态
grep inode_cache /proc/slabinfo
# 输出示例：inode_cache      128  256  640  8  8 : tunables  54  27  8 : slabdata   32   32    0
```
其中"128"表示当前空闲对象数，"256"表示总对象数，"640"表示每个对象大小（字节）。
/proc/meminfo：显示slab分配器使用的总内存量，例如：
复制代码
```
grep Slab /proc/meminfo
# 输出示例：Slab:            123456 kB
```

五、总结与最佳实践

slab分配器通过"对象复用"和"分层管理"，解决了内核小内存块分配的效率与碎片问题。在实际开发中，需根据场景选择合适的缓存类型：

通用缓存（kmalloc/kfree）：适用于"一次性"或"任意大小"的小内存块分配（如临时缓冲区），使用简单无需手动管理缓存池；
专用缓存（kmem_cache_*）：适用于"频繁创建/销毁特定类型对象"的场景（如内核子系统的核心结构体），内存利用率更高且支持对象初始化；
注意事项 ：
- 内核内存分配必须检查返回值（避免NULL指针）；
- 中断上下文只能使用GFP_ATOMIC标志分配内存；
- 专用缓存的构造/析构函数需保持精简，避免睡眠（因分配/释放对象可能在原子上下文执行）。

掌握slab分配器的设计思想与使用方法，是深入理解Linux内核内存管理的关键，也是开发高效内核模块的基础。后续可进一步研究slub/slob分配器的实现差异，以及内存紧张时slab缓存的回收机制。