Linux 内核学习(16) --- linux x86-64 虚拟地址空间和区域

x86_64 的虚拟地址空间

直接映射区和 vmalloc 区域

内核虚拟地址空间直接映射区:

直接映射区是内核虚拟地址空间中一段连续的区域，将物理内存按固定偏移（通常是 PAGE_OFFSET）线性地映射到虚拟地址空间
在 x86_64 架构上，物理地址 0x0 对应的内核虚拟地址通常是 0xffff888000000000（即 PAGE_OFFSET）

设计内核直接映射区原则：

高效访问物理内存：通过简单的加/减偏移即可完成物理地址 ↔ 虚拟地址的转换，无需查页表
用于大块连续物理内存的管理：内核初始化时会将大部分物理内存（如低端内存）通过直接映射区映射，便于快速分配（如伙伴系统分配的页）
性能优化：避免频繁创建/销毁页表项，提高内存访问速度

局限性：

要求物理内存连续：直接映射区只能映射物理上连续的内存页

地址空间有限：在 32 位系统上，直接映射区大小受限（如 896MB），无法覆盖全部物理内存（尤其在大内存系统中）

无法处理不连续物理内存：当需要大块虚拟连续但物理不连续的内存时，直接映射区无能为力

vmalloc 内存区域：

vmalloc 是内核提供的一个函数，它分配的内存在虚拟地址上连续，但物理地址可以不连续
这些内存通过页表动态映射到 vmalloc 区域，通常位于直接映射区之上（在 64 位系统中位于较高地址）

设计原则 ：

解决物理内存碎片问题：当系统运行一段时间后，物理内存可能碎片化，难以分配大块连续物理内存，vmalloc 允许用多个不连续的物理页拼成一个虚拟连续区域

支持大内存分配：适用于需要大块虚拟地址空间（如模块加载、I/O 映射、某些驱动缓冲区）但不要求物理连续的场景

局限性 ：

性能开销：每次访问都需要查页表；分配时需修改页表，可能触发 TLB 刷新

地址空间碎片：频繁的 vmalloc/free 可能导致 vmalloc 区域本身碎片化

不能用于原子上下文：因为可能睡眠（需分配页表等)

举例说明：

kmalloc: 小内存分配通常使用直接映射区(slab/slob/slub 分配器基于伙伴系统，返回直接映射的页)
vmalloc: 加载内核(代码/数据可能较大而且无法保证物理连续)、某些 GPU/设备驱动的缓冲区
ioreamp: 将设备 I/O 内存映射到 vmalloc 区域，因为设备地址不属于普通物理内存

I/O 统一编址与 ioremap

在 ARM 架构处理器中，I/O 地址通常是与内存统一编址的（memory-mapped I/O，简称 MMIO）

ARM 架构没有为 I/O 操作提供独立的 I/O 地址空间（不像 x86 架构那样有专门的 in/out 指令和独立的 I/O 端口地址空间，

相反，ARM 使用内存映射 I/O（Memory-Mapped I/O, MMIO）的方式

外设的寄存器（如 UART、GPIO、定时器等）被映射到系统的物理内存地址空间中
CPU 通过普通的加载（load）和存储（store）指令（如 LDR、STR）来访问这些地址，从而读写外设寄存器

这些地址通常位于系统地址空间的特定区域（例如，SoC 厂商会指定外设寄存器位于 0x40000000 到 0x5FFFFFFF 等范围）

如何在内核空间读写 I/O 地址

ioremap(phys_addr, size) 将一段物理 I/O 地址映射到内核的虚拟地址空间；

返回一个虚拟地址（void __iomem * 类型），后续通过 readl()、writel()、ioread32()、iowrite32() 等专用函数访问；

这些函数确保正确的内存访问语义（如禁止编译器优化、保证访问顺序、处理弱内存模型等)

举例如下：

c 复制代码

// 使用 ioremap 的情况
void __iomem *reg = ioremap(0xFED40000, 4);  // 映射4字节
writel(0x12345678, reg);  // 正确！通过虚拟地址访问

使用的物理空间如下:

shell 复制代码

物理地址空间：
    [0x00000000 - 0x3FFFFFFF] : 系统 RAM（已线性映射）
    [0xFED40000 - 0xFED40FFF] : PCI 设备配置空间
    [0xFEC00000 - 0xFEC00FFF] : APIC 寄存器
    [0xFEE00000 - 0xFEE00FFF] : IOAPIC 寄存器

虚拟地址空间（内核部分）：
    [0xffff888000000000] : 直接映射区（RAM）
    [0xffffc90000000000] : vmalloc/ioremap 区域  ← ioremap 在这里分配虚拟地址
                         │
                         ↓ 建立页表映射
                    [0xFED40000] 物理 I/O 地址

alloc_pages 内存

alloc_pages() 分配的物理内存，其对应的内核虚拟地址位于直接映射区（Direct Mapping Region），也叫线性映射区

alloc_pages() 系列函数（包括 __get_free_pages，kmalloc 的底层也用它）的主要目的是分配连续的物理页面

为了能让内核代码访问这些物理内存，必须将它们映射到内核的虚拟地址空间

直接映射是一种最简单的映射方式：在系统启动早期，内核会建立一个从物理地址到虚拟地址的固定偏移映射。在大多数架构（如 x86-64）上，这个偏移是固定的（例如 0xffff888000000000)

它在内核虚拟地址空间中的典型起始地址是 __PAGE_OFFSET（例如 0xffff888000000000）

地址转换：

当你调用 alloc_pages(GFP_KERNEL, order) 并获得一个 struct page* 指针后，可以通过 page_to_virt(page) 宏来获取这块内存对应的内核虚拟地址

虽然 alloc_pages() 默认返回直接映射区的虚拟地址，但通过使用不同的标志，可以改变其行为，使其映射到其他区域：

GFP_HIGHUSER：当用于用户空间内存分配时（例如通过 page fault 处理程序），分配的物理页面最终会被映射到用户进程的虚拟地址空间，而不是内核的直接映射区。
__GFP_HIGHMEM（在 32 位系统上重要）：在 32 位系统上，直接映射区大小有限（通常约 896MB），无法映射所有物理内存超出部分称为"高端内存"，使用此标志分配的页面，其物理地址可能没有固定的内核虚拟地址。内核需要通过 kmap 等临时映射机制来访问它们

但在 64 位系统上，由于虚拟地址空间极其庞大，已经废除了高端内存的概念，所有物理内存都可以线性映射

Linux 内核学习(16) --- linux x86-64 虚拟地址空间和区域

目录

x86_64 的虚拟地址空间

直接映射区和 vmalloc 区域

I/O 统一编址与 ioremap

alloc_pages 内存