AMD NPT: Nested Page Tables,有时也被称为 RVI。
Intel EPT: Extended Page Tables。
它们都是为了解决同一个核心问题:内存地址转换在虚拟化环境下的性能开销。
共同点:解决的问题
在没有 NPT/EPT 之前,虚拟机进行内存访问时,地址转换过程非常繁琐:
-
客户虚拟机 使用自己的页表,将 客户虚拟地址 转换为 客户物理地址。
-
因为客户机认为自己在操作真实的物理内存,但实际上它只是在操作宿主物理内存的一部分("客户物理地址"是宿主物理地址的一个子集)。
-
因此,虚拟化管理程序必须介入,通过 "影子页表" 来维护 客户虚拟地址 到 宿主物理地址 的最终映射。
-
这个过程需要大量的软件模拟和虚拟机退出,导致很高的性能开销。
NPT 和 EPT 的核心理念完全相同 :
在硬件层面为内存管理单元提供两级页表,由硬件直接完成两次地址转换,从而消除影子页表的开销。
-
第一级 :客户机操作系统管理的 客户页表 ,负责 客户虚拟地址 -> 客户物理地址 的转换。
-
第二级 :虚拟化管理程序管理的 嵌套页表 / 扩展页表 ,负责 客户物理地址 -> 宿主物理地址 的转换。
MMU 会自动、并行地 查找这两级页表,直接将 客户虚拟地址 转换为 宿主物理地址。这大大减少了虚拟机退出的次数,显著提升了内存访问密集型应用的性能。
差异点:具体实现
由于 AMD 和 Intel 的 CPU 架构和页表结构本就不同,NPT 和 EPT 在实现细节上存在差异。下表清晰地展示了它们的核心区别:
特性 | AMD NPT | Intel EPT |
---|---|---|
页表结构 | 与 x86-64 标准页表结构相同 | 独立设计的页表结构 |
层级与地址宽度 | 与客户机页表层级一致 (如4级或5级)。客户物理地址宽度通常为48位。 | 固定为4级 结构,不受客户机页表层级影响。客户物理地址宽度可达52位。 |
TLB 结构 | 单一、统一的 TLB,同时缓存客户虚拟到宿主物理的最终映射。 | 分离的 TLB : 1. VPID : 缓存客户虚拟到客户物理的映射。 2. EPT: 缓存客户物理到宿主物理的映射。 |
关联技术 | ASID,用于在 TLB 中区分不同客户机的地址空间。 | VPID,功能与 ASID 类似,标记不同的虚拟机。 |
设计哲学 | 简化与统一。复用现有页表设计,硬件逻辑相对统一。 | 灵活与独立。二级页表完全独立设计,可能提供更大的物理地址空间灵活性。 |
差异的详细解释
页表结构与一致性
AMD NPT 的设计非常"对称"。它直接复用了 x86-64 架构原有的页表格式和遍历逻辑。如果客户机使用 4 级页表,NPT 也用 4 级;如果客户机升级到 5 级页表,NPT 也随之变为 5 级。这种设计简化了硬件实现。
Intel EPT 则采用了一套全新的、独立的 4 级页表结构,与客户机使用的页表层级无关。这给了 Hypervisor 更多的灵活性,并且从一开始就支持更大的客户物理地址空间(52位)。
TLB 结构与性能影响
AMD NPT 使用一个统一的 TLB。这个 TLB 直接缓存了从 客户虚拟地址 到 宿主物理地址 的最终映射。一旦命中,速度极快。但当宿主物理地址映射改变时(如内存气球技术、内存迁移),需要刷新相关的 TLB 条目。
Intel EPT 的 TLB 结构在概念上是分离的(尽管现代CPU内部可能非常复杂)。VPID 负责缓存 GVA->GPA 的映射,EPT 负责缓存 GPA->HPA 的映射。这种分离可能在某些工作负载下(如宿主映射频繁变动)更有优势,因为只需要无效 EPT TLB,而不影响 VPID TLB。