从硬件角度来看内存,随机存储器(RAM)是与 CPU 直接交换数据的内部存储器。现在大部分计算机使用双倍速率同步同态随机存储器(DDR)的存储设备,DDR 包括 DDR3L、DDR4L、LPDDR3/4等。DDR的初始化一般在 BIOS 或 Bootloader 中完成,BIOS 或 Bootloader 把 DDR 的大小传递给 Linux 内核,因此从 Linux 内核的角度来看,DDR 其实就是一段物理内存空间。
内存架构之 UMA 和 NUMA
在现在广泛应用的计算机系统中,以内存为研究对象可以分成两种架构,一种是统一内存访问(Uniform Memory Access,UMA)架构,另一种是非统一内存访问(Non-Uniform Memory Access,NUMA)架构。
- UMA 架构:内存有统一的结构并且可以统一寻址。目前大部分嵌入式系统、手机操作系统以及台式机操作系统等采用 UMA 架构。
- NUMA 架构:系统中有多个内存节点和多个 CPU 簇,CPU 访问本地内存节点的速度最快,访问远端的内存节点的速度要慢一点。
总结对比
| 特性 | UMA | NUMA |
|---|---|---|
| 访问一致性 | 均匀 | 非均匀(本地 vs 远程) |
| 可扩展性 | 差(通常≤4 CPU) | 优秀(可支持数百CPU) |
| 性能瓶颈 | 共享内存总线/控制器 | 节点间互联带宽与延迟 |
| 编程复杂度 | 简单(透明) | 复杂(需考虑数据位置) |
| 典型系统 | 单CPU多核系统,老旧SMP服务器 | 现代多路服务器,高端工作站 |
| 内存控制器位置 | 集中(北桥) | 分布式(集成在每个CPU内) |
| 操作系统支持 | 通用支持 | 需要NUMA感知的调度与内存策略 |
重要认知
- 现代个人电脑通常是"混合"的: 在一台单CPU的多核电脑上,对系统内存的访问是UMA。但如果该CPU内部有多个CCD/集群(如AMD Ryzen),其L3缓存可能是NUMA-like结构。
- 虚拟化与云的影响: 在云环境中,一个虚拟机可能被调度到物理NUMA节点的某一部分上。管理员和用户需要了解NUMA配置以获得最佳性能。
- 性能优化的关键: 对于NUMA系统,"让数据靠近计算"是最高指导原则。这需要操作系统、运行时库和应用程序的共同努力。
简单来说,UMA是小而简单的统一视图,NUMA是大而高效的分布式方案。随着核心数量的不断增加,NUMA已成为多处理器系统事实上的标准架构。

