从硬件角度看Linux的内存管理

1. 分页机制

分段机制的地址映射颗粒度太大,以整个进程地址空间为单位的分配方式导致内存利用率不高。

分页机制把这个分配机制的单位继续细化为固定大小的页(Page),进程的虚拟地址空间也按照页来分割,这样常用的数据和代码就可以以页为单位驻留在内存中。而那些不常用的页可以交换到磁盘,从而节省物理内存,这比分段机制要高效很多。

进程以页为单位的虚拟内存通过CPU的硬件单元映射到物理内存中,物理内存也是以页为单位来管理,这些物理页称为物理页面(Physical Page)或者页帧(Page Frame)。进程虚拟地址空间的页,我们称为虚拟页(Virtual Page)。操作系统为了管理这些帧需要按照物理地址顺序给每个页编号,叫作页帧号(Page Frame Number, PFN)。

分页机制的实现离不开硬件的实现,在CPU内部专门有一个硬件单元来负责这个虚拟页面到物理页面的转换,它就是一个称为内存管理单元(Memory Mangement Unit, MMU)的硬件单元。ARM处理器的内存管理单元包括TLB(translation lookaside buffer)和页表遍历单元(Table Walk Unit)两个部件。

  • TLB是一块高速缓存(Cache),用于缓存页表转换的结果,从而减少内存访问的时间。

一个完整的页表翻译和查找的过程叫作页表查询(Translation Table Walk),页表查询的过程由硬件自动完成,但是页表的维护需要软件来完成。页表查询是一个相对耗时的事情,理想的状态是TLB里面缓存有页表转换的相关信息。当TLB未命中时,才会去查询页表,并且开始读入页表的内容。ARM内存管理架构如下所示:

2. 页表

ARM32的虚拟地址VA[31:0]可以分成两部分:一部分是虚拟页面内的偏移量,以4KB页为例,VA[11:0]是虚拟页面内的偏移量;另一部分用来确定属于哪个页,我们称其为虚拟页帧号(Virtual Page Frame Number, VPN)。对于物理地址,也是类似的,PA[11:0]表示物理页帧的偏移量,剩余部分表示物理页帧号(Physical Frame Number, PFN) 。MMU的工作内容就是把VPN转换成PFN。处理器通常使用一张表来存储VPN到PFN的映射关系,这个表称为页表(Page Table, PT(进程都有自己独立的页表))。页表中每一个表项称为页表项(Page Table Entry, PTE)。 若将整张页表存放在寄存器中,则会占用很多硬件资源, 因此通常的做法是把页表放在主内存里,通过页表基地址寄存器(Translation Table Base Register, TTBR)来指向这种页表的起始地址。页表查询过程如图所示。处理器发出的地址是虚拟地址,通过MMU来查询页表,处理器得到了物理地址,最后把物理地址发送给内存控制器,从而访问物理页面。

3. 虚拟地址到物理地址的转换

下图展示了ARM32二级页表的查询过程,以4KB页为例,VA[31:20]用作一级页表的索引值,共有12位,最多可以索引4096个页表项;VA[19:12]用作二级页表的索引值,共有8位,最多可以索引256个页表项。当操作系统复制一个新进程时,首先会创建一级页表,分配16KB页面。本场景中,一级页表有4096个页表项,每个页表项占4字节,因此一级页表大小是16KB。当操作系统准备让该进程执行时,设置一级页表在物理内存中的起始地址到页表基地址寄存器中。进程执行过程中需要访问物理内存,因为一级页表的页表项是空的,这会触发缺页异常。在缺页异常里分配一个二级页表,并且把二级页表的起始地址填充到一级页表的相应页表项中。接着,分配一个物理页面,并把这个物理页面的帧号填充到二级页表的对应页表项中,从而完成页表的填充。随着进程的执行,它需要访问越来越多的物理内存,操作系统会逐步地把页表填充和建立起来。

当TLB未命中(Miss)时,处理器查询页表的过程如下图所示:

  • 处理器根据页表基地址控制寄存器TTBCR和虚拟地址来判断使用哪个页表基地址寄存器,是TTBR0和TTBR1。页表基地址寄存器中存放着一级页表的基地址。
  • 处理器根据虚拟地址的bit[31:20]作为索引值,在一级页表中找到页表项。一级页表一共有4096个页表项。
  • 一级页表的页表项中存放有二级页表的物理基地址。处理器将虚拟地址的bir[19:12]作为索引值,在二级页表中找到相应的页表项。二级页表有256个页表项。
  • 二级页表的页表项里面存放有4KB页的物理基地址,因此处理器就完成了页表的查询和翻译工作。

Note:

一级页表相当于把一本书缩小成几页的目录,通过目录来查询书的内容。但是有个问题,如果书非常厚,目录页非常多,那自然而然可以继续分,把一级目录当成一本教材,再建立一个目录,二级页表由此诞生,就是把页表当成教程,再建立页表。

相关推荐
源远流长jerry15 分钟前
Linux 网络性能优化:从应用到内核
linux·运维·服务器·网络·网络协议·性能优化
goyeer19 分钟前
【ITIL】指导原则
linux·运维·服务器·数字化·itil
顶点多余40 分钟前
自定义协议、序列化、反序列化实现
java·linux·开发语言·c++·tcp/ip
Bruce_kaizy1 小时前
c++ linux环境编程——从应用层到linux内核深入了解文件io的调用机制(爆肝)
linux·c++·c·嵌入式linux·文件io
浪客灿心1 小时前
Linux网络IP协议
linux·网络·tcp/ip
yuanpan1 小时前
Python + psutil 实战:开发一个简易系统监控工具
linux·运维·python
坚持就完事了1 小时前
Linux的ln命令
linux·运维·服务器
绿豆人1 小时前
操作系统上电后流程
linux·服务器
sbjdhjd2 小时前
企业级 Docker 镜像仓库建设与运维规范
linux·运维·docker·云原生·容器·eureka·开源
TEC_INO2 小时前
Linux_54:RV1126的VI模块讲解
linux·运维·人工智能