《Linux操作系统原理分析之linux存储管理(1)》(17)
- [6 Linux存储管理](#6 Linux存储管理)
-
- [6.2 选段符与段描述符](#6.2 选段符与段描述符)
-
- [6.2.1 选段符](#6.2.1 选段符)
- [6.2.2 段描述符](#6.2.2 段描述符)
- [6.2.3 分段机制的存储保护](#6.2.3 分段机制的存储保护)
- [6.3 80x86 的分页机制](#6.3 80x86 的分页机制)
-
- [6.3.180x86 的分页机制](#6.3.180x86 的分页机制)
- [6.3.2 分页机制的地址转换](#6.3.2 分页机制的地址转换)
- [6.3.3 页表目录与页表表项](#6.3.3 页表目录与页表表项)
- [6.3.4 分页机制的存储保护](#6.3.4 分页机制的存储保护)
- [6.3.5 快表 TLB](#6.3.5 快表 TLB)
6 Linux存储管理
6.2 选段符与段描述符
6.2.1 选段符
选段符的作用:确定所选的段描述符在段描述符表中的位置。
选段符由 3 个部分组成,如下所示:
其中:
👉RPL(Reques Privilege Level):请求特权级,即访问者的特权级,分为 0、1、2、3 四级,0 级最高,3 级最低。Linux 中仅使用其中两个级别:0 级为内核级,3 为用户级。
👉TI(Table Indictor):描述符表的种类。0 为访问全局描述符表 GDT,1 为访问局部描述符表LDT。
👉INDEX:索引值。指出段描述符在描述符表中的偏移量。INDEX 13 位,则可以最大可描述 8K 个段。
如何确定描述符在描述符表中的偏移地址?
INDEX 是描述索引表的索引值,实际上是描述符在描述符表中的序号。每个描述符的长度为8B,所以描述符相对于表基地址的偏移地址实际是:INDEX 乘以 8。而实际该值并不需要计算,只要将 INDEX 的值左移 3 位,低地址部分 3 位补 0,形成的 16 位地址就是偏移地址。
6.2.2 段描述符
在 80x86 线性地址空间中,所有的段根据它们所存放的内容可以分为两类:
👉常规段:存放代码、数据、堆栈的段,无论是用户的还是系统的。
👉系统段:存放系统管理用的各种数据结构,如进程状态段 TSS、中断矢量表、系统调用表等。相应地,段描述符也有两种:常规段描述符、系统段描述符。本书中只介绍常规段描述符。
64 位常规段描述符主要分为以下四个部分:
1.段基址:32 位(分布在段描述符 16~39 位和 56 ~63 位)指出段在线性地址空间的起始地址。
2.段限:20 位(分布在段描述符 0~ 15 位和 48~51 位)段限加 1 是段的长度。
3.访问属性:8 位(40~47 位)定义了段的类型、操作属性及保护特性。
4.辅助特性:4 位(52~55 位)定义了段的其他属性。
访问属性
访问属性 | 含义 |
---|---|
P(present) | 存在位。 |
DPL(Descriptor privilege Level) | 段的访问特权级。它是段本身的访问特权分为 0、1、2、3 四级,0 级最高,3 级最低。Linux 中仅使用其中两个级别:0 级为内核级,3 为用户级。 |
S(Segment) | 段种类。0:系统段,1:常规段。 |
E(Executive) | 执行位。表示段的类型:0 表示数据段;1 表示代码段。 |
C/ED | 相容性/扩展位。 代码段(S=1,E=1)中,C=1 表示在满足一定条件下段可以执行。C=0 表示段不能执行; 数据段(S=1,E=0)中,对堆栈段而言:ED =1 表示向上扩展堆栈。ED =0 表示向下扩展堆栈。 |
R/W | 读写位。 代码段(S=1,E=1)中,R/W =1 表示可读可执行。R/W =0 表示不可读但可执行; 数据段(S=1,E=0)中,R/W =1 表示可读可写。R/W =1 表示可读禁止写。 |
A | 访问位。A=0 表示该段尚未被访问;A=1 表示该段已被访问过。 |
辅助特性:
辅助特性 | 含义 |
---|---|
G(granularity) | 粒度,指段的单位长度,G=1 表示段长度以页面(4K)为单位,在常规段描述符中 G=1;G=0 表示段长度以字节为单位,在系统段描述符中 G=0。 |
D | 操作长度,只用于代码段描述符中,D=1 位 32 位代码段,D=0 为 16 位代码段。 |
R | 系统保留(值为 0) |
U | 可以由 os 系统程序员自行定义使用,linux 未用。 |
6.2.3 分段机制的存储保护
1.地址越界保护
其实 GDT、LDT 中的段限就是用于地址越界保护。
2.存取控制保护
存取控制保护从两个方面来保证信息安全:
👉设置对存储区域的访问权限
RPL:规定访问者的访问权限;
DPL:规定段本身的访问权限;
访问者的访问权限必须段本身的访问权限时,才能访问段。
👉设置对存储区域的操作权限
通过段描述符中 R/W 实现。
6.3 80x86 的分页机制
6.3.180x86 的分页机制
80x86 中,逻辑页面大小为 4KB。
80x86 中采用两级页表:简单描述就是:每个页表占用一个物理页面(4KB),每个页表项占 4B,则每个页表 1K 个表项。因此一张页表可以覆盖 1K*4K=4M 的地址空间。建立进程时,系统根据进程逻辑
页面的数目提供不同张数的页表,这样不同尺寸的进程就可以使用不同张数的页表。但是此时必须为每个进程建立一个页表目录,记录该进程的各个页表的存储位置。所以需要使用两级页表。
因为 80x86 中页表目录中的表项也占用 4B,所以每个页面可以记录 1K 个页表项,所以采用两级页表可以覆盖 1k1K4K=4G 的地址空间。也就是能覆盖最大容量的线性地址空间。
采用二级页表的好处:覆盖更大容量的线性地址空间、节省空间(因为如果采用一级页表,为了满足最大容量 4G 的需要,必须为 4G 空间中的每个页建立页表项。)
6.3.2 分页机制的地址转换
1.地址结构
2.地址转换
图中:
👉CR3 控制寄存器:记录页表目录在物理内存中的起始地址。该寄存器是一个 32 位寄存器,它的低 12 位总是 0,这样可以保证页表目录在物理地址空间总是按页面对齐的。
👉页表目录域和页表域中记录的都是查找项的索引值,即序号,因每个表项为 4B,所以需要乘 4,得到表项中的偏移地址。
6.3.3 页表目录与页表表项
1.指针。页表目录中:是页表指针,指向某一页表。
页表中:是页面指针,指向某一物理页面。
实际上它们分别是页表或物理页面起始地址的高 20 位,该地址的低 12 位总为 0,这就保证了页
表和物理页面在物理地址空间总是按页面对齐的,即它们总是位于 4K 页面的边界上。
2.AVL:供操作系统自行定义使用。
3.D:修改位(仅对页表表项有意义)
4.A:访问位。
5.U/S:访问权限,表示页表或页面本身的访问权限。U/S=1 是用户级,U/S=0 是系统级。
6.W/R:读/写保护位,操作限制。1 表示允许读写;0 表示只读
7.P:存在位。
8.表项中 0 的位域保留以备扩充。
6.3.4 分页机制的存储保护
从两方面进行:
👉地址越界保护。访问到的页表项为 0 时,地址越界。(可以参见徐德民 p194 195 的例题)
👉存取控制保护。U/S 和 W/R
6.3.5 快表 TLB
从上述的分页机制可以看出,采用两级页表,需要访问 3 次内存。为此 80x86 中也引进了快表。它放在处理器芯片中的高速缓存中,称为转换旁视缓冲存储器 TLB(Translation Look-aside Buffers)。其中存放32 个最近使用的页表项(页面地址)。