【操作系统】第三章内存管理（一）

第三章内存管理

3.1 内存管理概念

3.1.1 内存管理的基本原理和要求

内存管理的主要功能：

内存空间的分配与回收。 $连续分配管理方式$ (#3.1.2 连续分配管理方式)和非连续分配管理方式（分页、分段）
地址转换：实现逻辑地址到物理地址的转换
内存空间的扩充：采用虚拟存储技术从逻辑上扩充内存
内存共享。允许多个进程访问内存的同一部分
存储保护。保证各个进程在各自的存储空间内运行，互不干扰

逻辑地址和物理地址

操作系统通过内存管理部件MMU将进程使用的逻辑地址转换成物理地址

程序的链接与装入

编译。由编译程序将用户源代码编译成若干目标模块
链接。由链接程序将编译后形成的一组目标模块，以及它们所需的库函数链接在一起，形成一个完整的装入模块
装入。由装入程序将装入模块装入内存运行

三种装入方法：

绝对装入。若知道程序将放到内存的哪个位置，则编译程序将产生绝对地址的目标代码。
- 只适用于单道程序环境
可重定位装入。也称静态重定位 。装入模块的起始地址通常是0，程序中使用的指令和数据的地址都是相对于始值而言的逻辑地址。可根据内存当前情况将装入模块装入内存适当位置。在装入时对目标程序中的相对地址的修改过程称为重定位。地址转换通常时在进程装入时一次完成 的
- 当一个作业装入内存时，必须给它分配要求的全部内存空间
- 作业一旦进入内存，整个运行期间不能在内存中移动
动态运行时装入。也称动态重定位 。装入程序将装入模块装入内存后，不会立即将装入模块中的相对地址转换为绝对地址，而是在程序运行时才进行 。
- 这种方式需要一个重定位寄存器 ，存放装入模块的起始地址
- 作业不能在内存中移动
- 优点：可将程序分配到不连续的存储区；在程序运行前只需要装入部分代码即可投入运行；

三种链接方法：

静态链接
- 在程序运行前，先将各目标模块及它们所需的库函数链接成一个完整的装入模块，以后不再拆开
- 需要修改相对地址，编译后的所有目标模块都是从0开始的相对地址，当链接成一个装入模块时要修改相对地址
- 需要变换外部符号，将每个模块中所用的外部调用符号也都变换为相对地址
装入时动态链接
- 将目标模块在装入内存时，采用边装入边链接的方式
- 便于修改和更新，便于实现对目标模块的共享
运行时动态链接
- 在程序执行中需要某目标模块时，才对它进行连接
- 能加快程序的装入过程，节省内存空间

进程的内存映像

代码段：程序的二进制代码，是只读的
数据段：即程序运行时加工处理的对象，包括全局变量和静态变量
进程控制块：存放在系统区
堆：用来存放动态分配的变量。通过调用malloc函数动态地向高地址分配空间
栈：用来实现函数调用。从用户空间的最大地址往低地址方向增长

内存保护

内存保护可采取两种方法：

在CPU中设置一对上、下限寄存器，存放用户进程在主存中的下限和上限地址，每当CPU要访问一个地址时，分别和两个寄存器的值相比，判断有无越界
采用重定位寄存器（基址寄存器）和界地址寄存器（限长寄存器）进行越界检查。
- 重定位寄存器中存放的是进程的起始物理地址 ，界地址寄存器中存放的是进程的最大逻辑地址
- 内存管理部件将逻辑地址和界地址寄存器进行比较 ，若未发生越界，则加上重定位寄存器的值后映射成物理地址，再送交内存单元

3.1.2 连续分配管理方式

1.单一连续分配

内存被分为系统区和用户区，系统区仅供操作系统使用，通常在低地址部分；用户区内存中仅有一道用户程序，即用户程序独占整个用户区
优点：简单，无外部碎片；不需要进行内存保护，因为内存中只有一道程序
缺点：只能用于单用户、单任务的操作系统；有内部碎片，内存利用率低

2.固定分区分配

将用户内存空间划分为若干固定大小的分区，每个分区只装入一道作业

分区大小相等。缺乏灵活性
分区大小不等

为了便于分配和回收，建立一张分区使用表，通常按分区大小排队，各表项包括对应分区的始址、大小及状态

这种方式存在两个问题：

程序太大而放不进任何一个分区
当程序小于固定分区大小时，也要占用一个完整的内存分区，造成空间浪费，存在内部碎片

无外部碎片，但不能实现多进程共享一个主存区，内存利用率低

3.动态分区分配

也称可变分区分配，指进程装入内存时，根据进程的实际需要，动态的为之分配内存，并使分区的大小正好适合进程的需要
系统中分区的大小和数量是可变的

缺点：随着时间的推移，内存中会出现越来越多的小内存块（外部碎片），内存利用率随之下降

外部碎片可通过紧凑技术克服，即操作系统不时地对进程进行移动和整理，需要动态重定位寄存器的支持

内存回收方法

设置一张空闲分区链（表），按始址排序
回收内存时，根据回收分区的始址，从空闲分区链中找到相应的插入点，此时可能出现四种情况：
1. 回收区与插入点的前一空闲分区相邻 ，此时将这两个分区合并，并修改前一分区表项的大小为两者之和
2. 回收区与插入点的后一空闲分区相邻 ，此时将这两个分区合并，并修改后一分区表项的始址和大小
3. 回收区同时与插入点的前、后两个分区相邻 ，此时将这三个分区合并，修改前一分区表项的大小为三者之和
4. 回收区没有相邻的空闲分区 ，此时应该为回收区新建一个表项，填写始址和大小，并插入空闲分区链

将作业装入主存时，要按照一定的分配算法从空闲分区链（表）中选出一个分区，以分配给该作业。按分区检索方式，可以分为顺序分配法 和索引分配法

基于顺序搜索的分配算法

顺序分配算法是指依次搜索空闲分区链上的空闲分区，以寻找一个大小满足要求的分区。

首次适应算法（First Fit）。空闲分区按地址递增的次序排列 。每次分配内存时，顺序查找到第一个 能满足大小的空闲分区，分配给作业。
- 算法保留了内存高地址部分的大空闲分区，有利于后续大作业的装入。
- 但它会使内存低地址部分出现许多小碎片，而每次分配查找时都要经过这些分区，因此增加了开销
邻近适应算法（Next Fit）。也称循环首次适应算法 。分配内存时从上次查找结束的位置开始 继续查找
- 它让内存低、高地址部分的空闲分区以同等概率被分配，划分为小分区，导致内存高地址部分没有大空间可用
- 一般比FF更差
最佳适应算法（Best Fit）。空闲分区按容量递增的次序排列 。每次分配时，顺序查找到第一个能满足大小的空闲分区，即最小的空闲分区 ，分配给作业。
- 每次分配会留下越来越多很小的难以利用的内存块，产生最多的外部碎片
最坏适应算法（Worst Fit）。空闲分区按容量递减的次序的排列 。每次分配时，顺序找到第一个能满足要求的空闲分区，即最大的空闲分区 ，从中分割一部分空间给作业
- 最不容易产生碎片 ，但会导致没有大空间可用

基于索引搜索的分配算法

根据其大小对空闲分区分类，对于每类（大小相同）空闲分区，单独设立一个空闲分区链 ，并设置一张索引表来管理这些空闲分区链。当为进程分配空间时，在索引表中查找所需空间大小对应的表项，并从中得到对应的空闲分区链的头指针，从而获得一个空闲分区

快速适应算法
- 空闲分区的分类根据进程常用的空间大小进行划分。分配过程分为两步：
  1. 根据进程的长度，在索引表中找到能容纳它的最小空闲分区链表
  2. 从链表中取下第一块进行分配
- 优点：查找效率高，不会产生内存碎片
- 缺点：回收分区时，需要有效的合并分区，算法比较复杂，系统开销大
伙伴系统
- 规定所有的分区大小均为2的k次幂。
- 当需要为进程分配大小为n的分区时（ 2 i − 1 ＜ n ≤ 2 i 2^{i-1}＜n\le 2^i 2i−1＜n≤2i），在大小为 2 i 2^i 2i的空闲分区链中查找。
  - 若找到，则将该空闲分区分配给进程；
  - 否则，表示大小为2ⁱ的空闲分区已耗尽，需在大小为 2 i + 1 2^{i+1} 2i+1的空闲分区链中进行查找。
    - 若存在大小为2ⁱ⁺¹的空闲分区，则将其等分为两个分区 ，这两个分区称为一对伙伴 。其中一个用于分配，另一个加入2ⁱ的空闲分区链。
    - 若不存在，则继续查找，直至找到为止。
    - 回收时，需要将相邻的空闲伙伴分区合并为更大的分区
哈希算法
- 根据空闲分区链表的分布规律，建立哈希函数，构建一张以空闲分区大小为关键字 的哈希表，每个表项记录一个对应空闲分区链的头指针 空闲分区大小->空闲分区链表的头指针
- 分配时，根据所需分区大小，通过哈希函数计算得到哈希表中的位置，从中得到相应的空闲分区链表

3.1.3 基本分页存储管理

为了尽量避免碎片的产生，引入了分页的思想：将内存空间 分为若干固定大小的分区，称为页框、页帧或物理块。进程的逻辑地址 空间也分为与块大小相等的若干区域 ，称为页或页面。操作系统以页框为单位为各个进程分配内存空间。

分页管理不产生外部碎片

1.分页存储的基本概念

页面和页面大小
- 进程的逻辑地址空间中的每一个页面有一个编号，称为页号，从0开始
- 内存空间中的每个页框也有一个编号，称为页框号，从0开始。
- 进程在执行时需要申请内存空间，即要为每个页面分配内存中的可用页框，这就产生了页号和页框号的一一对应
- 页面大小应是2的整数次幂
  - 页面太大会时页内碎片增多，降低内存的利用率
  - 页面太小会时进程的页面数过多，页表过长，占用大量内存，增加硬件地址转换的开销，降低页面换入/换出的效率
- 页面大小=内存块大小
地址结构
- 地址结构包含两部分，前一部分为页号P，后一部分为页内偏移量W
- 地址长度为32位，其中0~~~~~11位为页内地址，即每页大小位2¹²B；12~13位为页号，即最多允许2²⁰页
页表

为了便于找到进程的每个页面在内存中存放的位置，系统为每个进程建立一张页面映射表，简称页表
- 进程的每个页面对应一个页表项 ，每个页表项（页号→内存块号）由页号和块号组成，记录了页面在内存中对应的物理块号。
- 通过查找页表，即可找到每页在内存中的物理块号，实现从页号到物理块号的映射
- 顺序存储的页表，页表项隐含着页号
- 页表项中存放的是内存块号，需要乘以内存块大小得到地址
- 每个进程拥有一个页表，且驻留在内存中

2. 基本地址变换机构

地址变换机构的任务是将逻辑地址转换为内存中的物理地址。地址变换是借助于页表实现的

在系统中设置一个页表寄存器（PTR） ，存放页表在内存的始址F 和页表长度M
进程未执行时，页表的始址和页表长度存放在本进程的PCB中；当程序被调度时，才将其调入页表寄存器
设页面大小L ，逻辑地址A到物理地址E的变换过程如下（假设都是十进制数）：
1. 根据逻辑地址计算出页号P=A/L、页内偏移量W=A%L
2. 判断页号是否越界，若页号P≥页表长度M，则产生越界中断，否则继续执行
3. 在页表中查询页号对应的页表项，确定页面存放的物理块号。页号P对应的页表项地址=页表始址F+页号P×页表项长度，取出该页表项内容b，即为物理块号
4. 计算物理地址E=bL+W，用物理地址E去放存。注意，物理地址=页面在内存中的始址＋页内偏移量，页面在内存中的始址=块号×块大小（页面大小）
分页管理方式存在的问题：
1. 每次访存操作都需要进行从逻辑地址到物理地址的转换，地址转换过程必须足够快，否则访存速度会降低
2. 每个进程引入页表，用于存储映射机制，页表不能太大，否则内存利用率会降低

3. 具有快表的地址变换机构

若页表全部存放在内存中，则存取一个数据或一条指令至少需要访问两次内存 ，速度慢了一半
1. 访问页表，确定所存取的数据或指令的物理地址
2. 根据地址存取数据或指令
设置一个具有并行查找能力的高速缓冲存储器------快表（TLB），也称相联存储器，用来存放当前访问的若干页表项，以加速地址变换的过程。与此对应，主存中的页表常被称为慢表
具有快表的分页机制中，地址的变换过程如下：
1. CPU给出逻辑地址后，由硬件进行地址转换，将页号与快表中的所有页号进行比较
2. 若找到匹配的页号，说明要访问的页表项在快表中有副本，则直接从中取出该页对应的块号，再与页内偏移量拼接形成物理地址。这样，存取数据仅一次访存即可
3. 若未找到匹配的页号，则需要访问内存中的页表，读出页表项后，就能得到该页的物理块号，再与页内偏移量拼接形成物理地址，最后用该物理地址去访存。
  - 若快表未命中则需要两次访存
  - 找到页表项后，应同时将其存入快表，以便后面可能的再次访问。若快表已满，则须按照特定算法淘汰一个旧页表项
快表的有效性基于局部性原理

4. 两级页表

有时，存储页表需要占用连续的存储空间过大，为解决这个问题，可使用两种方法：

对于页表所需的内存空间，采用离散分配的方法，用一张索引表来记录各个页表的存放位置
只将当前需要的部分页表调入内存，其余的页表项仍然驻留磁盘，需要时再调入

为离散分配的页表再建立一张页表，称为外层页表，或页目录
在系统中增设一个外层页表寄存器 ，也称页目录基址寄存器，用于存放页目录始址 。将逻辑地址中的页目录号作为页目录的索引，从中找到对应页表的始址；再用二级页号作为页表始址，从中找到对应的页表项；将页表项中的物理块号和页内偏移拼接成物理地址，再用该物理地址访问内存单元。共进行了三次访存
计算页表级数：页号n位（2ⁿ个页），一个页表有m项，则需要n/m级页表

3.1.4 基本分段存储管理

分段

分段系统将用户进程的逻辑地址空间 "按照逻辑关系" 划分为大小不等的段，如主程序段、子程序段、栈段等
逻辑地址结构由段号S 与段内偏移量W两部分组成
分段方式对低级语言程序员和编译器来说是可见的

段表

每个进程都有一张逻辑空间与内存空间映射的段表，进程的每个段对应一个段表项，段表项记录了该段在内存中的始址和段的长度
段表项是连续存放的，各个段表项的长度相同，因此段号可以是隐含的

地址变换机构

在系统中设置一个段表寄存器，用于存放段表始址F和段表长度M
地址变换过程如下：
1. 从逻辑地址A中取出前几位为段号S，后几位为段内偏移量W
2. 判断段号是否越界，若段号S≥段表长度M，则产生越界中断，否则继续执行
3. 在段表中查询段号对应的段表项，段号S对应的段表项地址＝段表始址F+段号S×段表项长度。取出段表项中该段的段长C，若W≥C，则产生越界中断，否则继续执行
4. 取出段表项中该段的始址b，计算物理地址E=b+W，用物理地址E去访存

4.分页和分段的对比

页是信息的物理单位，分页的主要目的是提高内存利用率，分页完全是系统的行为。段是信息的逻辑单位
页的大小固定且由系统决定，段的长度不固定
分页管理的地址空间是一维的。段式管理不能通过一个整数便确定对应的物理地址，因为段长是不固定的，不能通过整除得到段号，不能通过求余得到段内偏移，需要显式的给出段号和段内偏移，因此分段管理的地址空间是二维的

5.段的共享和保护

为实现段共享（多个进程共享同一段代码或数据），在系统中设置一张共享段表 ，所有共享的段都在共享段表中占一个表项。表项中记录了共享段的段号、段长、内存始址、状态位、外存始址和共享进程计数count等信息
- 共享进程计数count记录有多少进程正在共享该段，仅当所有共享该段的进程都不再需要它时，此时count=0，才回收该段所占的内存区
对于一个共享段，在不同的进程中可以具有不同的段号，每个进程用自己进程的段号去访问该共享段
分段管理的保护方法主要有两种：一种是存取控制保护 ，另一种是地址越界保护
- 地址越界保护将段表寄存器中的段表长度与逻辑地址中的段号比较，若段号大于段表长度，则产生越界中断；再将段表项中的段长和逻辑地址中的段内偏移进行比较，若段内偏移大于段长，也产生越界中断

6.引入段式存储可以满足的用户要求：方便编程、共享和保护、动态链接和增长。没有方便操作

3.1.5 段页式存储管理

进程的地址空间先被分成若干逻辑段，然后将各段分成若干大小固定的页
进程的逻辑地址分为三部分：段号、页号、页内偏移量
为了实现地址变换，系统为每个进程建立一张段表 ，每个段对应一个段表项，每个段表项至少包括段号（隐含）、页表长度、页表始址 ；系统中还设有一个段表寄存器，指出进程的段表始址 和段表长度。段表寄存器和页表寄存器的作用：在段表和页表中寻址、判断是否越界
- 每个段有一张页表 ，每个页表至少包括页号（隐含）、块号
进行地址变换时，首先通过段表找到页表始址、然后通过页表找到物理块号，最后形成物理地址

3.1.6 总结

地址变换机构：地址转换过程完全由硬件实现
静态重定位：在程序执行之前 （通常是加载到内存时），由专门的重定位加载器一次性完成程序中所有逻辑地址到物理地址的转换。转换完成后，地址在程序整个运行期间不再改变。
动态重定位：在程序执行过程中 ，在硬件（MMU） 的支持下，每次访问内存时实时将逻辑地址转换为物理地址。程序的装载地址和运行地址可以不同。整个系统中只有一个重定位寄存器

特性	静态重定位	动态重定位
发生时机	程序加载入内存时一次性完成。	程序每条指令执行时，由硬件实时完成。
执行主体	操作系统中的重定位加载器（软件）。	内存管理单元（MMU）硬件，如基址寄存器（BR）。
关键机制	加载器根据程序放入内存的起始物理地址，修改程序指令和数据中的地址编码。	CPU将逻辑地址与基址寄存器（BR）中的值相加，得到物理地址。公式：`物理地址 = 逻辑地址 + BR`
地址变化	程序被加载后，其内部的地址已经是最终的物理地址，固定不变。	程序代码中的逻辑地址始终不变，物理地址通过硬件计算动态生成。
进程移动性	无法移动。一旦加载，若想将整个进程移动到内存另一区域，必须重新进行静态重定位，成本极高。	可以移动。只需由操作系统更新基址寄存器（BR）的值，进程即可在内存中"整体搬迁"。
能否使用紧凑技术	不能	能
内存保护	难以实现。程序直接操作物理地址，无法检查其访问是否越界。	容易实现。可增设界限寄存器（LR），硬件在地址转换前检查逻辑地址是否越界，实现存储保护。
硬件依赖	无需特殊硬件支持。	必须依赖MMU等硬件支持。
优点	实现简单，早期系统使用；运行时无地址转换开销。	灵活高效：支持内存紧缩、进程动态扩展、共享代码库；是现代操作系统的基础。
缺点	不灵活，内存利用率低；无法实现虚拟内存；不支持共享。	需要硬件成本；每次访存都有一次加法开销（现代硬件已将其流水线化，开销极小）。

内部碎片：分区内部的空间浪费
内存管理方式对比：

管理方式	核心原理	地址空间维度	碎片问题	地址变换	访存次数
单一连续分配	内存分为系统区和用户区，一次只装入一个用户程序。	一维线性	无外部碎片，但有内部碎片（用户程序小于用户区时）。	静态重定位或动态重定位	1
固定分区分配	将用户区预先划分为若干个固定大小的分区，每个分区装一道作业。	一维线性	内部碎片严重（作业小于分区时）。	每个分区需建立分区使用表，记录各个分区的相关信息。使用静态分区分配或动态分区分配	1
动态分区分配	根据作业实际大小动态创建分区，分区大小和数量可变。	一维线性	外部碎片严重（需通过紧凑技术解决）。	动态重定位，通过基址寄存器实现	1
页式存储	将进程和物理内存均等分为固定大小的"页"和"页框"，进程页面可离散存放于任何物理页框。	一维线性	无外部碎片，但有内部碎片	通过页表进行映射。逻辑地址 = 页号P + 页内偏移W	2（一级页表） N+1（N级页表）
分段存储	按程序的逻辑模块（段）划分，如主程序段、子程序段、数据段等，每段连续存放但段间可离散。	二维逻辑	有外部碎片（段尺寸变化大）	通过段表进行映射。逻辑地址 = 段号S + 段内偏移W	2
段页式存储	先分段，段内再分页。结合两者优点：对外呈现分段结构，对内实现分页管理。	二维逻辑	无外部碎片，有内部碎片	需段表 + 页表两级映射。逻辑地址 = 段号S + 页号P + 页内偏移W	3（一级页表）

【操作系统】第三章 内存管理（一）

第三章 内存管理