操作系统基础之磁盘

概述

基本概念

磁盘有正反两个盘面，每个盘面有多个同心圆，每个同心圆是一个磁道，每个同心圆又被划分为多个扇区，数据就被存在扇区中。

磁头首先寻找到对应磁道，然后等到磁盘进行周期旋转到指定的扇区，才能读取到对应的数据。存取时间 = 寻道时间 + 等待时间

盘面号（磁头号）：0 ~ M-1；由于一个盘面上只有一个磁头，所以盘面号也叫作磁头号

柱面号（磁道号）：0 ~ L-1；磁道编号通常是从外沿向内进行编号

扇区号：1 ~ N；对于同一条磁道可以分为若干扇区，对于扇区分成三个字段

标识符字段：存放扇区的标识信息

校验字段：检验磁盘读写操作的正确性

数据字段：存放数据信息

存储容量计算公式
存储容量 = 磁头数 × 磁道（柱面）数 × 每道扇区数 × 每扇区字节数

扇区编址方式

CHS方式：柱面/磁头/扇区，××磁道（柱面），××磁头，××扇区，DOS中称为绝对扇区表示法。
LBA方式：相对扇区号，以磁盘第一个扇区（0柱面、0磁头、1扇区）作为LBA的0扇区，后面的扇区依次编号

LBA扇区号与CHS间的转换

CHS转换为LBA：若L、M、N分别表示一个磁盘的柱面数（磁道数）、盘面数（磁头数）、扇区数，则第i柱面j磁头k扇区所对应的LBA扇区号为： L B A = ( i ∗ M ∗ N ) + ( j ∗ N ) + k − 1 LBA=(i*M*N)+(j*N)+k-1 LBA=(i∗M∗N)+(j∗N)+k−1
LBA转换为CHS：若知道LBA扇区号，则对应的柱面号、磁头号、扇区号分别是：
- 柱面号： i = i n t ( L B A / ( M ∗ N ) ) i=int(LBA/(M*N)) i=int(LBA/(M∗N))
- 磁头号： j = [ L B A m o d ( M ∗ N ) ] / N j=[LBAmod(M*N)]/N j=[LBAmod(M∗N)]/N
- 扇区号： k = [ L B A m o d ( M ∗ N ) ] m o d N + 1 k=[LBAmod(M*N)]modN+1 k=[LBAmod(M∗N)]modN+1

磁盘类型

按照磁头是否需要移动进行分类：

固定头磁盘：对于同一盘面上的不同磁道，都有相应位置固定的磁头进行读写，如上图中的黑色磁头和蓝色磁头分别读取一个磁道，对多条磁道进行读写的时候，磁头不需要移动位置。所以对于一个盘面上的多条磁道可以并行进行读取，访问速度较快。同样价格也较高
移动头磁盘：对于移动头磁盘，它的磁头是可以沿着径向臂进行径向移动，所以只需要使用一个磁头就可以访问所有的磁道。但是同一时间只能访问一个磁道，只能实现顺序读写，读写速度较慢，造价较低。计算机中使用的磁盘大多数都是移动头磁盘

磁盘访问时间

以移动头磁盘为例

寻道时间Ts：把磁头移动到指定磁道上所经历的时间。
T s = m ∗ n + s T_s=m*n+s Ts=m∗n+s
m：一般磁盘：0.2～0.3；高速磁盘：m≤0.1
s：磁臂启动时间，约为2ms～3ms

磁盘读写操作中绝大部分时间都是寻道时间，所以对寻道时间进行优化可以有效的大幅减少访问时间。

旋转延迟时间Tr：指定扇区移动到磁头下面所经历的时间。

也就是要读取的蓝色扇区移动到黑色磁头下面所要经历的时间。旋转延迟时间最长为 1 r \frac{1}{r} r1，最短为0。平均旋转延迟时间为 T r = 1 2 r T_r=\frac{1}{2r} Tr=2r1，r表示转速。

传输时间Tt：把数据从磁盘读出或向磁盘写入数据所经历的时间。
T t = b r N T_t=\frac{b}{rN} Tt=rNb
b表示要读写的字节数，N表示一条磁道上总的字节数

因此，可将磁盘访问时间 T a T_a Ta表示为：
T a = T s + 1 2 r + b r N T_a=T_s+\frac{1}{2r}+\frac{b}{rN} Ta=Ts+2r1+rNb

磁盘调度

当有大量磁盘I/O请求时，恰当选择调度顺序，以降低完成这些I/O服务的总时间。

磁盘调度方式主要有以下两种：

移臂调度：当同时有多条磁道访问请求时，确定磁道访问顺序，以减少平均寻道时间
旋转调度：当一条磁道上有多个扇区访问请求时，确定扇区访问顺序，以减少旋转延迟时间。按照扇区距离磁头的位置的偏差来进行调度。

旋转调度算法较为简单，只是按照扇区距离磁头的位置的偏差来进行调度。

磁盘调度算法

主要有两类：

移臂调度：在满足一个磁盘请求时，总是选取与当前移动臂前进方向上最近的那个请求，使移臂距离最短
旋转调度：在满足一个磁盘请求时，总是选取与当前读写头旋转方向上最近的那个请求，是旋转圈数最少

移臂调度算法

FCFS

先来先服务，First Come First Served，根据进程请求访问磁盘的先后顺序进行调度。

假设当前磁道在100号磁道，磁头正向磁道号增加的方向（由外向里）移动。现依次有如下磁盘请求队列：23, 376, 205, 132, 61, 190, 29, 4, 40

则磁盘调度顺序为：23, 376, 205, 132, 61, 190, 29, 4, 40

寻道距离：Ts = (100-23) + (376-23) + (376-205) + (205-132) + ... + (40-4)

平均寻道距离 = Ts / 9。

由于先来新服务算法并没有对磁盘访问进行优化，所以它可能会得到比较长的寻道距离。

SSTF

Shortest Seek Time First，最短寻道时间优先算法，在选择下一条磁道时，总是访问与当前磁盘距离最近的磁盘进行访问。

对于上例，其磁盘调度顺序为：132, 190, 205, 61, 40, 29, 23, 4, 376

寻道距离：Ts = (132-100) + (190-132) + (205-190) + ... + (23-4) + (376-4)

最短寻道距离优先可以保障每一次的寻道距离最短，但是不能够保障最后系统得到的平均寻道距离最短。

存在的问题：

不能保证平均寻道距离最短；
会产生饥饿现象；如果系统不断的出现在100号磁道附近的磁道访问请求，则原先较远的磁道请求如205， 376 就会处于很长时间的等待中
影响磁盘的机械寿命：不考虑磁头的移动方向，可能会造成磁盘频繁的改变其磁头运动方向。从而影响磁盘的机械寿命

SCAN

扫描算法，又称为电梯算法，磁头在磁盘上双向移动，选择磁头当前所在磁道最近的请求访问的磁道，并且与磁头移动方向一致，磁头永远都从里向外或从外向里一致移动完才掉头，是目前操作系统中用的比较广泛的一种磁盘移臂调度算法。

在对下一条磁道进行选择时，需要判断：

欲访问磁道与当前磁道的距离
磁头当前的移动方向，即：保持处于磁道号增加或减少状态

对于上例，其磁盘调度顺序为：132, 190, 205, 376, 61, 40, 29, 23, 4

寻道距离：Ts = (132-100) + (190-132) + (205-190) + (376-205) + (376-61) + (61-40) +... + (23-4)

CSCAN

单项扫描调度算法，与SCAN不同的是，只做单向移动，即只能从里向外或从外向里。

N-Step-SCAN

N步扫描算法，为了克服扫描算法和最短寻道时间有限算法的磁臂粘着现象而引入的。

磁臂粘着现象就是指当系统不断的提出对当前磁道的访问，那么磁头会一直处于该磁道上进行磁道访问请求，导致其它磁道的访问被推迟的现象。

N步扫描算法的算法思想：将磁盘请求队列分成若干个长度为N的子队列，磁盘调度将按FCFS算法依次处理这些子队列；而每处理一个子队列时又采用SCAN算法。

如对于上例，若其子队列的长度为4，则可以分为3个队列：

它就会首先处理第一个队列中的四个磁道请求，再处理第二个队列和最后的第三个队列。其对于每一个队列的处理都是按照扫描算法来进行处理。

FSCAN

该算法实质上是N步SCAN算法的简化，它只将磁盘请求队列分成两个子队列：

由当前所有请求磁盘形成的队列，由磁盘调度按SCAN算法进行处理
在扫描期间，将新出现的所有磁盘I/O请求，放入另一个等待处理的请求队列

如上例，先把所有的磁盘请求放在第一个队列中，对其应用扫描算法进行磁盘调度。若访问过程中出现的新的磁盘请求就放在下面的新队列中，当第一个队列全部访问完，再处理第二个队列。

旋转调度算法

当同一磁道（柱面）上有多个扇区请求时，总是选取与当前读写头最近的那个I/O请求，使旋转圈数最少。

例：对磁盘访问的5个请求，若磁头在1号柱面，先按SCAN算法做移臂调度（柱面号排序），再进行旋转调度（块号排序），则调度顺序如下：

实战

磁盘调度算法

在磁盘调度管理中，应先进行移臂调度，再进行旋转调度。假设磁盘移动臂位于21号柱面上，进程的请求序列如下表所示。如果采用最短移臂调度算法，那么系统的响应序列应为（）。

4个备选项为：

②⑧③⑤⑦①④⑥⑨

②③⑧④⑥⑨①⑤⑦

②⑧③④⑤①⑦⑥⑨

①②③④⑤⑥⑦⑧⑨

请求序列	柱面号	磁头号	扇区号
①	17	8	9
②	23	6	3
③	23	9	6
④	32	10	5
⑤	17	8	4
⑥	32	3	10
⑦	17	7	9
⑧	23	10	4
⑨	38	10	8

解析：

应先进行移臂（对应柱面）调度，再进行旋转（对应磁头、扇区）调度。由表可知

①⑤⑦在17柱面（21-17=4）

②③⑧在23柱面（23-21=2）

④⑥在32柱面（32-21=9）

因此按最短移臂算法，应该是23柱面、17柱面、32柱面、38柱面。应该是②⑧③⑤⑦①④⑥⑨。

磁头移动耗时

某磁盘磁头从一个磁道移到另一个磁道需要10ms。文件在磁盘上非连续存放，逻辑上相邻数据块的平均移动距离为10个磁道，每块的旋转延迟时间及传输时间分别为100ms和2ms，则读取一个100块的文件需要（）ms。

答案：20200

解析：读取一个连续数据需要的时间包括：移动时间、旋转延迟时间和传输时间三个部分，总时间花为（1010）+100+2=202ms。一次读取一个100块的文件需要的时间为202100=20200ms。

磁盘处理耗时

磁盘上存储数据的排列方式会影响IO服务的总时间。假设每磁道划分成10个物理块，每块存放一个逻辑记录，并且是顺序存放在同一个磁道上：

物理块	1	2	3	4	5	6	7	8	9	10
逻辑记录	R1	R2	R3	R4	R5	R6	R7	R8	R9	R10

假定磁盘的旋转速度为30ms/周，磁头当前处在R1开始处。使用单缓冲区顺序处理这些记录，每个记录处理时间为6ms，则最长时间为（）ms，若对信息存储进行分布优化后，则处理10个记录的最少时间为（）ms。

答案：306、90。

解析：

系统读记录的时间为30/10=3ms。对第一种情况，系统读出并处理记录R1之后，将转到记录R4的开始处，为了读出记录R2，磁盘必须再转一圈，需要3ms（读记录）加30ms （转一圈）的时间。这样，处理10个记录的总时间应为，处理前9个记录的总时间再加上读R10和处理时间：9X33ms+9ms=306ms。

若对信息进行优化分布：

物理块	1	2	3	4	5	6	7	8	9	10
逻辑记录	R1	R8	R5	R2	R9	R6	R3	R10	R7	R4

当读出记录R1并处理结束后，磁头刚好转至R2记录的开始处，立即就可以读出并处理，因此处理10个记录的总时间为：10X(3ms（读记录）+6ms（处理记录）)=10X9ms=90ms

缓冲耗时

某计算机系统I/O采用双缓冲工作方式，如下图。假设磁盘块和缓冲区大小相同，每个盘块读入缓冲区的时间T为10μs，缓冲区送用户区的时间M为6μs，系统对每个磁盘块数据的处理时间C为2μs。若用户需要将大小为10个磁盘块的文件逐块从磁盘读入缓冲区，并送到用户区进行处理，则采用双缓冲需花费的时间为（）μs，单缓冲需花费的时间为（）μs，比单缓冲节约（）μs时间。

答案：108、162、54。

解析：双缓冲的工作特点是可以实现对缓冲区中数据的输入T和提取M，与CPU的计算C，三者并行工作。双缓冲的基本工作过程是在设备输入时，先将数据输入到缓冲区1，装满后便转向缓冲区2。所以双缓冲进一步加快I/O的速度，提高设备的利用率。

在双缓冲时，系统处理一块数据的时间可以粗略地认为是Max(C,T)。如果C<T，可使块设备连续输入；如果C>T，则可使系统不必等待设备输入。本题每一块数据的处理时间为10，采用双缓冲需要花费的时间为10×10+6+2=108。

采用单缓冲的工作过程如图(a)所示。当第一块数据送入用户工作区后，缓冲区是空闲的，可以传送第二块数据。这样第一块数据的处理C1与第二块数据的输入T2是可以并行的，依次类推，如图(b)所示。

系统对每一块数据的处理时间为：Max(C,T)+M。每一块数据的处理时间为10+6=16，文件的处理时间为16×10+2=162μs，比使用单缓冲节约162-108=54μs时间。

参考

软考高级

请求序列	柱面号	磁头号	扇区号
①	17	8	9
②	23	6	3
③	23	9	6
④	32	10	5
⑤	17	8	4
⑥	32	3	10
⑦	17	7	9
⑧	23	10	4
⑨	38	10	8

请求序列	柱面号	磁头号	扇区号
①	17	8	9
②	23	6	3
③	23	9	6
④	32	10	5
⑤	17	8	4
⑥	32	3	10
⑦	17	7	9
⑧	23	10	4
⑨	38	10	8

请求序列	柱面号	磁头号	扇区号
①	17	8	9
②	23	6	3
③	23	9	6
④	32	10	5
⑤	17	8	4
⑥	32	3	10
⑦	17	7	9
⑧	23	10	4
⑨	38	10	8