计算机组成原理 | 指令格式全解析

计算机组成原理 | 指令格式全解析：从定长到扩展操作码的底层逻辑

摘要/导语：

嗨！前几期我们搞定了存储器和虚拟内存，今天我们要进入CPU的核心腹地------指令系统。

CPU到底是怎么听懂人类语言的？一条指令里藏着什么秘密？为什么有的指令长，有的指令短？操作码不够用怎么办？

这篇推文将带你彻底拆解指令格式 的四大分类维度，并重点攻克考研和期末考试的超级重难点------扩展操作码技术。文末附带了经典的计算题解题思路，帮你把这块硬骨头啃下来！

在计算机内部，所有的程序最终都变成了一串串二进制代码。一条最基本的指令，通常由两部分组成：

公式很简单：指令 = 操作码 + 地址码

但在实际设计中，为了平衡硬件复杂度和编程灵活性，指令格式演变出了多种形态。我们将通过一张思维导图来全景展示。

指令格式分类全景图

我们从四个角度来剖析指令格式：

这是最直观的分类，取决于指令需要几个操作数。

这里涉及到一个核心概念对比：指令字长 vs 机器字长 vs 存储字长。

定长指令字结构：所有指令长度相同（例如都是32位）。
- 优点：硬件译码简单，流水线设计容易。
- 缺点：浪费空间，简单的指令（如停机）不需要那么多位。
变长指令字结构：各指令长度不同（例如x86架构，从1字节到15字节不等）。
- 优点：节省存储空间，能表达更丰富的语义。
- 缺点：译码复杂，难以并行处理。

这决定了指令的功能属性：

在上面的分类中，我们提到了"定长操作码"和"可变长操作码"。

在实际考试中，如何利用有限的位数设计出尽可能多的指令 是一个核心考点，这就是扩展操作码技术。

为什么要扩展？

假设指令长16位，地址码占4位。如果是定长操作码，剩下12位给操作码，最多只能有 2^12=4096 条指令。但如果我想支持更多的双地址指令，同时保留一些单地址指令，该怎么办？

核心思想： 利用地址码留下的空位来扩展操作码的长度。 当地址码数量减少时，省下来的位数就归操作码使用。

扩展操作码原理示意图

**经典计算模型（举例说明）：**假设指令字长16位，每个地址码4位。

三地址指令（3个地址码）：
- 占用 4 x 3 =12 位地址。
- 剩余 16-12=4 位给操作码。
- 最多可有 2^4=16 条。
- 策略：如果我们只设计了15条三地址指令，留下1个编码（例如 1111）作为扩展标志。
二地址指令（2个地址码）：
- 占用 4 x = 8 位地址。
- 原本剩8位，但因为要承接上面的扩展，高4位必须是 1111。
- 低4位可以变化，所以有 1 x 2 ^4 = 16 种状态。
- 策略：如果我们只设计了15条二地址指令，留下1个编码（例如 1111 1111）继续向下扩展。
一地址指令（1个地址码）：
- 占用4位地址。
- 高8位固定为扩展前缀。
- 低4位变化，又有16种状态。

👇 课后小作业：

设指令字长为16位，采用扩展操作码技术，每个地址码占6位。若已定义13条二地址指令，最多还能安排多少条一地址指令？