计算机组成原理（8）：各种码的作用详解

引言

在计算机科学的浩瀚海洋中，了解数据如何被编码、存储和处理是每一个开发者的基本功。

在上一篇文章中，我们初步介绍了定点数的编码表示，里面提及到了四大码的基本概念。

今天，我们将继续深入探讨计算机底层中最基础也是最核心的概念之一------数值表示法中的原码、反码、补码以及移码，如果对四种码的知识点已经熟能生巧的同学可以不用看。

这些概念看似简单，实则蕴含着深刻的数学原理与设计哲学。通过这篇文章，你将不仅掌握它们的基础知识，还能理解其背后的逻辑，并学会如何在实际编程中应用这些知识。

让我们从一个具体的例子开始，深入探讨各种编码方式的缺陷和作用。

假设我们有一台8位字长的计算机，有两串二进制数据：

复制代码

00001110  (14)
11110010  (-14)

如果这两个二进制数表示的是无符号数 ，它们的值分别是14和242（11110010 = 242），相加结果是256，即1 0000 0000，高位进位被丢弃后，结果是0。但14+242=256，256模256=0，这与结果一致。

问题来了 ：如果这两个数表示的是有符号数（原码表示），那么：

那么+14 + (-14) 应该等于0，但按照简单的二进制加法规则：

复制代码

  00001110  (+14)
+ 11110010  (-14)
------------
 100000000  (256)

高位进位1被丢弃，结果是00000000（0），看起来是正确的？但等一下，这个结果是巧合吗？

让我们再看一个例子：+14 + (-15)

复制代码

  00001110  (+14)
+ 11110001  (-15)
------------
 100000000  (256)

结果也是00000000（0），但+14 + (-15) = -1，不是0！

原码的致命缺陷：在上文也提到过，当符号位不同时，原码的加法运算无法正确得到结果，必须先判断符号，再进行相应的加减操作。这意味着ALU（算术逻辑单元）需要设计专门的减法电路，增加了硬件复杂度。

原码的计算复杂性：

正+正：直接相加

正+负：比较绝对值大小，用大减小，结果符号由大者决定

负+负：直接相加，符号为负

这种复杂的逻辑导致硬件设计成本增加，这正是计算机科学家需要解决的问题。

让我们从日常生活中熟悉的时钟开始理解模运算：

想象一个12小时制的时钟，它指向10点。如果要调到7点，有两种方式：

在模12系统中，-3和9是等价的，因为-3 ≡ 9 (mod 12)。

模运算的数学定义 ：对于任意整数x和模m，x mod m的余数r满足：
x=q⋅m+r,0≤r<mx = q \cdot m + r, \quad 0 \leq r < mx=q⋅m+r,0≤r<m

在模12系统中，-3 mod 12 = 9，因为-3 = (-1)·12 + 9。

计算机的8位寄存器本质上是一个"模256"的系统，因为2^8 = 256。

当我们进行8位运算时，超出8位的结果会被自动截断（相当于模256）。

补码的定义是：对于负数-x，其补码表示为：