[简化版 Games 101] 计算机图形学 05：二维变换下

齐次坐标：让几何变换"化繁为简"的数学魔法✨

[Bilibili 同步视频](#Bilibili 同步视频)
[📌 缘起：二维变换的"小痛点"](#📌 缘起：二维变换的“小痛点”)
[💫 核心：齐次坐标的定义与精妙性质](#💫 核心：齐次坐标的定义与精妙性质)
- [1. 平移变换的"矩阵化落地"](#1. 平移变换的“矩阵化落地”)
- [2. 向量的"平移不变性"守护](#2. 向量的“平移不变性”守护)
- [3. 几何运算的"自洽性"](#3. 几何运算的“自洽性”)
[🔗 升华：仿射变换的统一表达](#🔗 升华：仿射变换的统一表达)
[🚦 进阶：变换的逆运算与组合分解](#🚦 进阶：变换的逆运算与组合分解)
- [1. 逆变换：矩阵的"反向操作"](#1. 逆变换：矩阵的“反向操作”)
- [2. 变换组合：顺序为王，矩阵相乘](#2. 变换组合：顺序为王，矩阵相乘)
- [3. 变换分解：化难为易，拆解复杂操作](#3. 变换分解：化难为易，拆解复杂操作)
[🌐 拓展：从二维到三维，无缝衔接的齐次坐标](#🌐 拓展：从二维到三维，无缝衔接的齐次坐标)
[💭 写在最后：藏在齐次坐标里的数学智慧](#💭 写在最后：藏在齐次坐标里的数学智慧)

Bilibili 同步视频

$简化版 Games 101$ 计算机图形学 05：二维变换下

在计算机图形学、计算机视觉乃至几何运算的世界里，平移、旋转、缩放是我们处理空间坐标最基础的操作🎯。可你是否曾疑惑，为何简单的二维线性变换，却偏偏容不下平移操作？为何同样是二维的坐标，点和向量的表示要被区别对待？答案，就藏在齐次坐标这一精妙的数学设计里。它以"增一维"的微小代价，实现了所有几何仿射变换的矩阵化统一，让看似零散的空间操作，变成了规整的矩阵乘法运算，堪称几何变换领域的"化繁为简"神器💫。今天，我们就一起解锁齐次坐标的奥秘，读懂它如何为几何变换搭建起简洁的数学框架。

📌 缘起：二维变换的"小痛点"

在二维平面中，我们常用 ( x , y ) (x,y) (x,y) 描述一个点或向量的位置，旋转、缩放这类线性变换 ，都能通过一个 2 × 2 2×2 2×2 的矩阵与坐标向量的乘法轻松实现。但唯独平移变换 是个"特例"------它的数学表达是 x ′ = x + T x x'=x+T_x x′=x+Tx 、 y ′ = y + T y y'=y+T_y y′=y+Ty ，是简单的加法运算，无法融入矩阵乘法的线性体系。

如果为了一个平移，就让几何变换的表示方式"分裂"，不仅会让运算逻辑变得杂乱，更会为复杂变换的组合与计算埋下隐患。于是，数学家们在长期的探索中想到了一个巧妙的办法：为二维坐标增加一个维度，构建齐次坐标，让平移也能披上"矩阵乘法"的外衣，实现所有变换的统一表达。

💫 核心：齐次坐标的定义与精妙性质

齐次坐标的核心，是为二维的点和向量赋予不同的三维表示，这一区别并非随意设定，而是完全贴合几何本质的设计，每一个数字的背后，都藏着严谨的几何逻辑。

对于二维点 ：将其表示为 ( x , y , 1 ) (x, y, 1) (x,y,1) ，最后一维固定为1；
对于二维向量 ：将其表示为 ( x , y , 0 ) (x, y, 0) (x,y,0) ，最后一维固定为0。

这看似简单的数字差异，却解决了两个关键问题，也让齐次坐标的魅力尽显。

1. 平移变换的"矩阵化落地"

当二维点以齐次坐标 ( x , y , 1 ) (x,y,1) (x,y,1) 表示时，我们只需构造一个 3 × 3 3×3 3×3 的矩阵：

$1 0 T X 0 1 T Y 0 0 1$ \begin{bmatrix}1&0&T_X\\0&1&T_Y\\0&0&1\end{bmatrix} 100010TXTY1

将这个矩阵与齐次坐标向量相乘，得到的结果是 ( x + T x , y + T y , 1 ) (x+T_x, y+T_y, 1) (x+Tx,y+Ty,1) 。单看前两位，正是我们想要的平移结果✅！就这样，原本的加法平移，完美转化为矩阵乘法操作，这也是引入齐次坐标的核心目的。

2. 向量的"平移不变性"守护

向量的几何意义是方向与大小，与位置无关------把一个向量在平面中任意平移，它的本质不会改变。而齐次坐标中向量最后一维的0，正是为这份"不变性"量身定制的保护符。

当向量 ( x , y , 0 ) (x,y,0) (x,y,0) 经过上述平移矩阵变换后，结果仍为 ( x , y , 0 ) (x,y,0) (x,y,0) ，完全不受平移操作的影响，精准贴合了向量的几何属性。这一设计，让齐次坐标的表示与几何本质实现了高度统一。

3. 几何运算的"自洽性"

齐次坐标不仅能统一变换，更让点和向量的基础几何运算变得逻辑自洽，每一种运算的结果，都能通过齐次坐标的维度数字自然体现：

🔹 向量+向量=向量：两个齐次坐标向量 ( x 1 , y 1 , 0 ) (x_1,y_1,0) (x1,y1,0) 与 ( x 2 , y 2 , 0 ) (x_2,y_2,0) (x2,y2,0) 相加，结果为 ( x 1 + x 2 , y 1 + y 2 , 0 ) (x_1+x_2,y_1+y_2,0) (x1+x2,y1+y2,0) ，仍为向量；
🔹 点-点=向量：两个齐次坐标点 ( x 1 , y 1 , 1 ) (x_1,y_1,1) (x1,y1,1) 与 ( x 2 , y 2 , 1 ) (x_2,y_2,1) (x2,y2,1) 相减，结果为 ( x 1 − x 2 , y 1 − y 2 , 0 ) (x_1-x_2,y_1-y_2,0) (x1−x2,y1−y2,0) ，恰好是从后一个点指向前一个点的向量；
🔹 点+向量=新点：点 ( x 1 , y 1 , 1 ) (x_1,y_1,1) (x1,y1,1) 加向量 ( x 2 , y 2 , 0 ) (x_2,y_2,0) (x2,y2,0) ，结果为 ( x 1 + x 2 , y 1 + y 2 , 1 ) (x_1+x_2,y_1+y_2,1) (x1+x2,y1+y2,1) ，对应点沿向量方向移动后的新位置；
🔹 点+点=中点：两个点相加得到 ( x 1 + x 2 , y 1 + y 2 , 2 ) (x_1+x_2,y_1+y_2,2) (x1+x2,y1+y2,2) ，而齐次坐标有一个扩充定义 ：对于任意 ( x , y , w ) (x,y,w) (x,y,w) （ w ≠ 0 w≠0 w=0 ），它表示的二维点为 ( x w , y w , 1 ) (\frac{x}{w},\frac{y}{w},1) (wx,wy,1) 。将结果除以2，便得到两点的中点，让原本无几何意义的点加操作，有了合理的解释。

而当 w = 0 w=0 w=0 时， ( x , y , 0 ) (x,y,0) (x,y,0) 就不再表示点，而是向量------这一定义，让齐次坐标的维度数字成为了"点与向量的识别码"，让整个坐标体系更加完整。

🔗 升华：仿射变换的统一表达

当齐次坐标让平移实现矩阵化后，仿射变换 的统一表示也就水到渠成了。所谓仿射变换，就是线性变换（旋转、缩放等）+平移变换的组合，是我们处理平面几何最常用的变换类型。

在齐次坐标体系下，所有二维仿射变换都能表示为一个 3 × 3 3×3 3×3 的矩阵，其结构有着固定的规律，像一个"几何变换的模板"：

$a b T x c d T y 0 0 1$ \begin{bmatrix}a&b&T_x\\c&d&T_y\\0&0&1\end{bmatrix} ac0bd0TxTy1

左上角的 2 × 2 2×2 2×2 矩阵 $a b c d$ \begin{bmatrix}a&b\\c&d\end{bmatrix} $acbd$ ：对应二维的线性变换，旋转、缩放都能通过调整这四个数字实现；
最后一列的前两个数字 T x 、 T y T_x、T_y Tx、Ty ：对应平移变换的平移量；
最后一行固定为 0 , 0 , 1 0,0,1 0,0,1 ：这是二维仿射变换的标志性特征，也是齐次坐标的设计巧思。

缩放、旋转、平移，这些看似不同的操作，都能套入这个模板形成专属的变换矩阵：

📏 缩放矩阵：无平移， T x = T y = 0 T_x=T_y=0 Tx=Ty=0 ，左上角为缩放系数构成的对角矩阵；
🔄 旋转矩阵：无平移， T x = T y = 0 T_x=T_y=0 Tx=Ty=0 ，左上角为旋转角度对应的三角函数矩阵；
📥 平移矩阵：无线性变换，左上角为单位矩阵，仅最后一列有平移量。

齐次坐标，让原本零散的仿射变换，变成了规整的矩阵家族，每一种变换，都成了这个家族中的一个具体成员。

🚦 进阶：变换的逆运算与组合分解

掌握了齐次坐标的矩阵表示，几何变换的进阶玩法也随之解锁------逆变换、变换组合、变换分解，所有操作都能通过矩阵的基本运算实现，让复杂的空间操作，变成了清晰的矩阵运算逻辑。

1. 逆变换：矩阵的"反向操作"

如果说一个变换矩阵 M M M 能将点 P P P 变换为 P ′ P' P′ ，那么要将 P ′ P' P′ 还原为 P P P ，就需要逆变换 ，其对应的数学操作，就是乘以 M M M 的逆矩阵 M − 1 M^{-1} M−1 。

矩阵的逆有着明确的性质： M × M − 1 = E M×M^{-1}=E M×M−1=E （单位矩阵），这就像做了一次变换后，再做一次反向变换，最终回到原点，完美贴合逆变换的几何意义。

2. 变换组合：顺序为王，矩阵相乘

复杂的几何变换，往往是多个简单变换的组合，而齐次坐标下，变换的组合就是矩阵的相乘 。但这里有一个关键要点：矩阵乘法不满足交换律，变换的顺序至关重要。

比如先平移后旋转，与先旋转后平移，得到的结果完全不同❌。这是因为齐次坐标中，矩阵对坐标向量的作用是从右到左 的：若要实现"先旋转 R R R ，后平移 T T T "，组合矩阵为 T × R T×R T×R ，坐标向量的运算为 T × R × P T×R×P T×R×P ，向量 P P P 会先与右侧的旋转矩阵相乘，再与左侧的平移矩阵相乘。

而多个 3 × 3 3×3 3×3 的变换矩阵相乘，结果仍为 3 × 3 3×3 3×3 矩阵------这意味着，无论多少个简单变换组合，最终都能浓缩为一个矩阵，一个矩阵就能表示任意复杂的二维仿射变换，这也是齐次坐标最强大的优势之一。

3. 变换分解：化难为易，拆解复杂操作

除了组合，变换还能分解------将一个复杂的变换，拆解为多个简单的基本变换，这让一些看似棘手的操作变得容易实现。

最经典的例子，就是以任意点 C C C 为中心的旋转：我们只会做以原点为中心的旋转，那么就可以将这个操作拆解为三步：

平移：将所有点沿 − C -C −C 方向平移，让旋转中心 C C C 移到原点；
旋转：对平移后的点做原点中心的旋转；
平移：将所有点沿 C C C 方向平移，让旋转中心移回原位置。

这三步对应的矩阵相乘，就是任意点旋转的组合矩阵，化难为易的背后，是齐次坐标矩阵表示的灵活性。

🌐 拓展：从二维到三维，无缝衔接的齐次坐标

齐次坐标的设计思想，并非只适用于二维平面，它能无缝拓展到三维空间，为三维几何变换提供同样简洁的统一框架，只是维度的数字相应增加，核心逻辑却完全一致。

三维点的齐次坐标： ( x , y , z , 1 ) (x, y, z, 1) (x,y,z,1) ，最后一维为1；
三维向量的齐次坐标： ( x , y , z , 0 ) (x, y, z, 0) (x,y,z,0) ，最后一维为0；
三维仿射变换的矩阵： 4 × 4 4×4 4×4 矩阵，最后一行固定为 0 , 0 , 0 , 1 0,0,0,1 0,0,0,1 ，左上角 3 × 3 3×3 3×3 为三维线性变换矩阵，最后一列前三位为 T x 、 T y 、 T z T_x、T_y、T_z Tx、Ty、Tz 三维平移量。

同样的扩充定义：对于三维齐次坐标 ( x , y , z , w ) (x,y,z,w) (x,y,z,w) （ w ≠ 0 w≠0 w=0 ），它表示的三维点为 ( x w , y w , z w , 1 ) (\frac{x}{w},\frac{y}{w},\frac{z}{w},1) (wx,wy,wz,1) ；同样的变换顺序：先线性变换，后平移。从二维到三维，齐次坐标的魔法始终有效，为三维计算机图形学、三维视觉等领域奠定了基础。

💭 写在最后：藏在齐次坐标里的数学智慧

齐次坐标的诞生，并非偶然，而是数学家们为解决工程问题做出的精妙数学设计。它以"增加一个维度"的微小代价，换来了几何变换的标准化、统一化、简洁化，让原本需要区分处理的线性变换和平移变换，变成了统一的矩阵乘法运算。

这份智慧，不仅体现在几何变换领域，更体现在一种解决问题的思路：当原有体系无法容纳新的操作时，不必强行拆分，而是通过适度的拓展，搭建起更通用的框架，让所有问题都能在新框架下找到规整的解决方案。

齐次坐标就像一把钥匙，打开了几何变换矩阵化的大门，它是计算机图形学、计算机视觉、机器人学等领域的基础知识点，读懂它，我们才能真正理解几何变换的底层数学逻辑，让后续的学习和应用走得更稳、更远🚀。