游戏引擎学习第237天:使用 OpenGL 显示图像

win32_game.cpp: 禁用 PFD_DOUBLEBUFFER

我们正在处理一个新的开发阶段，目标是在使用 OpenGL 渲染的同时能正常通过 OBS 进行直播。昨天我们已经尝试了一整天来解决这个问题，希望能找到一种方式让 OBS 能正确地捕捉到 OpenGL 的窗口画面。虽然我们不确定是否已经彻底解决了问题，但今天打算继续推进，试试看现在的设定是否能正常直播和显示游戏画面。

当前的目标是让游戏的图像正确地通过 OpenGL 显示出来，并确保观众可以在直播中看到它。我们计划直接动手实施这个过程，看看是否有效。如果画面不能正常显示，那就只能接受直播偶尔出问题的现实。

现在我们要做的第一件事就是让直播能够正常运行。昨天的调查结果是：如果关闭 OpenGL 的双缓冲（Double Buffering）功能，OBS 就可以更可靠地捕捉窗口内容进行推流 。因此我们尝试在平台层代码中加入一个条件编译或运行时标志，例如 HANDMADE_STREAMING 这样的宏或变量。其作用是在开启该标志时，我们就不启用 PFD_DOUBLEBUFFER（双缓冲），而是改为只用单缓冲模式进行渲染。

我们还在注释中说明了这一点：PFD_DOUBLEBUFFER（双缓冲）这个标志可能会阻止 OBS 正常地捕捉和推送窗口画面，这似乎是目前发现的导致问题的关键。

最终的希望是我们昨天的发现能适用于大多数情况，即：关闭双缓冲可以解决 OpenGL 画面无法被 OBS 正确捕捉的问题，从而实现直播与 OpenGL 渲染的兼容共存。接下来，我们就以这个设定继续开发和测试。

尝试一下并查看我们的粉红色窗口

我们现在来尝试一下当前的设定，运行程序后，屏幕上成功显示出了一个粉红色的窗口。接下来的问题是------大家到底能不能在直播画面中看到这个粉红窗口？是否有人看到的是黑屏？是粉红色？还是只是 Windows 的 Visual Studio 开发界面？

我们开始向观众确认当前直播画面中能否正确显示这个粉红窗口。最终反馈结果是，确实可以看到粉红色的窗口。这就说明我们通过关闭双缓冲所做的调整目前是成功的，OBS 能够正确捕捉并推送 OpenGL 渲染出来的内容。

这也验证了我们昨天的假设：如果关闭 PFD_DOUBLEBUFFER，OBS 在捕捉窗口时就不会出问题，从而能在直播中正常显示 OpenGL 渲染的画面。我们的直播和图形显示终于可以同时运作，没有互相干扰。

这是一个非常有趣也常见的技术现象，背后涉及到 OpenGL 的渲染机制 和 OBS 的屏幕捕捉方式 之间的兼容性问题。我们来详细拆解为什么关闭 PFD_DOUBLEBUFFER（双缓冲）后 OBS 就能正常显示画面。

一、双缓冲（PFD_DOUBLEBUFFER）是什么？

在 OpenGL 或任何图形渲染系统中：

双缓冲 是指有两个缓冲区（Front Buffer 和 Back Buffer）：
- Back Buffer（后缓冲）：绘图时内容渲染在这个缓冲上；
- Front Buffer（前缓冲）：屏幕实际显示的内容来自这里。
每一帧完成后，程序通过 SwapBuffers() 把后缓冲的内容"交换"到前缓冲，显示在屏幕上。

好处是：

画面不会撕裂；
能实现流畅、干净的帧切换。

二、OBS 是怎么捕捉窗口的？

OBS 在捕捉窗口内容时，会尝试读取 系统显示在屏幕上的帧缓冲内容，具体方式依赖于：

操作系统提供的 GDI、DWM 机制；
显卡驱动如何暴露前台窗口的显示缓冲内容；
有些时候是直接采集前缓冲区（Front Buffer）内容。

但问题就在这里：

当启用双缓冲时，OpenGL 默认把图像画到后缓冲里，而不是前缓冲。

如果你没调用 SwapBuffers()，前缓冲就是空的，OBS 捕捉到的自然也是空白（黑屏）。

三、为什么关闭 PFD_DOUBLEBUFFER 反而 OBS 能显示？

当关闭了 PFD_DOUBLEBUFFER：

OpenGL 只使用一个缓冲区，也就是 单缓冲（Single Buffering）；
所有渲染直接写入前缓冲；
因此 OBS 看到的就是你正在渲染的内容。

换句话说：

单缓冲 = 直接把画面画在屏幕上 = OBS 能捕捉到。

四、但是关闭双缓冲的副作用是什么？

虽然 OBS 可以显示，但这不是一个理想的解决方案。单缓冲会带来很多问题：

问题	说明
撕裂（Tearing）	渲染过程和显示过程重叠，可能看到"断裂"的画面
闪烁（Flickering）	渲染未完成时屏幕就开始显示，会造成视觉跳动
性能波动	每次绘制都直接在屏幕上，GPU 没法优化渲染流程

正确方案是什么？

长远来看，更合适的方案是：

保持双缓冲；
在渲染完成后 确保调用 SwapBuffers()；
使用 OBS 的专门支持 OpenGL 的插件或硬件采集卡；
或者使用 帧缓冲对象（FBO） 渲染，然后将其输出到屏幕，同时 OBS 捕捉这个输出。

总结一句话：

关闭 PFD_DOUBLEBUFFER 后，OpenGL 的渲染直接作用于前缓冲，OBS 才能看到。但这是一种权宜之计，生产环境下更推荐保持双缓冲并配合正确的帧交换和捕捉方式。

回顾当前的情况

我们目前已经有了一个完整的软件渲染器，因此在接入 OpenGL 的第一步，并不需要立刻将整个游戏都通过 OpenGL 来渲染。我们的目标仅仅是把我们已经在 CPU 端生成的图像，也就是渲染缓冲区中的画面，传输到显卡上，并通过 OpenGL 显示出来。

现在我们所做的事情非常简单，仅仅是调用了 glClearColor 设置清除颜色为粉色，然后调用 glClear 执行清屏操作。因此当前 OpenGL 显示的画面就是一片粉色，这是因为我们只发出了清屏的指令，没有告诉 GPU 要渲染任何其他东西。

OpenGL 的指令缓存（command buffer）目前仅包含：

设置清除颜色（粉色）；
设置清除区域（窗口的大小范围）；
指定清除哪一个缓冲（如颜色缓冲）；
然后提交这些指令去执行。

接下来我们想做的是，不仅仅只是显示粉色清屏，而是把我们在内存中已经绘制好的游戏画面，也就是一个位图缓冲区（bitmap buffer），传输到显卡，然后由显卡负责显示它。

这个过程本质上和我们写的软件渲染器非常相似，也正是我们当初要自己写渲染器的原因：我们可以从中理解图形卡（GPU）背后的工作方式。回顾我们写软件渲染器的过程，可以更好地理解 GPU 的逻辑。如果记不清了，也可以回去重新看一下我们早期实现的部分。

在 GPU 中，我们需要准备两样东西：

图像数据源：也就是我们要传输的图像，通常叫做"纹理"（texture），这是 GPU 用来读取像素信息的对象；
绘制指令：也就是让显卡画出图像的方式，具体来说要绘制一种叫"图元"（primitive）的图形。图元是 GPU 所支持的基本形状，比如点、线、三角形等等。

在我们的渲染器中，我们唯一使用的图元其实是矩形。而在 GPU 的世界中，最常用的图元是三角形。为了在显卡上画出一个矩形，我们需要把它拆成两个三角形组合成一个矩形形状。

这就是我们接下来要做的事：

把我们的图像缓冲区上传成一张 OpenGL 纹理；
创建一个由两个三角形组成的矩形；
把这两个三角形绘制出来，并让它们使用我们上传的纹理进行采样，从而显示出原始的图像。

Blackboard: 绘制四边形的方法

我们需要在屏幕上绘制矩形区域来显示图像，为了实现这一点，有两种方法可以选择：

第一种方法：用两个三角形拼出一个矩形

我们可以通过绘制两个三角形来组成一个矩形。因为 OpenGL 最基础的绘图单位是图元（Primitive），最常见的图元是三角形，GPU 最擅长处理的也是三角形。

我们将会给出六个顶点（每个三角形三个），构成两个拼接起来的三角形，这样就能完美组成一个矩形。这样的方法通用性强，适用于任意位置的矩形绘制，也适合将来用来显示我们所有的图像精灵（Sprite）。

第二种方法：绘制一个大三角形然后进行裁剪（Clipping）

另一种思路是只绘制一个三角形，但使用 OpenGL 的裁剪功能把它裁剪成一个矩形形状来显示。这种方式可以使用 OpenGL 的裁剪功能（比如 glScissor 指定一个区域），让三角形只在屏幕指定区域内显示，其他部分被裁掉。

这类似于软件渲染中我们做的"裁剪到屏幕边界"的操作，但 OpenGL 的裁剪功能是更通用的，它允许我们裁剪到比屏幕更小甚至不规则的区域，裁剪的区域可以自定义。

但是我们不会使用第二种方法：

尽管用 glScissor 裁剪确实可以做到我们想要的效果，但我们暂时不会采用这种方式，原因如下：

调用裁剪功能在某些显卡上可能是一个较慢或昂贵的操作；
设置裁剪区域可能会让渲染流程变得更复杂；
更重要的是，我们将来的目标是把整个游戏的渲染从软件栅格化（软件计算每个像素）迁移到 OpenGL 上去；
到时候我们会有很多图像精灵需要绘制，而每个图像都需要在不同的位置绘制不同的矩形，这种情况下用两个三角形拼出矩形更通用、更灵活。

所以最终选择是：使用两个三角形绘制矩形

我们将使用两个三角形来表示矩形区域，这样我们可以在不依赖任何裁剪操作的情况下自由绘制图像，而且每个精灵（Sprite）都可以独立控制显示的位置、大小、贴图等内容。

我们接下来将按这种方式来实现把 CPU 渲染好的图像上传到 GPU，并在 GPU 上通过 OpenGL 显示出来的过程。这个方法是我们未来整个渲染系统迁移到 GPU 后的基础。

Blackboard: 使用两个三角形来绘制我们的四边形纹理

整个流程跟我们之前在软件光栅化器中所做的基本一模一样，我们需要：

1. 构造矩形（由两个三角形组成）

我们首先要做的，是在屏幕上构造一个由两个三角形组成的矩形。这个矩形将作为图像的显示区域。它的顶点坐标会告诉 GPU 把图像画在屏幕的哪个位置。

2. 设置 UV 坐标（纹理坐标）

我们要给这个矩形的四个顶点设置对应的纹理坐标，也就是所谓的 UV 坐标。

U、V 是纹理坐标的两个轴，范围通常是 0 到 1；
UV 坐标的作用是告诉 GPU：这个顶点对应贴图中的哪个位置；
比如左上角是 (0,0)，右下角是 (1,1)，这样整个贴图就会刚好填满整个矩形。

这和我们之前在 CPU 上自己写的渲染器中做法完全一致。

3. 将贴图加载进 GPU 内存

接下来我们需要把一张贴图，也就是一张图像，加载到 GPU 中。这张图像是我们在 CPU 渲染器中已经生成好的那一张画面。

加载的方式通常是使用 OpenGL 的 glTexImage2D 或其他相关函数，把像素数据从 CPU 端上传到 GPU 的显存中。

4. 渲染这个贴图

当我们完成以上三步之后，我们就有了：

一个在屏幕上的矩形区域；
这个矩形的每个顶点都有对应的纹理坐标；
一张已经加载好的贴图；

现在我们只需要用 OpenGL 渲染这个矩形，GPU 就会自动用贴图的内容来"填充"整个矩形区域，实现图像显示的目的。

最终效果

一旦完成这些步骤，屏幕上就会显示出我们原本在 CPU 中渲染出来的那张画面，但现在是由 GPU 通过 OpenGL 来负责显示的。这就是我们迁移渲染工作的一小步，从 CPU 显示到 GPU 显示的关键节点。

这个过程是整个 GPU 渲染系统的基础操作。只要能成功做出这一步，就可以在其基础上继续实现更复杂的 GPU 加速渲染。

win32_game.cpp: 解释 glVertex 命名法

我们要做的第一步，是尝试在屏幕上绘制一个矩形，这个矩形由两个三角形拼接而成。这个阶段我们不会贴图，只先试着画出纯几何形状，确认 OpenGL 渲染管线是否正常工作。由于贴图是一个更复杂的步骤，我们将其留到后面。

保持背景粉色

我们仍然保留背景为粉色的清屏操作（glClearColor + glClear），这样做的好处是：

可以非常直观地看出我们画上去的图形是否真的显示出来；
如果矩形能正确覆盖粉色背景，说明渲染路径基本是通的。

使用 OpenGL 旧式固定功能管线绘制

接下来我们将采用 OpenGL 的**旧式渲染方式（Immediate Mode）**来绘制两个三角形，也就是用 glBegin() 和 glEnd() 来环绕绘图指令。

为什么用这种方式？

这是最基础的绘图方式；
逻辑清晰，利于理解整个 OpenGL 渲染流程；
虽然效率不高，也不适合现代项目，但非常适合教学阶段使用。

如何使用 glBegin 和 glEnd

在 glBegin(GL_TRIANGLES) 和 glEnd() 之间，依次调用 glVertex 来设置三角形的三个顶点，每三个点构成一个三角形：

c 复制代码

glBegin(GL_TRIANGLES);
glVertex2f(x1, y1);
glVertex2f(x2, y2);
glVertex2f(x3, y3);
// 第二个三角形
glVertex2f(x4, y4);
glVertex2f(x5, y5);
glVertex2f(x6, y6);
glEnd();

这些坐标就是屏幕空间中我们希望绘制三角形的具体位置。

glVertex 的命名规则

OpenGL 函数的命名有一定的模式：

glVertex 表示定义顶点；
后缀中带的数字是维度，比如：
- 2 表示二维（只传 X 和 Y）；
- 3 表示三维（传 X、Y、Z）；
后缀中带的字母表示数据类型：
- f 是 float（浮点型）；
- i 是 int（整型）；
- ub 是 unsigned byte（无符号字节）；

例如：

glVertex2f(x, y)：二维浮点坐标；
glVertex3i(x, y, z)：三维整型坐标；
glVertex2ub(x, y)：二维无符号字节坐标。

当前阶段目标

目前我们只是要把一个由两个三角形组成的矩形绘制出来，用来覆盖在粉色背景上。这是验证我们能否正确把图形从 CPU 端发送到 GPU 并在屏幕上显示的重要步骤。

优化等高级内容都暂时忽略，因为在这个基础阶段，核心是理解流程而不是追求极致效率。

下一步会逐步引入纹理和现代 OpenGL 的做法，但目前先专注于理解基本的图形绘制过程。

Blackboard: 用三角形覆盖屏幕

现在我们面临的问题是：如何确定我们要绘制的三角形的坐标？

视口（Viewport）的坐标范围

在前面已经设置好了视口，它定义了我们在窗口中绘图的区域范围：

X 轴从 0 到 窗口宽度；
Y 轴从 0 到 窗口高度；

所以我们在使用顶点坐标时，应该以这个范围为参照系，来决定三角形的具体位置。

绘制矩形所需的两个三角形

我们要绘制的矩形，会通过两个三角形来拼接完成，构造方式如下：

第一个三角形：

左上角：(0, 0)
右上角：(width, 0)
右下角：(width, height)

第二个三角形：

左上角：(0, 0)
右下角：(width, height)
左下角：(0, height)

通过这两个三角形的拼接，完整覆盖整个窗口区域。

坐标值来源

这些顶点坐标都是显而易见、已知的：

width 和 height 是当前窗口的宽度和高度；
所以顶点坐标可以直接根据窗口尺寸来构造，无需复杂计算。

这一步的目标是确认：我们在不使用任何纹理的前提下，仅靠两个三角形，能否覆盖整个窗口区域。这是为后续贴图打基础的关键验证步骤。

win32_game.cpp: 构建我们的第一个 OpenGL 基元，一个三角形

我们要绘制一个矩形，方法是使用两个三角形来拼接覆盖整个窗口。这两个三角形的坐标非常直观，完全基于窗口的宽度和高度来确定。

第一个三角形（下半部分）

顶点坐标如下：

(0, 0) ------ 左上角
(window_width, 0) ------ 右上角
(window_width, window_height) ------ 右下角

这个三角形从窗口的左上角延伸到右上角，然后再到底部右侧，构成矩形的下半部分。

第二个三角形（上半部分）

顶点坐标如下：

(0, 0) ------ 左上角
(window_width, window_height) ------ 右下角
(0, window_height) ------ 左下角

这个三角形从左上角延伸到右下角，然后回到左下角，补上了矩形的上半部分。

总结

我们利用窗口的尺寸信息 (window_width, window_height) 构造了两个三角形；
这两个三角形拼接起来刚好完整覆盖整个窗口区域；
这个绘制方式不涉及纹理或颜色，仅仅用于测试三角形的基本绘制是否正确；
其中一个被称为下三角形（lower triangle），另一个为上三角形（upper triangle）；

这是进一步将图像贴图到 GPU 上之前非常关键的一步，确认基本图形绘制无误。

运行游戏并"看到"我们的三角形

在理论上，如果我们现在运行这段代码，应该能够看到两个三角形被绘制出来。然而，实际情况是，绘制出来的两个三角形并没有按预期填满整个屏幕。它们的位置并不正确。按照我们设想的坐标系统，应该是：

(0, 0) 是屏幕的左上角，
(width, 0) 是屏幕的右上角，
(0, height) 是屏幕的左下角，
(width, height) 是屏幕的右下角。

这样，理论上这两个三角形应该填满整个屏幕，但实际情况是它们并没有完全覆盖屏幕。

问题分析：

这个问题的原因是因为 OpenGL 默认使用了固定功能管道（fixed function pipeline）。当不使用着色器时，OpenGL 会按照固定的方式进行处理。在这种情况下，坐标系没有直接按照屏幕像素来进行映射，而是使用了不同的坐标空间，这就是为什么绘制的三角形没有填满整个屏幕的原因。

解决思路：

要解决这个问题，首先需要理解固定功能管道的工作原理，它会对坐标进行不同的转换和处理，最终才会映射到屏幕上的位置。因此，为了让三角形正确地覆盖屏幕，需要对这些坐标进行适当的调整，或者通过使用着色器来控制坐标的转换过程。

Blackboard: 固定功能管线与可编程管线

在 OpenGL 中，有两种主要的渲染管线：固定功能管线（Fixed Function Pipeline）和可编程管线（Programmable Pipeline）。固定功能管线是早期 GPU 的工作方式，在这种模式下，GPU 只能执行一系列固定的操作，比如按某种方式处理顶点、裁剪三角形以及填充像素。而可编程管线则是现代 GPU 的工作方式，允许通过编写着色器来实现更灵活的操作。

在固定功能管线中，最基本的顶点着色器操作已经被硬件直接实现。这个操作包括顶点变换、裁剪三角形，以及窗口空间变换（Windows space transform）。然而，在可编程管线中，很多操作都可以通过着色器自定义，顶点变换和窗口空间变换也可以通过编写着色器来实现，而裁剪通常仍然是通过固定功能完成的。

问题出现在由于未设置合适的顶点变换，导致绘制的图形没有出现在预期的位置。在固定功能管线中，默认的变换方式并不会将输入的顶点直接映射到屏幕坐标上，因此结果可能是我们无法理解的随机位置。而如果我们自己实现着色器，可以完全控制顶点的变换和像素的填充。

理解固定功能管线的工作原理非常重要，因为我们实现的着色器实际上可以模拟固定功能管线的行为，只要设置合适的参数。

Blackboard: 矩阵乘法

在 OpenGL 中，矩阵和向量是核心概念。矩阵记录了一系列数学操作，这些操作会对向量进行变换。在计算机图形学中，矩阵乘法常用于对顶点坐标（如 3D 点）进行变换。

首先，矩阵乘法的过程是通过将矩阵的每一行与向量的每一列进行计算，生成新的向量。具体来说，当一个 3D 向量（如 (x, y, z)）与一个 3x3 的矩阵相乘时，每一行的元素都会与向量的对应元素相乘，然后加和，最终得到新的坐标值。比如，假设矩阵是：

( A B C D E F G H I ) \begin{pmatrix} A & B & C \\ D & E & F \\ G & H & I \end{pmatrix} ADGBEHCFI

而向量是 (x, y, z)，那么矩阵与向量的乘法会按照如下步骤进行：

新的 X 值是 Ax + By + Cz
新的 Y 值是 Dx + Ey + Fz
新的 Z 值是 Gx + Hy + Iz

这个过程就是矩阵变换。对于每个坐标轴（X、Y 和 Z），都有三个系数，分别控制 X、Y 和 Z 的输出值。这意味着你可以根据需要调整这些系数，来得到不同的变换效果，如旋转、缩放或平移。

理解矩阵变换非常重要，因为它是 OpenGL 渲染管线中的基础。无论是固定功能管线还是可编程管线，矩阵和向量的变换操作都是其核心操作之一。在 OpenGL 中，矩阵变换通常用于将物体从一个坐标空间转换到另一个坐标空间，比如从物体坐标系转换到世界坐标系、视图坐标系或者投影坐标系。

总的来说，矩阵是一个非常强大且灵活的工具，通过调整矩阵中的系数，能够实现各种复杂的变换，极大地提高了图形渲染的灵活性和效率。

举一个简单的例子来帮助理解矩阵和向量的变换过程。

假设有一个三维点 (x, y, z)，我们想要对这个点进行缩放，旋转和平移三种常见的变换。每种变换都可以通过矩阵乘法来实现。我们将通过具体的矩阵和向量计算来展示这些变换是如何进行的。

1. 缩放变换

缩放变换通过缩放矩阵来实现。如果我们想要将一个点的 X 轴和 Y 轴坐标分别缩放 2 倍和 3 倍，我们可以使用一个 3x3 的缩放矩阵：

s ⋅ ( x y z ) = ( 2 0 0 0 3 0 0 0 1 ) ⋅ ( x y z ) = ( 2 x 3 y z ) s \cdot \begin{pmatrix} x \\ y \\ z \end{pmatrix} = \begin{pmatrix} 2 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 1 \end{pmatrix} \cdot \begin{pmatrix} x \\ y \\ z \end{pmatrix} = \begin{pmatrix} 2x \\ 3y \\ z \end{pmatrix} s⋅ xyz = 200030001 ⋅ xyz = 2x3yz

然后我们将这个矩阵与点 (x, y, z) 进行矩阵乘法：

这样，经过缩放变换后，点 (x, y, z) 会变成 (2x, 3y, z)，即 X 坐标变为 2 倍，Y 坐标变为 3 倍，而 Z 坐标保持不变。

2. 旋转变换

旋转变换常用的旋转矩阵是在二维或三维空间中的旋转。例如，假设我们要在 XY 平面 上旋转一个点 90 度（顺时针旋转）。可以使用如下的旋转矩阵：

R = ( cos ⁡ ( θ ) − sin ⁡ ( θ ) 0 sin ⁡ ( θ ) cos ⁡ ( θ ) 0 0 0 1 ) R = \begin{pmatrix} \cos(\theta) & -\sin(\theta) & 0 \\ \sin(\theta) & \cos(\theta) & 0 \\ 0 & 0 & 1 \end{pmatrix} R= cos(θ)sin(θ)0−sin(θ)cos(θ)0001

其中，θ = 90°。代入角度，我们得到：

R = ( 0 − 1 0 1 0 0 0 0 1 ) R = \begin{pmatrix} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix} R= 010−100001

然后，假设我们要旋转的点是 (x, y, z)，那么将该点与旋转矩阵相乘，得到新的坐标：

R ⋅ ( x , y , z ) = ( 0 − 1 0 1 0 0 0 0 1 ) ⋅ ( x y z ) = ( − y x z ) R \cdot (x, y, z) = \begin{pmatrix} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix} \cdot \begin{pmatrix} x \\ y \\ z \end{pmatrix} = \begin{pmatrix} -y \\ x \\ z \end{pmatrix} R⋅(x,y,z)= 010−100001 ⋅ xyz = −yxz

这样，经过旋转变换后，点 (x, y, z) 变成了 (-y, x, z)，即在 XY 平面内顺时针旋转 90 度，Z 坐标保持不变。

3. 平移变换

平移变换通过平移矩阵实现，它是一个 4x4 矩阵，通常用于处理 3D 空间中的平移。假设我们要将点 (x, y, z) 沿 X 轴、Y 轴和 Z 轴平移一定的距离，假设分别平移 dx，dy 和 dz。

平移矩阵如下：

T = ( 1 0 0 d x 0 1 0 d y 0 0 1 d z 0 0 0 1 ) T = \begin{pmatrix} 1 & 0 & 0 & dx \\ 0 & 1 & 0 & dy \\ 0 & 0 & 1 & dz \\ 0 & 0 & 0 & 1 \end{pmatrix} T= 100001000010dxdydz1

平移变换会将点 (x, y, z) 转换为 (x + dx, y + dy, z + dz)，即将点沿 X 轴平移 dx，Y 轴平移 dy，Z 轴平移 dz。

综合应用：组合缩放、旋转和平移

我们还可以将这些变换组合起来，形成一个更复杂的变换。例如，首先进行缩放，再进行旋转，最后进行平移。为了完成这个操作，我们可以将所有的变换矩阵相乘，然后应用到点上。

例如，假设我们先进行缩放，再旋转，最后平移。我们可以将这些矩阵相乘，得到最终的变换矩阵：

M = T ⋅ R ⋅ S M = T \cdot R \cdot S M=T⋅R⋅S

然后，使用这个综合矩阵对点进行变换。每个变换都通过矩阵乘法依次作用在点上。

总结

矩阵变换 让我们可以对三维点进行各种操作，包括缩放、旋转和平移。
通过矩阵乘法，我们能够灵活地调整顶点的位置，并通过调整矩阵中的系数来得到不同的几何变换效果。
在 OpenGL 中，矩阵变换是渲染管线中的核心操作之一，它帮助将物体从模型空间变换到屏幕空间。

Blackboard: 齐次坐标和仿射变换

OpenGL 在处理坐标变换时，在线性变换的基础上更进一步，引入了齐次坐标（homogeneous coordinates），从而支持更丰富的变换形式。

在线性变换中，我们通过一个矩阵与向量相乘来实现，例如：

$$

\begin{pmatrix}
a & b & c \
e & f & g \
i & j & k \
\end{pmatrix}
\cdot
\begin{pmatrix}
x \
y \
z
\end{pmatrix}

\begin{pmatrix}

ax + by + cz \

ex + fy + gz \

ix + jy + kz

\end{pmatrix}

这类变换只能对输入向量进行缩放、旋转、错切等操作，但无法实现平移。也就是说，无法给输入值增加一个固定偏移量，因为矩阵中每一个值都要乘以输入向量的某一项，没有办法单独加一个固定值。例如，如果输入是 `(0, 0, 0)`，无论矩阵怎么写，输出永远是 `(0, 0, 0)`。 为了实现"平移"这种非线性操作，我们引入**齐次坐标**。通过将三维向量扩展为四维向量： ( x , y , z ) → ( x , y , z , 1 ) (x, y, z) \\rightarrow (x, y, z, 1) (x,y,z)→(x,y,z,1) 然后使用一个 4x4 的矩阵进行变换： ##

\begin{pmatrix}
a & b & c & d \
e & f & g & h \
i & j & k & l \
0 & 0 & 0 & 1
\end{pmatrix}
\cdot
\begin{pmatrix}
x \
y \
z \
1
\end{pmatrix}