除了图文版本之外，也推荐观看视频版本：

【ChatGPT 是如何工作的？10分钟一起 get 生成式 AI】 www.bilibili.com/video/BV1vN...

生成式 AI 是如何工作的

生成式 AI 是目前最热门的技术之一，ChatGPT 等应用的出现使人们对于如何在各种领域中应用生成式 AI 有了许多新的思考。

但这些领域的从业者并不都具备 AI 相关的知识背景。所以我们制作了这个教程，向无 AI 知识背景的读者介绍生成式 AI 是如何工作的。

在互联网上，已经有许多非常精彩的生成式 AI 及其背后 AI 模型的工作原理介绍，例如：

但它们都花了较多篇幅相对深入地介绍了生成式 AI 背后的模型 Transformer，这对应着许多专业术语和复杂的数学逻辑。这是我们在本教程中将避免的。

如果你希望获取这部分的信息，建议阅读上述文章。

与本教程目标最相近的是 Financial Times 最新发布的一期文章，在制作本教程的过程中我们也大量参考了其内容组织思路和可视化风格。与其内容相比，本教程在内容上进行了一些增减，使其更符合我们认为易于理解的逻辑思路，但 FT 的这篇文章同样值得一看。

我们将从一些例子出发，逐步理解生成式 AI 如何实现：

理解词语
理解句子
进一步生成内容

图中的文本是一个典型的例子："买了一袋很甜的苹果，和新款的苹果手机"，苹果一词出现了两次但含义不同。

目前可用的生成式 AI 都克服了这一难题，能够准确理解两次出现的苹果的不同含义，让我们一起探索这一神奇能力背后的原理吧！

AI 如何理解词语

对于 AI 模型来说，在完成生成文本等更复杂的任务之前，首先需要完成第一步：理解词语。

对于人类来说，词语是在学习一门语言时逐渐掌握的知识，基于对语言的学习与应用，加深对词语含义的理解。

AI 模型同样通过一个学习过程掌握词语的含义，而学习的素材则是对应语言的海量文本。文本越多，AI 模型的学习效果越好，对词语的理解也就更准确。

但与人类不同的是，AI 模型需要将对词语的学习结果总结为一个量化的结果，才能被计算机程序存储以及持续使用。为了得到量化的结果，AI 领域的研究人员想到了一种方法：将词语在不同维度上分类打分，来对词语归类。

按照这个思路，我们在图中画出了两个维度：性别和年龄。再将四个词语 国王、王后、王子和公主在两个维度上打分，可以看到它们被清晰的分成了不同的类别。

在性别维度上相同的词语，说明词语在性别上的含义相同；同理，在年龄维度上相同的词语，则说明词语在年龄上的含义相同。

为了进一步量化，AI 模型会在维度上标记一些具体的分数代表不同的含义，例如性别维度上用 1 代表男性、2 代表女性，年龄维度上 1 代表少年、2 代表中年、3 代表老年。

以此类推，只要维度足够多、打分足够准确，AI 模型就可以越精准的理解一个词语的含义，而词语在 AI 模型眼中的量化结果就是一组不同维度上的分数。

对于目前较为先进的 AI 模型来说，通常维度的数量可以达到上千个。

AI 眼中的词语

在学习之后，AI 眼中每个词语的量化结果不同，但含义相似的词语在更多维度上会有相同或相近的分数。

如图中所画，国王和王子两个词语并不相同，但两者之间的含义比国王与大海之间相关性更强，因此它们的量化结果就会更相近。

我们在后续的章节中也将以不同颜色的一组色块示意一个词语在 AI 眼中的量化结果。

与上文所说一致，国王与王子相关性更强，大海与湖泊相关性更强，足球与篮球相关性更强。相关性更强的词语量化结果越相近。

AI 如何理解句子

学习词语并理解为量化的结果只完成了第一步，接下来 AI 就需要进一步理解一组词语的合集：句子。

在教程的开篇，我们提到了一个句子中出现两次苹果的例子。对于同一个 AI 模型，经过学习之后，苹果这个词语就拥有了固定的量化结果，那么如何体现它在这个句子中两次出现的不同含义呢？

目前流行的生成式 AI 模型都使用了相似的技术解决这一问题，而这类技术的理论基础是 2017 年 Google 发布的论文《Attention Is All You Need》，这篇论文也被视作生成式 AI 的开端。

这篇论文提出了一种名为自注意力（Self Attention）的机制。简单来说，当 AI 理解包含了一组词语的句子时，除了理解词语本身，还应该将每个词语和句子中的其他词语相结合进行第二轮理解。单个词语和句子中其他词语之间的关联性，称之为"注意力"，由于是和同一个句子自身的词语结合理解，所以称之为"自注意力"。