AI核心知识118—大语言模型之 Software 2.0 （简洁且通俗易懂版）

Software 2.0 (软件 2.0) 是由前特斯拉 AI 总监、OpenAI 创始成员 Andrej Karpathy 在 2017 年提出的一个极具前瞻性的概念。

它描述了计算机科学领域正在发生的一场底层范式转移：我们编写软件的方式，正在从"人类写代码"变成"机器找规律"。

如果说过去的几十轮对话都在聊具体的 AI 技术（齿轮和引擎），那么 Software 2.0 就是在聊这台机器全新的设计理念。

要理解 2.0，必须先看看我们过去几十年是怎么写软件的（Software 1.0）。

语言：神经网络的权重 (Weights)。你看到的不再是人类能读懂的英文字母，而是一堆包含几十亿个浮点数的巨大矩阵。
逻辑：人类不再写具体的步骤，而是设定一个目标 (Loss Function) ，并提供海量的例子 (Data)。机器自己去"试错"，找出能达成目标的最佳路径。
运作方式 ：数据 + 结果 = 规则 (模型)。
- 例子（识别照片里的猫） ：你没法用 if-else 写出"猫的定义"（因为光影、角度千变万化）。你只能给机器看 10 万张猫的图片，让神经网络自己"编译"出识别猫的权重。

在 Software 2.0 的视角下，一切计算机科学的基础概念都被重新定义了：

源代码 ( Source Code ) ：变成了数据集 (Dataset)。你清理和标注数据，就是在"写代码"。
编译器 (Compiler) ：变成了梯度下降 ( Gradient Descent ) / 深度学习 框架 ( PyTorch )。它把你的数据，编译成了能在 GPU 上运行的数字。
Bug (漏洞) ：不再是代码拼写错误，而是数据偏差 （比如你的数据集里只有白猫，模型就认不出黑猫）或者幻觉。

Karpathy 预言 Software 2.0 会吃掉 1.0，因为 2.0 具有传统代码无法比拟的优势：

能解决"只可意会不可言传"的问题：自动驾驶、机器翻译、下围棋。人类自己都不知道自己是怎么开车的（靠直觉），自然无法把规则写成 C++ 代码。只有 Software 2.0 能解决直觉问题。
算力 极其统一 (Homogeneous) ：Software 1.0 的代码里充满了复杂的跳转、分支，CPU 运行起来像走迷宫。而 Software 2.0 全是极其规律的矩阵乘法。这使得它与 GPU/TPU 这种暴力计算硬件简直是天作之合。
运行时间恒定：一段 C++ 代码可能因为触发了死循环导致卡死。但一个神经网络（如 Transformer），它算一遍的时间和内存占用是固定的、可预测的。

不会，但工作性质彻底变了。

在 Software 2.0 时代（也就是现在的大模型时代），顶级的 AI 工程师日常工作不再是绞尽脑汁地写底层逻辑代码。他们的工作变成了：

收集、清洗、过滤高质量的数据（Data Engineering）。
设计更好的奖励机制和微调方法。
构建我们刚刚聊过的 智能体 工作流 (Agentic Workflow )，用一小段 Software 1.0 的胶水代码，把巨大的 Software 2.0 模型串联起来。

Software 2.0 意味着：我们不再直接告诉计算机"怎么做"，而是告诉它"我们想要什么"，并给它足够的 算力 和例子，让它自己去找出"怎么做"。

这正是深度学习和大语言模型能够崛起的底层哲学。