从人工智能到大语言模型

软件不硬2026-01-04 11:24

下图展示了人工智能、机器学习、深度学习和大语言模型以及生成式大语言模型之间的关系。

人工智能是包括机器学习、深度学习等众多分支的领域，旨在开发能够执行需要人类智能水平的任务（包括语音理解、模式识别、决策制定）的机器。

机器学的重点研究内容是实现人工智能的算法。机器学习涉及开发能够从数据中学习的算法。无需明确编程，这些算法就能基于数据做出预测或决策。

深度学习是机器学习的一个分支，它主要利用 3 层及以上的神经网络（深度神经网络）来建模数据中的复杂模式和抽象特征。与深度学习不同，在传统的机器学习方法中，特征提取过程通常依赖于人工干预，这要求领域专家手动识别并选定对于给定任务最为关键的数据特征。

尽管当前人工智能领域现在由机器学习和深度学习所主导，但该领域也涉及其他方法，比如基于规则的系统、遗传算法、专家系统、模糊逻辑或符号推理。这些多样化的技术手段共同构成了现代人工智能研究领域。

构建大语言模型

大语言模型的预训练目标是在大量无标注的文本语料库（原始文本）上进行下一单词预测。预训练完成后，可以使用较小的带标注的数据集对大语言模型进行微调。

构建大语言模型有3个主要阶段：实现模型架构和准备数据（第一阶段）；在海量的无标注文本上进行预训练，以获得基础模型（第二阶段）；在更小规模且经过标注的目标数据集上进行微调，以得到个人助手或文本分类器（第三阶段）

参考

● 《从零构建大模型》