🔹各个概念的定义
-
人工智能(AI, Artificial Intelligence)
- 最广义的概念:让机器具备类似人类的智能(感知、推理、决策、学习)。
- 例子:专家系统、搜索引擎、自动驾驶、推荐系统。
-
机器学习(ML, Machine Learning)
- AI 的一个子集。
- 机器通过数据 自动学习规律,而不是靠人工写规则。
- 例子:垃圾邮件分类、房价预测。
-
深度学习(DL, Deep Learning)
- ML 的一个子集。
- 使用 多层神经网络(deep neural networks) 从数据中学习复杂模式。
- 例子:图像识别(CNN)、语音识别(RNN/Transformer)。
-
基础模型(FM, Foundation Model)
- 一类在 大规模数据 上预训练,并能 迁移到多个任务 的大模型。
- 特点:通用性强,可以在下游场景进行微调。
- 例子:BERT、CLIP、GPT。
-
LLM(Large Language Model)
- FM 的一种,专门面向 自然语言。
- 特点:参数规模大(亿到万亿级),擅长理解和生成文本。
- 例子:GPT-3、GPT-4、LLaMA、Claude。
-
GPT(Generative Pre-trained Transformer)
- LLM 的代表架构之一。
- 来自 OpenAI,以 Transformer 为核心,采用 预训练 + 微调。
- 能进行对话、写代码、翻译、推理。
-
Generative AI(生成式人工智能)
- 指能 生成新内容(文本、图像、音频、视频)的 AI 系统。
- LLM(如 GPT)是 Generative AI 在文本领域的典型代表。
- 其他例子:MidJourney(图像)、Suno(音乐)、Runway(视频)。
🔹关系层级图
可以这样看待它们:
人工智能 AI
│
├── 机器学习 ML
│ │
│ └── 深度学习 DL
│ │
│ └── 基础模型 FM
│ │
│ ├── LLM (大语言模型)
│ │ └── GPT(代表性架构)
│ │
│ └── 其他 FM(BERT, CLIP, DALL·E)
│
└── Generative AI (跨模态生成式AI)
├── 文本 → LLM / GPT
├── 图像 → Stable Diffusion, MidJourney
├── 音频 → MusicGen, Suno
└── 视频 → Sora, Runway
🔹一句话总结
- AI 是最大的集合。
- ML 是 AI 的一个分支,靠数据学习。
- DL 是 ML 的子集,用神经网络。
- FM 是用海量数据预训练的大模型,可以迁移。
- LLM 是 FM 的一种,专门搞语言。
- GPT 是 LLM 的代表。
- Generative AI 是能生成新内容的 AI,GPT 属于其中的文本生成部分。