
通过上图,你可以建立起一个清晰的学习框架。接下来,我们深入探讨其中一些最核心且最容易混淆的概念。
📖 核心概念详解
1. 基础认知层:从ML到LLM
| 术语 | 核心解释 | 生活类比 |
|---|---|---|
| 机器学习 (ML) | 让计算机从数据中学习规律,而非直接编程。是所有现代AI的基石。 | 教孩子识别猫:不是告诉他规则,而是给他看很多猫的图片让他自己总结特征。 |
| 深度学习 (DL) | ML的一个分支,使用多层神经网络来学习数据的复杂模式。图像、语音识别多基于此。 | 用一组不同功能的放大镜(网络层)层层递进地观察一幅画的细节,从笔画到整体意境。 |
| 大语言模型 (LLM) | 基于海量文本训练出的深度学习模型,能理解和生成人类语言。ChatGPT、文心一言都属于此类。 | 一个阅读了整个人类互联网的"超级学者",能基于学到的知识进行对话和创作。 |
2. 工作原理层:模型如何学会思考
这个层面的概念描述了AI学习的"输入-处理-输出"全过程:
-
数据集 (Data Set) :模型学习的"教材"。分为训练集 (课本)、验证集 (随堂测验)和测试集(期末考试)。
-
训练 (Training) & 推理 (Inference) :训练 是模型从数据中学习的过程,非常耗费资源;推理是训练好的模型解决实际问题的过程,要求速度快。
-
参数 (Parameter) & 损失函数 (Loss Function) & 优化器 (Optimizer) :这是模型学习的核心循环。参数 是模型内部的"旋钮";损失函数 是衡量答案好坏的"评分标准";优化器则是根据得分调整旋钮的"策略"。
-
梯度下降 (Gradient Descent) & 反向传播 (Backpropagation) :这是优化器使用的具体"数学方法"。梯度下降 指出参数调整的方向,反向传播则是将误差从输出层逐层向前传递、计算每层该如何调整的高效算法。
3. 模型结构层:神经网络的基石
-
神经网络 (Neural Network):模仿人脑神经元连接的计算模型,是深度学习的骨架。
-
权重与偏置 (Weight & Bias) :神经元之间的连接强度 和每个神经元的激活阈值,是模型通过学习调整的核心参数。
-
激活函数 (Activation Function):决定神经元是否被"激活"并传递信号的函数,为网络引入非线性,使其能学习复杂模式。
4. 评估与应用层:衡量与使用AI
| 术语 | 核心解释 | 易混淆点对比 |
|---|---|---|
| 准确率/精确率/召回率 | 评估分类模型性能的指标。准确率 看整体正确比例;精确率 关注"预测为正的有多准";召回率关注"真正的正例找回了多少"。 | 在垃圾邮件检测中: • 高精确率 :很少误判正常邮件,但可能漏掉一些垃圾邮件。 • 高召回率:垃圾邮件基本都能抓住,但可能把一些正常邮件误关进垃圾箱。 |
| 过拟合 & 欠拟合 | 描述模型学习状态的术语。过拟合 是"死记硬背课本,不会举一反三";欠拟合是"连课本知识都没学会"。 | |
| 微调 (Fine-Tuning) | 在预训练大模型基础上,用特定领域数据进行额外训练,使其成为该领域的专家。 | 让通才(通识大模型)通过进修(微调)变成律师、医生等专才。 |
| 提示工程 (Prompt Engineering) | 通过精心设计输入提示(Prompt),来引导AI生成更高质量、更符合期望的输出。 | 向AI提问不是随意打字,而是像给下属写工作指令,需要清晰、具体、有约束条件。 |
| 智能体 (Agent) | 能理解目标、制定计划、执行动作(如调用工具)、并持续迭代的AI系统。它是AI从"聊天工具"迈向"自主执行者"的关键形态。 | 不是一个简单的聊天机器人,而是一个能帮你"查天气、订机票、写邮件汇总"的虚拟助手。 |
5. 前沿与挑战层:AI的现实困境
-
幻觉 (Hallucination) :AI生成看似合理但事实上错误或无关的内容。这是大模型因缺乏"事实核查"能力而产生的根本缺陷。
-
对齐 (Alignment) :让AI系统的目标、行为和价值观与人类意图和利益保持一致的巨大挑战。
-
偏见 (Bias) :训练数据中存在的社会偏见会被AI学习并放大,导致输出结果不公平。
💎 概念应用:一次完整的AI问答背后
当你问AI:"总结一下《三体》的核心思想"时,多个概念在协同工作:
-
你的问题被分词(Token化) ,并在模型的上下文窗口(Context) 内处理。
-
基于大语言模型(LLM) 通过深度学习(DL) 学到的知识进行推理(Inference)。
-
其回答可能基于提示工程(Prompt Engineering) 优化过,但也存在幻觉(Hallucination) 风险。
-
如果让一个智能体(Agent) 来做,它可能会先去维基百科查询,再总结。