通识性AI知识点:AI学习框架(从ML到LLM的核心概念)

通过上图,你可以建立起一个清晰的学习框架。接下来,我们深入探讨其中一些最核心且最容易混淆的概念。

📖 核心概念详解

1. 基础认知层:从ML到LLM
术语 核心解释 生活类比
机器学习 (ML) 让计算机从数据中学习规律,而非直接编程。是所有现代AI的基石。 教孩子识别猫:不是告诉他规则,而是给他看很多猫的图片让他自己总结特征。
深度学习 (DL) ML的一个分支,使用多层神经网络来学习数据的复杂模式。图像、语音识别多基于此。 用一组不同功能的放大镜(网络层)层层递进地观察一幅画的细节,从笔画到整体意境。
大语言模型 (LLM) 基于海量文本训练出的深度学习模型,能理解和生成人类语言。ChatGPT、文心一言都属于此类。 一个阅读了整个人类互联网的"超级学者",能基于学到的知识进行对话和创作。
2. 工作原理层:模型如何学会思考

这个层面的概念描述了AI学习的"输入-处理-输出"全过程:

  • 数据集 (Data Set) :模型学习的"教材"。分为训练集 (课本)、验证集 (随堂测验)和测试集(期末考试)。

  • 训练 (Training) & 推理 (Inference)训练 是模型从数据中学习的过程,非常耗费资源;推理是训练好的模型解决实际问题的过程,要求速度快。

  • 参数 (Parameter) & 损失函数 (Loss Function) & 优化器 (Optimizer) :这是模型学习的核心循环。参数 是模型内部的"旋钮";损失函数 是衡量答案好坏的"评分标准";优化器则是根据得分调整旋钮的"策略"。

  • 梯度下降 (Gradient Descent) & 反向传播 (Backpropagation) :这是优化器使用的具体"数学方法"。梯度下降 指出参数调整的方向,反向传播则是将误差从输出层逐层向前传递、计算每层该如何调整的高效算法。

3. 模型结构层:神经网络的基石
  • 神经网络 (Neural Network):模仿人脑神经元连接的计算模型,是深度学习的骨架。

  • 权重与偏置 (Weight & Bias) :神经元之间的连接强度 和每个神经元的激活阈值,是模型通过学习调整的核心参数。

  • 激活函数 (Activation Function):决定神经元是否被"激活"并传递信号的函数,为网络引入非线性,使其能学习复杂模式。

4. 评估与应用层:衡量与使用AI
术语 核心解释 易混淆点对比
准确率/精确率/召回率 评估分类模型性能的指标。准确率 看整体正确比例;精确率 关注"预测为正的有多准";召回率关注"真正的正例找回了多少"。 在垃圾邮件检测中: • 高精确率 :很少误判正常邮件,但可能漏掉一些垃圾邮件。 • 高召回率:垃圾邮件基本都能抓住,但可能把一些正常邮件误关进垃圾箱。
过拟合 & 欠拟合 描述模型学习状态的术语。过拟合 是"死记硬背课本,不会举一反三";欠拟合是"连课本知识都没学会"。
微调 (Fine-Tuning) 在预训练大模型基础上,用特定领域数据进行额外训练,使其成为该领域的专家。 让通才(通识大模型)通过进修(微调)变成律师、医生等专才。
提示工程 (Prompt Engineering) 通过精心设计输入提示(Prompt),来引导AI生成更高质量、更符合期望的输出。 向AI提问不是随意打字,而是像给下属写工作指令,需要清晰、具体、有约束条件。
智能体 (Agent) 理解目标、制定计划、执行动作(如调用工具)、并持续迭代的AI系统。它是AI从"聊天工具"迈向"自主执行者"的关键形态。 不是一个简单的聊天机器人,而是一个能帮你"查天气、订机票、写邮件汇总"的虚拟助手
5. 前沿与挑战层:AI的现实困境
  • 幻觉 (Hallucination) :AI生成看似合理但事实上错误或无关的内容。这是大模型因缺乏"事实核查"能力而产生的根本缺陷。

  • 对齐 (Alignment) :让AI系统的目标、行为和价值观与人类意图和利益保持一致的巨大挑战。

  • 偏见 (Bias) :训练数据中存在的社会偏见会被AI学习并放大,导致输出结果不公平。

💎 概念应用:一次完整的AI问答背后

当你问AI:"总结一下《三体》的核心思想"时,多个概念在协同工作:

  1. 你的问题被分词(Token化) ,并在模型的上下文窗口(Context) 内处理。

  2. 基于大语言模型(LLM) 通过深度学习(DL) 学到的知识进行推理(Inference)

  3. 其回答可能基于提示工程(Prompt Engineering) 优化过,但也存在幻觉(Hallucination) 风险。

  4. 如果让一个智能体(Agent) 来做,它可能会先去维基百科查询,再总结。

相关推荐
全栈技术负责人2 小时前
Ling框架:针对AIGC工作流中JSON数据流式处理的解决方案
前端·ai
哥布林学者2 小时前
吴恩达深度学习课程四:计算机视觉 第三周:检测算法 (四)YOLO 的完整传播过程
深度学习·ai
itachi-uchiha3 小时前
通识性AI知识点:Token和Context
ai
陈橘又青5 小时前
vLLM-Ascend推理部署与性能调优深度实战指南:架构解析、环境搭建与核心配置
人工智能·后端·ai·架构·restful·数据·vllm
小北方城市网5 小时前
第7课:Vue 3应用性能优化与进阶实战——让你的应用更快、更流畅
前端·javascript·vue.js·ai·性能优化·正则表达式·json
慢慢慢时光6 小时前
claude code使用
ai
DO_Community6 小时前
从零开始,用 n8n 设计可扩展的自动化工作流
运维·ai·自动化·devops
程序员鱼皮6 小时前
女友怒骂国内不能用Claude Code,于是我给她做了一个
计算机·ai·程序员·大模型·互联网·编程
小真zzz6 小时前
当前集成Nano Banana Pro模型的AI PPT工具排名与分析
开发语言·人工智能·ai·powerpoint·ppt