通识性AI知识点:AI学习框架(从ML到LLM的核心概念)

通过上图,你可以建立起一个清晰的学习框架。接下来,我们深入探讨其中一些最核心且最容易混淆的概念。

📖 核心概念详解

1. 基础认知层:从ML到LLM
术语 核心解释 生活类比
机器学习 (ML) 让计算机从数据中学习规律,而非直接编程。是所有现代AI的基石。 教孩子识别猫:不是告诉他规则,而是给他看很多猫的图片让他自己总结特征。
深度学习 (DL) ML的一个分支,使用多层神经网络来学习数据的复杂模式。图像、语音识别多基于此。 用一组不同功能的放大镜(网络层)层层递进地观察一幅画的细节,从笔画到整体意境。
大语言模型 (LLM) 基于海量文本训练出的深度学习模型,能理解和生成人类语言。ChatGPT、文心一言都属于此类。 一个阅读了整个人类互联网的"超级学者",能基于学到的知识进行对话和创作。
2. 工作原理层:模型如何学会思考

这个层面的概念描述了AI学习的"输入-处理-输出"全过程:

  • 数据集 (Data Set) :模型学习的"教材"。分为训练集 (课本)、验证集 (随堂测验)和测试集(期末考试)。

  • 训练 (Training) & 推理 (Inference)训练 是模型从数据中学习的过程,非常耗费资源;推理是训练好的模型解决实际问题的过程,要求速度快。

  • 参数 (Parameter) & 损失函数 (Loss Function) & 优化器 (Optimizer) :这是模型学习的核心循环。参数 是模型内部的"旋钮";损失函数 是衡量答案好坏的"评分标准";优化器则是根据得分调整旋钮的"策略"。

  • 梯度下降 (Gradient Descent) & 反向传播 (Backpropagation) :这是优化器使用的具体"数学方法"。梯度下降 指出参数调整的方向,反向传播则是将误差从输出层逐层向前传递、计算每层该如何调整的高效算法。

3. 模型结构层:神经网络的基石
  • 神经网络 (Neural Network):模仿人脑神经元连接的计算模型,是深度学习的骨架。

  • 权重与偏置 (Weight & Bias) :神经元之间的连接强度 和每个神经元的激活阈值,是模型通过学习调整的核心参数。

  • 激活函数 (Activation Function):决定神经元是否被"激活"并传递信号的函数,为网络引入非线性,使其能学习复杂模式。

4. 评估与应用层:衡量与使用AI
术语 核心解释 易混淆点对比
准确率/精确率/召回率 评估分类模型性能的指标。准确率 看整体正确比例;精确率 关注"预测为正的有多准";召回率关注"真正的正例找回了多少"。 在垃圾邮件检测中: • 高精确率 :很少误判正常邮件,但可能漏掉一些垃圾邮件。 • 高召回率:垃圾邮件基本都能抓住,但可能把一些正常邮件误关进垃圾箱。
过拟合 & 欠拟合 描述模型学习状态的术语。过拟合 是"死记硬背课本,不会举一反三";欠拟合是"连课本知识都没学会"。
微调 (Fine-Tuning) 在预训练大模型基础上,用特定领域数据进行额外训练,使其成为该领域的专家。 让通才(通识大模型)通过进修(微调)变成律师、医生等专才。
提示工程 (Prompt Engineering) 通过精心设计输入提示(Prompt),来引导AI生成更高质量、更符合期望的输出。 向AI提问不是随意打字,而是像给下属写工作指令,需要清晰、具体、有约束条件。
智能体 (Agent) 理解目标、制定计划、执行动作(如调用工具)、并持续迭代的AI系统。它是AI从"聊天工具"迈向"自主执行者"的关键形态。 不是一个简单的聊天机器人,而是一个能帮你"查天气、订机票、写邮件汇总"的虚拟助手
5. 前沿与挑战层:AI的现实困境
  • 幻觉 (Hallucination) :AI生成看似合理但事实上错误或无关的内容。这是大模型因缺乏"事实核查"能力而产生的根本缺陷。

  • 对齐 (Alignment) :让AI系统的目标、行为和价值观与人类意图和利益保持一致的巨大挑战。

  • 偏见 (Bias) :训练数据中存在的社会偏见会被AI学习并放大,导致输出结果不公平。

💎 概念应用:一次完整的AI问答背后

当你问AI:"总结一下《三体》的核心思想"时,多个概念在协同工作:

  1. 你的问题被分词(Token化) ,并在模型的上下文窗口(Context) 内处理。

  2. 基于大语言模型(LLM) 通过深度学习(DL) 学到的知识进行推理(Inference)

  3. 其回答可能基于提示工程(Prompt Engineering) 优化过,但也存在幻觉(Hallucination) 风险。

  4. 如果让一个智能体(Agent) 来做,它可能会先去维基百科查询,再总结。

相关推荐
美酒没故事°1 天前
Open WebUI安装指南。搭建自己的自托管 AI 平台
人工智能·windows·ai
鸿乃江边鸟1 天前
Nanobot 从onboard启动命令来看个人助理Agent的实现
人工智能·ai
本旺1 天前
【Openclaw 】完美解决 Codex 认证失败
ai·codex·openclaw·小龙虾·gpt5.4
张張4081 天前
(域格)环境搭建和编译
c语言·开发语言·python·ai
乐鑫科技 Espressif1 天前
使用 MCP 服务器,把乐鑫文档接入 AI 工作流
人工智能·ai·esp32·乐鑫科技
语戚1 天前
Stable Diffusion 入门:架构、空间与生成流程概览
人工智能·ai·stable diffusion·aigc·模型
俊哥V1 天前
每日 AI 研究简报 · 2026-04-08
人工智能·ai
rrrjqy1 天前
什么是RAG?
ai
Flittly1 天前
【SpringAIAlibaba新手村系列】(15)MCP Client 调用本地服务
java·笔记·spring·ai·springboot
Flittly1 天前
【SpringAIAlibaba新手村系列】(14)MCP 本地服务与工具集成
java·spring boot·笔记·spring·ai