AI核心知识66——大语言模型之Machine Learning （简洁且通俗易懂版）

阿杰学AI2025-12-25 8:49

机械学习 （英文 Machine Learning , ML ）是大语言模型（LLM）的**"祖宗"** ，也是整个 AI 大厦的地基。

为了更彻底搞懂它们的关系，我们必须先厘清一个**"俄罗斯套娃"** 般的层级关系：

AI (人工智能) → ML ( 机器学习 ) → DL ( 深度学习 ) → LLM (大语言模型)

简单来说：大语言模型是 机器学习 的一种特殊应用。

1.🆚 核心区别：传统编程 vs. 机器学习

要理解机器学习，最好的办法是看它和我们以前写代码（传统编程）有什么不同。

A. 传统编程 (Traditional Programming)

模式：人制定规则。
逻辑：程序员写好代码："如果（If）图片里有两个尖耳朵，并且（And）有胡须，那么（Then）这是猫。"
缺点：规则写不完。世界上有千奇百怪的猫，稍微侧个身、挡住耳朵，程序就傻了。

B. 机器学习 (Machine Learning)

模式：机器自己找规则。
逻辑：程序员不写规则。程序员把 100 万张猫的照片扔给机器，说："你自己看，这些都是猫。"机器通过数学算法，自己总结出"猫的特征"（可能是像素的某种排列组合，人类都看不懂）。
优点：泛化能力强。以后再来一张没见过的猫，它也能认出来。

一句话总结： 机器学习 就是"从数据中学习规律，而不是由人手写规则"。

2.🧠 LLM 中的机器学习：三个阶段

大语言模型（如 ChatGPT）的诞生，其实就是把机器学习的三种核心流派全部用了一遍：

第一阶段：无监督学习 (Unsupervised Learning) ------ 预训练 (Pre-training)

定义：给机器一堆书（数据），不告诉它答案，让它自己找规律。
在 LLM 中：把互联网上所有的文本喂给它。
它学到了什么：通过做"完形填空"（预测下一个词），它学会了语法、单词的搭配、世界的常识。
这是 机器学习 的"自学"阶段。

第二阶段：监督学习 (Supervised Learning) ------ 微调 (SFT)

定义：给机器一堆题，同时给它标准答案，让它照着学。
在 LLM 中：给它看"问题 + 完美回答"的数据对。
它学到了什么：它学会了怎么像人一样好好说话，怎么回答问题，而不是在那自言自语。
这是 机器学习 的"上课"阶段。

第三阶段：强化学习 (Reinforcement Learning) ------ RLHF / RLVR

定义：不给标准答案，只给奖励（糖）或惩罚（鞭子），让它自己试错。
在 LLM 中：它回答得好，点个赞（Reward）；回答得不好，扣分。
它学到了什么：它学会了什么样的回答最符合人类的偏好（有用、安全、正确）。
这是 机器学习 的"实战演练"阶段。

3.📉 本质：寻找一个数学函数

如果你问数学家"机器学习是什么"，他会告诉你：Function Approximation (函数逼近)。

大语言模型本质上就是一个超级巨大的数学函数 f(x)：

y = f(x)

输入 (x)：你的 Prompt（比如"今天天气怎么样？"）。
输出 (y)：AI 的回答（比如"今天天气不错。"）。
机器学习 (f) ：就是通过数万亿次的计算，调整模型里那几千亿个参数（权重），找到一个完美的函数 f，使得不管你输入什么 x，它都能吐出让你满意的 y。

4.🚀 为什么现在才火？

机器学习这个概念上世纪 50 年代就有了，为什么最近才爆发？

数据 (Data)：互联网让我们有了海量的数据来"喂"机器。
算力 (Compute)：GPU (英伟达显卡) 的出现，让我们算得动这么复杂的数学题。
算法 (Algorithm) ：Transformer 架构（属于深度学习）的出现，让机器处理语言的效率提升了亿万倍。

总结

机器学习 ( Machine Learning ) 是大语言模型的底层方法论。

它不是一种具体的软件，而是一种**"让计算机通过数据变聪明"的思想** 。
没有机器学习，就没有今天的大模型，我们就还得像几十年前一样，苦哈哈地手动写代码教电脑"什么是猫"。

上一篇：n8n工作流自动化平台曝高危漏洞（CVE-2025-68613，CVSS 9.9）：数万实例面临任意代码执行风险

下一篇：HTTPS 常用密钥交换算法解析

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04OpenClaw + 飞书（Feishu）环境搭建指南 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06Window 10部署openclaw报错node.exe : npm error code 128 07Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 08AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 09OpenClaw优化飞书API 额度已耗尽问题 10AI Agent 平台横评：ZeroClaw vs OpenClaw vs Nanobot