AI核心知识66——大语言模型之Machine Learning (简洁且通俗易懂版)

机械学习 (英文 Machine Learning , ML )是大语言模型(LLM)的**"祖宗"** ,也是整个 AI 大厦的地基

为了更彻底搞懂它们的关系,我们必须先厘清一个**"俄罗斯套娃"** 般的层级关系:

AI (人工智能) → ML ( 机器学习 ) → DL ( 深度学习 ) → LLM (大语言模型)

简单来说:大语言模型是 机器学习 的一种特殊应用。


1.🆚 核心区别:传统编程 vs. 机器学习

要理解机器学习,最好的办法是看它和我们以前写代码(传统编程)有什么不同。

A. 传统编程 (Traditional Programming)
  • 模式人制定规则

  • 逻辑:程序员写好代码:"如果(If)图片里有两个尖耳朵,并且(And)有胡须,那么(Then)这是猫。"

  • 缺点:规则写不完。世界上有千奇百怪的猫,稍微侧个身、挡住耳朵,程序就傻了。

B. 机器学习 (Machine Learning)
  • 模式机器自己找规则

  • 逻辑:程序员不写规则。程序员把 100 万张猫的照片扔给机器,说:"你自己看,这些都是猫。"机器通过数学算法,自己总结出"猫的特征"(可能是像素的某种排列组合,人类都看不懂)。

  • 优点:泛化能力强。以后再来一张没见过的猫,它也能认出来。

一句话总结: 机器学习 就是"从数据中学习规律,而不是由人手写规则"。


2.🧠 LLM 中的机器学习:三个阶段

大语言模型(如 ChatGPT)的诞生,其实就是把机器学习的三种核心流派全部用了一遍:

第一阶段:无监督学习 (Unsupervised Learning) ------ 预训练 (Pre-training)
  • 定义 :给机器一堆书(数据),不告诉它答案,让它自己找规律。

  • LLM :把互联网上所有的文本喂给它。

  • 它学到了什么:通过做"完形填空"(预测下一个词),它学会了语法、单词的搭配、世界的常识。

  • 这是 机器学习 的"自学"阶段。

第二阶段:监督学习 (Supervised Learning) ------ 微调 (SFT)
  • 定义 :给机器一堆题,同时给它标准答案,让它照着学。

  • LLM :给它看"问题 + 完美回答"的数据对。

  • 它学到了什么:它学会了怎么像人一样好好说话,怎么回答问题,而不是在那自言自语。

  • 这是 机器学习 的"上课"阶段。

第三阶段:强化学习 (Reinforcement Learning) ------ RLHF / RLVR
  • 定义 :不给标准答案,只给奖励(糖)或惩罚(鞭子),让它自己试错。

  • LLM :它回答得好,点个赞(Reward);回答得不好,扣分。

  • 它学到了什么:它学会了什么样的回答最符合人类的偏好(有用、安全、正确)。

  • 这是 机器学习 的"实战演练"阶段。


3.📉 本质:寻找一个数学函数

如果你问数学家"机器学习是什么",他会告诉你:Function Approximation (函数逼近)

大语言模型本质上就是一个超级巨大的数学函数 f(x)

y = f(x)

  • 输入 (x):你的 Prompt(比如"今天天气怎么样?")。

  • 输出 (y):AI 的回答(比如"今天天气不错。")。

  • 机器学习 (f) :就是通过数万亿次的计算,调整模型里那几千亿个参数(权重),找到一个完美的函数 f,使得不管你输入什么 x,它都能吐出让你满意的 y。


4.🚀 为什么现在才火?

机器学习这个概念上世纪 50 年代就有了,为什么最近才爆发?

  1. 数据 (Data):互联网让我们有了海量的数据来"喂"机器。

  2. 算力 (Compute):GPU (英伟达显卡) 的出现,让我们算得动这么复杂的数学题。

  3. 算法 (Algorithm)Transformer 架构(属于深度学习)的出现,让机器处理语言的效率提升了亿万倍。


总结

机器学习 ( Machine Learning ) 是大语言模型的底层方法论

  • 它不是一种具体的软件,而是一种**"让计算机通过数据变聪明"的思想** 。

  • 没有机器学习,就没有今天的大模型,我们就还得像几十年前一样,苦哈哈地手动写代码教电脑"什么是猫"。

相关推荐
带刺的坐椅19 小时前
从 Claude Code 隐私争议,看 SolonCode 的设计选择
ai·llm·agent·claudecode·soloncode·codingplan
冬奇Lab21 小时前
Workflow 系列(03):状态管理——持久化、幂等性与版本绑定
人工智能·工作流引擎
冬奇Lab21 小时前
每日一个开源项目(第146篇):openpilot - 开源自动驾驶辅助系统,曾在 Consumer Reports 评测中超过特斯拉 Autopilot
人工智能·开源·自动驾驶
threerocks21 小时前
一用一个不吱声的视频解析 Skill,你值得拥有
aigc·ai编程
吴佳浩1 天前
AI 工程师知识地图:模型格式、框架、部署工具一次讲明白
人工智能·aigc·ai编程
IT_陈寒1 天前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
码农胖大海1 天前
AI额度不够用的解决方案
人工智能
lincats1 天前
Claude Code项目越写越乱?这套清理流程能救你
ai·ai agent·claude code
后端小肥肠1 天前
小红书虚拟商品怎么做?我先用 Skill 跑通了壁纸品类
人工智能·aigc·agent