AI核心知识66——大语言模型之Machine Learning (简洁且通俗易懂版)

机械学习 (英文 Machine Learning , ML )是大语言模型(LLM)的**"祖宗"** ,也是整个 AI 大厦的地基

为了更彻底搞懂它们的关系,我们必须先厘清一个**"俄罗斯套娃"** 般的层级关系:

AI (人工智能) → ML ( 机器学习 ) → DL ( 深度学习 ) → LLM (大语言模型)

简单来说:大语言模型是 机器学习 的一种特殊应用。


1.🆚 核心区别:传统编程 vs. 机器学习

要理解机器学习,最好的办法是看它和我们以前写代码(传统编程)有什么不同。

A. 传统编程 (Traditional Programming)
  • 模式人制定规则

  • 逻辑:程序员写好代码:"如果(If)图片里有两个尖耳朵,并且(And)有胡须,那么(Then)这是猫。"

  • 缺点:规则写不完。世界上有千奇百怪的猫,稍微侧个身、挡住耳朵,程序就傻了。

B. 机器学习 (Machine Learning)
  • 模式机器自己找规则

  • 逻辑:程序员不写规则。程序员把 100 万张猫的照片扔给机器,说:"你自己看,这些都是猫。"机器通过数学算法,自己总结出"猫的特征"(可能是像素的某种排列组合,人类都看不懂)。

  • 优点:泛化能力强。以后再来一张没见过的猫,它也能认出来。

一句话总结: 机器学习 就是"从数据中学习规律,而不是由人手写规则"。


2.🧠 LLM 中的机器学习:三个阶段

大语言模型(如 ChatGPT)的诞生,其实就是把机器学习的三种核心流派全部用了一遍:

第一阶段:无监督学习 (Unsupervised Learning) ------ 预训练 (Pre-training)
  • 定义 :给机器一堆书(数据),不告诉它答案,让它自己找规律。

  • LLM :把互联网上所有的文本喂给它。

  • 它学到了什么:通过做"完形填空"(预测下一个词),它学会了语法、单词的搭配、世界的常识。

  • 这是 机器学习 的"自学"阶段。

第二阶段:监督学习 (Supervised Learning) ------ 微调 (SFT)
  • 定义 :给机器一堆题,同时给它标准答案,让它照着学。

  • LLM :给它看"问题 + 完美回答"的数据对。

  • 它学到了什么:它学会了怎么像人一样好好说话,怎么回答问题,而不是在那自言自语。

  • 这是 机器学习 的"上课"阶段。

第三阶段:强化学习 (Reinforcement Learning) ------ RLHF / RLVR
  • 定义 :不给标准答案,只给奖励(糖)或惩罚(鞭子),让它自己试错。

  • LLM :它回答得好,点个赞(Reward);回答得不好,扣分。

  • 它学到了什么:它学会了什么样的回答最符合人类的偏好(有用、安全、正确)。

  • 这是 机器学习 的"实战演练"阶段。


3.📉 本质:寻找一个数学函数

如果你问数学家"机器学习是什么",他会告诉你:Function Approximation (函数逼近)

大语言模型本质上就是一个超级巨大的数学函数 f(x)

y = f(x)

  • 输入 (x):你的 Prompt(比如"今天天气怎么样?")。

  • 输出 (y):AI 的回答(比如"今天天气不错。")。

  • 机器学习 (f) :就是通过数万亿次的计算,调整模型里那几千亿个参数(权重),找到一个完美的函数 f,使得不管你输入什么 x,它都能吐出让你满意的 y。


4.🚀 为什么现在才火?

机器学习这个概念上世纪 50 年代就有了,为什么最近才爆发?

  1. 数据 (Data):互联网让我们有了海量的数据来"喂"机器。

  2. 算力 (Compute):GPU (英伟达显卡) 的出现,让我们算得动这么复杂的数学题。

  3. 算法 (Algorithm)Transformer 架构(属于深度学习)的出现,让机器处理语言的效率提升了亿万倍。


总结

机器学习 ( Machine Learning ) 是大语言模型的底层方法论

  • 它不是一种具体的软件,而是一种**"让计算机通过数据变聪明"的思想** 。

  • 没有机器学习,就没有今天的大模型,我们就还得像几十年前一样,苦哈哈地手动写代码教电脑"什么是猫"。

相关推荐
老刘干货9 分钟前
Prompt工程全解·第四篇:精雕细琢——迭代优化与防御性提示词设计
人工智能·技术人
輕華9 分钟前
OpenCV答题卡识别:从图像预处理到自动评分
人工智能·opencv·计算机视觉
JQLvopkk17 分钟前
机器视觉为何不用普通相机
人工智能·数码相机
AI航向标18 分钟前
OpenClaw 完整本地部署安装(接入飞书)
人工智能·飞书·openclaw
接着奏乐接着舞。20 分钟前
机器学习经验总结整理
人工智能·机器学习
Sim148020 分钟前
iPhone将内置本地大模型,手机端AI实现0 token成本时代来临?
人工智能·ios·智能手机·iphone
AI航向标21 分钟前
Openclaw一键本地部署接入豆包
人工智能·openclaw
就是这么拽呢25 分钟前
论文查重低但AIGC率高,如何补救?
论文阅读·人工智能·ai·aigc
supericeice26 分钟前
创邻科技 AI智算一体机:支持 DeepSeek 671B 与 Qwen3 单机部署,覆盖纯CPU到多GPU多机扩展
大数据·人工智能·科技
لا معنى له1 小时前
Var-JEPA:联合嵌入预测架构的变分形式 —— 连接预测式与生成式自监督学习 ----论文翻译
人工智能·笔记·学习·语言模型