AI核心知识66——大语言模型之Machine Learning (简洁且通俗易懂版)

机械学习 (英文 Machine Learning , ML )是大语言模型(LLM)的**"祖宗"** ,也是整个 AI 大厦的地基

为了更彻底搞懂它们的关系,我们必须先厘清一个**"俄罗斯套娃"** 般的层级关系:

AI (人工智能) → ML ( 机器学习 ) → DL ( 深度学习 ) → LLM (大语言模型)

简单来说:大语言模型是 机器学习 的一种特殊应用。


1.🆚 核心区别:传统编程 vs. 机器学习

要理解机器学习,最好的办法是看它和我们以前写代码(传统编程)有什么不同。

A. 传统编程 (Traditional Programming)
  • 模式人制定规则

  • 逻辑:程序员写好代码:"如果(If)图片里有两个尖耳朵,并且(And)有胡须,那么(Then)这是猫。"

  • 缺点:规则写不完。世界上有千奇百怪的猫,稍微侧个身、挡住耳朵,程序就傻了。

B. 机器学习 (Machine Learning)
  • 模式机器自己找规则

  • 逻辑:程序员不写规则。程序员把 100 万张猫的照片扔给机器,说:"你自己看,这些都是猫。"机器通过数学算法,自己总结出"猫的特征"(可能是像素的某种排列组合,人类都看不懂)。

  • 优点:泛化能力强。以后再来一张没见过的猫,它也能认出来。

一句话总结: 机器学习 就是"从数据中学习规律,而不是由人手写规则"。


2.🧠 LLM 中的机器学习:三个阶段

大语言模型(如 ChatGPT)的诞生,其实就是把机器学习的三种核心流派全部用了一遍:

第一阶段:无监督学习 (Unsupervised Learning) ------ 预训练 (Pre-training)
  • 定义 :给机器一堆书(数据),不告诉它答案,让它自己找规律。

  • LLM :把互联网上所有的文本喂给它。

  • 它学到了什么:通过做"完形填空"(预测下一个词),它学会了语法、单词的搭配、世界的常识。

  • 这是 机器学习 的"自学"阶段。

第二阶段:监督学习 (Supervised Learning) ------ 微调 (SFT)
  • 定义 :给机器一堆题,同时给它标准答案,让它照着学。

  • LLM :给它看"问题 + 完美回答"的数据对。

  • 它学到了什么:它学会了怎么像人一样好好说话,怎么回答问题,而不是在那自言自语。

  • 这是 机器学习 的"上课"阶段。

第三阶段:强化学习 (Reinforcement Learning) ------ RLHF / RLVR
  • 定义 :不给标准答案,只给奖励(糖)或惩罚(鞭子),让它自己试错。

  • LLM :它回答得好,点个赞(Reward);回答得不好,扣分。

  • 它学到了什么:它学会了什么样的回答最符合人类的偏好(有用、安全、正确)。

  • 这是 机器学习 的"实战演练"阶段。


3.📉 本质:寻找一个数学函数

如果你问数学家"机器学习是什么",他会告诉你:Function Approximation (函数逼近)

大语言模型本质上就是一个超级巨大的数学函数 f(x)

y = f(x)

  • 输入 (x):你的 Prompt(比如"今天天气怎么样?")。

  • 输出 (y):AI 的回答(比如"今天天气不错。")。

  • 机器学习 (f) :就是通过数万亿次的计算,调整模型里那几千亿个参数(权重),找到一个完美的函数 f,使得不管你输入什么 x,它都能吐出让你满意的 y。


4.🚀 为什么现在才火?

机器学习这个概念上世纪 50 年代就有了,为什么最近才爆发?

  1. 数据 (Data):互联网让我们有了海量的数据来"喂"机器。

  2. 算力 (Compute):GPU (英伟达显卡) 的出现,让我们算得动这么复杂的数学题。

  3. 算法 (Algorithm)Transformer 架构(属于深度学习)的出现,让机器处理语言的效率提升了亿万倍。


总结

机器学习 ( Machine Learning ) 是大语言模型的底层方法论

  • 它不是一种具体的软件,而是一种**"让计算机通过数据变聪明"的思想** 。

  • 没有机器学习,就没有今天的大模型,我们就还得像几十年前一样,苦哈哈地手动写代码教电脑"什么是猫"。

相关推荐
那个村的李富贵1 小时前
光影魔术师:CANN加速实时图像风格迁移,让每张照片秒变大师画作
人工智能·aigc·cann
墨风如雪3 小时前
16个AI两周手搓编译器:Claude Opus 4.6 正在改写代码规则
aigc
腾讯云开发者3 小时前
“痛点”到“通点”!一份让 AI 真正落地产生真金白银的实战指南
人工智能
CareyWYR3 小时前
每周AI论文速递(260202-260206)
人工智能
hopsky4 小时前
大模型生成PPT的技术原理
人工智能
禁默4 小时前
打通 AI 与信号处理的“任督二脉”:Ascend SIP Boost 加速库深度实战
人工智能·信号处理·cann
心疼你的一切5 小时前
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
种时光的人5 小时前
CANN仓库核心解读:catlass夯实AIGC大模型矩阵计算的算力基石
线性代数·矩阵·aigc
AI绘画哇哒哒5 小时前
【干货收藏】深度解析AI Agent框架:设计原理+主流选型+项目实操,一站式学习指南
人工智能·学习·ai·程序员·大模型·产品经理·转行
数据分析能量站5 小时前
Clawdbot(现名Moltbot)-现状分析
人工智能