AI核心知识66——大语言模型之Machine Learning (简洁且通俗易懂版)

机械学习 (英文 Machine Learning , ML )是大语言模型(LLM)的**"祖宗"** ,也是整个 AI 大厦的地基

为了更彻底搞懂它们的关系,我们必须先厘清一个**"俄罗斯套娃"** 般的层级关系:

AI (人工智能) → ML ( 机器学习 ) → DL ( 深度学习 ) → LLM (大语言模型)

简单来说:大语言模型是 机器学习 的一种特殊应用。


1.🆚 核心区别:传统编程 vs. 机器学习

要理解机器学习,最好的办法是看它和我们以前写代码(传统编程)有什么不同。

A. 传统编程 (Traditional Programming)
  • 模式人制定规则

  • 逻辑:程序员写好代码:"如果(If)图片里有两个尖耳朵,并且(And)有胡须,那么(Then)这是猫。"

  • 缺点:规则写不完。世界上有千奇百怪的猫,稍微侧个身、挡住耳朵,程序就傻了。

B. 机器学习 (Machine Learning)
  • 模式机器自己找规则

  • 逻辑:程序员不写规则。程序员把 100 万张猫的照片扔给机器,说:"你自己看,这些都是猫。"机器通过数学算法,自己总结出"猫的特征"(可能是像素的某种排列组合,人类都看不懂)。

  • 优点:泛化能力强。以后再来一张没见过的猫,它也能认出来。

一句话总结: 机器学习 就是"从数据中学习规律,而不是由人手写规则"。


2.🧠 LLM 中的机器学习:三个阶段

大语言模型(如 ChatGPT)的诞生,其实就是把机器学习的三种核心流派全部用了一遍:

第一阶段:无监督学习 (Unsupervised Learning) ------ 预训练 (Pre-training)
  • 定义 :给机器一堆书(数据),不告诉它答案,让它自己找规律。

  • LLM :把互联网上所有的文本喂给它。

  • 它学到了什么:通过做"完形填空"(预测下一个词),它学会了语法、单词的搭配、世界的常识。

  • 这是 机器学习 的"自学"阶段。

第二阶段:监督学习 (Supervised Learning) ------ 微调 (SFT)
  • 定义 :给机器一堆题,同时给它标准答案,让它照着学。

  • LLM :给它看"问题 + 完美回答"的数据对。

  • 它学到了什么:它学会了怎么像人一样好好说话,怎么回答问题,而不是在那自言自语。

  • 这是 机器学习 的"上课"阶段。

第三阶段:强化学习 (Reinforcement Learning) ------ RLHF / RLVR
  • 定义 :不给标准答案,只给奖励(糖)或惩罚(鞭子),让它自己试错。

  • LLM :它回答得好,点个赞(Reward);回答得不好,扣分。

  • 它学到了什么:它学会了什么样的回答最符合人类的偏好(有用、安全、正确)。

  • 这是 机器学习 的"实战演练"阶段。


3.📉 本质:寻找一个数学函数

如果你问数学家"机器学习是什么",他会告诉你:Function Approximation (函数逼近)

大语言模型本质上就是一个超级巨大的数学函数 f(x)

y = f(x)

  • 输入 (x):你的 Prompt(比如"今天天气怎么样?")。

  • 输出 (y):AI 的回答(比如"今天天气不错。")。

  • 机器学习 (f) :就是通过数万亿次的计算,调整模型里那几千亿个参数(权重),找到一个完美的函数 f,使得不管你输入什么 x,它都能吐出让你满意的 y。


4.🚀 为什么现在才火?

机器学习这个概念上世纪 50 年代就有了,为什么最近才爆发?

  1. 数据 (Data):互联网让我们有了海量的数据来"喂"机器。

  2. 算力 (Compute):GPU (英伟达显卡) 的出现,让我们算得动这么复杂的数学题。

  3. 算法 (Algorithm)Transformer 架构(属于深度学习)的出现,让机器处理语言的效率提升了亿万倍。


总结

机器学习 ( Machine Learning ) 是大语言模型的底层方法论

  • 它不是一种具体的软件,而是一种**"让计算机通过数据变聪明"的思想** 。

  • 没有机器学习,就没有今天的大模型,我们就还得像几十年前一样,苦哈哈地手动写代码教电脑"什么是猫"。

相关推荐
研究点啥好呢3 小时前
3月19日GitHub热门项目推荐|OpenClaw棋逢对手
人工智能·ai·开源·github
Dfreedom.3 小时前
机器学习经典算法全景解析与演进脉络(无监督学习篇)
人工智能·学习·算法·机器学习·无监督学习
大傻^3 小时前
Spring AI Alibaba 文档智能处理:PDF、Markdown知识入库全链路
java·人工智能·spring·pdf·知识图谱·springai·springaialibaba
ar01233 小时前
AR远程专家指导:赋能工业、精密制造业
人工智能·ar
大傻^3 小时前
Spring AI Alibaba Deep Research:自动化深度调研与报告生成
人工智能·spring·自动化
红茶川3 小时前
[论文阅读] π0: A Vision-Language-Action Flow Model for General Robot Control
论文阅读·ai·具身智能·vla
Matrix_113 小时前
论文阅读:UltraFusion Ultra High Dynamic Imaging using Exposure Fusion
论文阅读·人工智能·计算摄影
kaoshi100app3 小时前
本周,河南二建报名公布!
开发语言·人工智能·职场和发展·学习方法
ComPDFKit3 小时前
OpenClaw安全风险与规避方法 — 安全“养虾”全套办法
安全·ai
我材不敲代码3 小时前
基于 OpenCV 的票据图像矫正与透视变换实战
人工智能·opencv·计算机视觉