AI核心知识66——大语言模型之Machine Learning (简洁且通俗易懂版)

机械学习 (英文 Machine Learning , ML )是大语言模型(LLM)的**"祖宗"** ,也是整个 AI 大厦的地基

为了更彻底搞懂它们的关系,我们必须先厘清一个**"俄罗斯套娃"** 般的层级关系:

AI (人工智能) → ML ( 机器学习 ) → DL ( 深度学习 ) → LLM (大语言模型)

简单来说:大语言模型是 机器学习 的一种特殊应用。


1.🆚 核心区别:传统编程 vs. 机器学习

要理解机器学习,最好的办法是看它和我们以前写代码(传统编程)有什么不同。

A. 传统编程 (Traditional Programming)
  • 模式人制定规则

  • 逻辑:程序员写好代码:"如果(If)图片里有两个尖耳朵,并且(And)有胡须,那么(Then)这是猫。"

  • 缺点:规则写不完。世界上有千奇百怪的猫,稍微侧个身、挡住耳朵,程序就傻了。

B. 机器学习 (Machine Learning)
  • 模式机器自己找规则

  • 逻辑:程序员不写规则。程序员把 100 万张猫的照片扔给机器,说:"你自己看,这些都是猫。"机器通过数学算法,自己总结出"猫的特征"(可能是像素的某种排列组合,人类都看不懂)。

  • 优点:泛化能力强。以后再来一张没见过的猫,它也能认出来。

一句话总结: 机器学习 就是"从数据中学习规律,而不是由人手写规则"。


2.🧠 LLM 中的机器学习:三个阶段

大语言模型(如 ChatGPT)的诞生,其实就是把机器学习的三种核心流派全部用了一遍:

第一阶段:无监督学习 (Unsupervised Learning) ------ 预训练 (Pre-training)
  • 定义 :给机器一堆书(数据),不告诉它答案,让它自己找规律。

  • LLM :把互联网上所有的文本喂给它。

  • 它学到了什么:通过做"完形填空"(预测下一个词),它学会了语法、单词的搭配、世界的常识。

  • 这是 机器学习 的"自学"阶段。

第二阶段:监督学习 (Supervised Learning) ------ 微调 (SFT)
  • 定义 :给机器一堆题,同时给它标准答案,让它照着学。

  • LLM :给它看"问题 + 完美回答"的数据对。

  • 它学到了什么:它学会了怎么像人一样好好说话,怎么回答问题,而不是在那自言自语。

  • 这是 机器学习 的"上课"阶段。

第三阶段:强化学习 (Reinforcement Learning) ------ RLHF / RLVR
  • 定义 :不给标准答案,只给奖励(糖)或惩罚(鞭子),让它自己试错。

  • LLM :它回答得好,点个赞(Reward);回答得不好,扣分。

  • 它学到了什么:它学会了什么样的回答最符合人类的偏好(有用、安全、正确)。

  • 这是 机器学习 的"实战演练"阶段。


3.📉 本质:寻找一个数学函数

如果你问数学家"机器学习是什么",他会告诉你:Function Approximation (函数逼近)

大语言模型本质上就是一个超级巨大的数学函数 f(x)

y = f(x)

  • 输入 (x):你的 Prompt(比如"今天天气怎么样?")。

  • 输出 (y):AI 的回答(比如"今天天气不错。")。

  • 机器学习 (f) :就是通过数万亿次的计算,调整模型里那几千亿个参数(权重),找到一个完美的函数 f,使得不管你输入什么 x,它都能吐出让你满意的 y。


4.🚀 为什么现在才火?

机器学习这个概念上世纪 50 年代就有了,为什么最近才爆发?

  1. 数据 (Data):互联网让我们有了海量的数据来"喂"机器。

  2. 算力 (Compute):GPU (英伟达显卡) 的出现,让我们算得动这么复杂的数学题。

  3. 算法 (Algorithm)Transformer 架构(属于深度学习)的出现,让机器处理语言的效率提升了亿万倍。


总结

机器学习 ( Machine Learning ) 是大语言模型的底层方法论

  • 它不是一种具体的软件,而是一种**"让计算机通过数据变聪明"的思想** 。

  • 没有机器学习,就没有今天的大模型,我们就还得像几十年前一样,苦哈哈地手动写代码教电脑"什么是猫"。

相关推荐
Macbethad2 小时前
智能硬件产品系统技术报告
大数据·人工智能
这张生成的图像能检测吗2 小时前
(论文速读)基于M-LLM的高效视频理解视频帧选择
人工智能·贪心算法·视频生成·多模态大语言模型
Shiyuan72 小时前
【IEEE冠名EI会议】2026年IEEE第三届深度学习与计算机视觉国际会议
人工智能·深度学习·计算机视觉
q_30238195562 小时前
YOLOv11训练NEU-DET钢材缺陷数据集并部署香橙派推理全流程
人工智能·python·深度学习·课程设计
编码小哥2 小时前
OpenCV图像金字塔与图像拼接技术
人工智能·opencv·计算机视觉
LeeZhao@2 小时前
【狂飙全模态】灵曦星灿视频助手-影视级音画同步视频生成
人工智能·语言模型·音视频·agi
java1234_小锋2 小时前
Transformer 大语言模型(LLM)基石 - Transformer PyTorch2内置实现
深度学习·语言模型·transformer
丝斯20112 小时前
AI学习笔记整理(35)——生成模型与视觉大模型
人工智能·笔记·学习
Akamai中国2 小时前
Akamai Cloud客户案例 | Avesha 在 Akamai 云上扩展 Kubernetes 解决方案
人工智能·云计算·云服务·云存储