【4】Transformers快速入门：自然语言模型 vs 统计语言模型

统计语言模型 = 自然语言模型的"数学基础"

（就像加减乘除是数学的基础，统计模型是AI学说话的基础工具）

核心技术 ：神经网络（模拟人脑的算法）
升级点 ：
- 词向量：给每个词发"智能身份证"（例：苹果 = $0.3, -2.1, 5.4$ ）
- 上下文理解 ：
  - Word2Vec 看周围词定含义（静态）
  - BERT/GPT 看整句话动态调含义（比如"苹果"在不同句子中向量不同）
超能力 ：
- 写文章、编代码、陪你聊天（ChatGPT）
- 理解"我上周买的苹果坏了"指手机还是水果（靠上下文推理）

复制代码

统计模型（数概率）  
↓  
Word2Vec（给词发身份证）  
↓  
BERT/GPT（动态身份证 + 整段话联想）

越新的模型越像真人 ：

从 死记硬背 → 学会举一反三！

任务：判断"银行"指金融机构还是河边

模型类型	处理方式	结果
统计语言模型	数"银行"和"存款"一起出现的概率	只能猜一个意思
自然语言模型	看整句："我去银行存钱" → 金融机构 "河边的银行很滑" → 河边	动态理解正确 ✅

💡 小白记忆法 ：

统计模型 = 算盘（只能加减）

自然语言模型 = 智能手机（能聊天打游戏）
现在你听到的ChatGPT，全是自然语言模型！ 🚀