【机器学习】Teacher-Student框架

Teacher-Student Setup是一个经典的机器学习框架,包含两个核心角色:

    • 教师模型 (Teacher Model)

      • 通常是一个更大、更强、已经训练好(或正在训练)的模型。
      • 它对问题有很好的理解,性能优秀。
      • 它的作用是为学生提供"指导"。
    • 学生模型 (Student Model)

      • 通常是一个更小、更轻量级的模型。
      • 它的目标是学习教师的能力,最终在性能上接近甚至超越教师(在特定任务上)。
      • 学生不仅从真实标签 (hard labels) 中学习,还会从教师的输出 (soft labels) 中学习。
  1. 教师如何"教"学生?------ 知识蒸馏 (Knowledge Distillation)

    这是最核心的机制:

    • Hard Labels (硬标签) :原始数据中的正确答案,比如图片是"猫",标签就是 [0, 1, 0]
    • Soft Labels (软标签) :教师模型输出的概率分布。例如,对于一张猫的图片,教师可能输出 [0.05 (狗), 0.9 (猫), 0.05 (虎)]。这个分布包含了教师的"思考过程"------它知道这张图非常像猫 ,但也有一点点像狗和虎
    • 学习过程 :学生模型的损失函数(Loss Function)通常由两部分组成:
      1. 一部分是与真实标签计算的损失(如交叉熵)。
      2. 另一部分是与教师的软标签计算的损失,目标是让学生的输出分布与教师的输出分布尽可能相似。
相关推荐
阿杰学AI12 小时前
AI核心知识76——大语言模型之RAG 2.0(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·rag·检索增强生成·rag2.0
u01092727112 小时前
实时数据流处理
开发语言·c++·算法
shangjian00712 小时前
AI-大语言模型LLM-Transformer架构7-模型参数量计算
人工智能·语言模型·transformer
独自破碎E12 小时前
【滑动窗口+计数】LCR015找到字符串中所有字母异位词
数据结构·算法
说私域12 小时前
开源链动2+1模式商城小程序在深度分销数字化转型中的应用研究
人工智能·小程序·开源·流量运营·私域运营
weixin_5091383412 小时前
专业书评 | 《智能体认知动力学导论》:当思维有了形状
人工智能·智能体·认知动力学
nvd1112 小时前
LangChain 核心对比:ChatPromptTemplate vs PromptTemplate
人工智能·langchain
Trouvaille ~12 小时前
【Linux】线程同步与互斥(一):线程互斥原理与mutex详解
linux·运维·服务器·c++·算法·线程·互斥锁
万岳软件开发小城12 小时前
在线问诊系统源码实战:视频/图文问诊平台搭建步骤全解析
人工智能·开源·源码·在线问诊系统源码·问诊app开发·问诊软件开发·视频问诊小程序
DN202012 小时前
AI销售机器人的隐私痛点与破解之道
人工智能·python·机器学习·机器人·节日