【机器学习】Teacher-Student框架

Teacher-Student Setup是一个经典的机器学习框架,包含两个核心角色:

    • 教师模型 (Teacher Model)

      • 通常是一个更大、更强、已经训练好(或正在训练)的模型。
      • 它对问题有很好的理解,性能优秀。
      • 它的作用是为学生提供"指导"。
    • 学生模型 (Student Model)

      • 通常是一个更小、更轻量级的模型。
      • 它的目标是学习教师的能力,最终在性能上接近甚至超越教师(在特定任务上)。
      • 学生不仅从真实标签 (hard labels) 中学习,还会从教师的输出 (soft labels) 中学习。
  1. 教师如何"教"学生?------ 知识蒸馏 (Knowledge Distillation)

    这是最核心的机制:

    • Hard Labels (硬标签) :原始数据中的正确答案,比如图片是"猫",标签就是 [0, 1, 0]
    • Soft Labels (软标签) :教师模型输出的概率分布。例如,对于一张猫的图片,教师可能输出 [0.05 (狗), 0.9 (猫), 0.05 (虎)]。这个分布包含了教师的"思考过程"------它知道这张图非常像猫 ,但也有一点点像狗和虎
    • 学习过程 :学生模型的损失函数(Loss Function)通常由两部分组成:
      1. 一部分是与真实标签计算的损失(如交叉熵)。
      2. 另一部分是与教师的软标签计算的损失,目标是让学生的输出分布与教师的输出分布尽可能相似。
相关推荐
33三 三like2 小时前
《基于知识图谱和智能推荐的养老志愿服务系统》开发日志
人工智能·知识图谱
芝士爱知识a2 小时前
【工具推荐】2026公考App横向评测:粉笔、华图与智蛙面试App功能对比
人工智能·软件推荐·ai教育·结构化面试·公考app·智蛙面试app·公考上岸
腾讯云开发者3 小时前
港科大熊辉|AI时代的职场新坐标——为什么你应该去“数据稀疏“的地方?
人工智能
工程师老罗3 小时前
YoloV1数据集格式转换,VOC XML→YOLOv1张量
xml·人工智能·yolo
颜酱3 小时前
图结构完全解析:从基础概念到遍历实现
javascript·后端·算法
m0_736919103 小时前
C++代码风格检查工具
开发语言·c++·算法
yugi9878383 小时前
基于MATLAB强化学习的单智能体与多智能体路径规划算法
算法·matlab
Coder_Boy_4 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
啊森要自信4 小时前
CANN ops-cv:面向计算机视觉的 AI 硬件端高效算子库核心架构与开发逻辑
人工智能·计算机视觉·架构·cann