模型蒸馏(ChatGPT文档)

文章来源: https://chatgpt.cadn.net.cn/docs/guides_distillation

模型蒸馏

使用蒸馏技术改进较小的模型。

模型蒸馏允许您利用大型模型的输出来微调较小的模型,使其能够在特定任务上实现类似的性能。此过程可以显著降低成本和延迟,因为较小的模型通常效率更高。

以下是它的工作原理:

  1. 使用聊天补全 API 中的 store 参数存储大型模型的高质量输出以存储它们。
  2. 使用大型和小型模型评估存储的完成项,以建立基线。
  3. 选择要用于蒸馏的 stored completions,并使用它们来微调较小的模型。
  4. 评估微调模型的性能,以查看它与大型模型的比较情况。

让我们通过这些步骤来了解它是如何完成的。

存储大型模型的高质量输出

蒸馏过程的第一步是使用像 OR 符合您的标准的大型模型产生良好的结果。生成这些结果时,您可以使用 Chat Completions API 中的选项存储它们。我们还建议您使用 metadata 属性来标记这些完成,以便以后轻松筛选。o1-preview``gpt-4o``store: true

然后,可以在 dashboard 中查看和筛选这些存储的完成。
存储大型模型的高质量输出
JavaScript (英语)

复制代码
import OpenAI from "openai";
const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-4o",
  messages: [
    { role: "system", content: "You are a corporate IT support expert." },
    { role: "user", content: "How can I hide the dock on my Mac?"},
  ],
  store: true,
  metadata: {
    role: "manager",
    department: "accounting",
    source: "homepage"
  }
});

console.log(response.choices[0]);

使用该选项时,完成将存储 30 天。您的完成项可能包含敏感信息,因此,您可能需要考虑创建一个具有有限访问权限的新项目来存储这些完成项。store: true

评估以建立基线

您可以使用存储的完成来评估较大模型和较小模型在任务中的性能,以建立基线。这可以使用 evals 产品来完成。

通常,大型模型在评估中的表现会优于小型模型。建立此基线可以让您衡量通过蒸馏/微调过程获得的改进。

创建训练数据集以微调较小的模型

接下来,您可以选择存储的补全子集作为训练数据,以微调较小的模型,例如 .将存储的补全过滤到你想用来训练小模型的补全,然后点击 "Distill" 按钮。几百个样本可能就足够了,但有时数千个样本的更多样化范围可以产生更好的结果。gpt-4o-mini

此操作将打开一个对话框以开始微调作业,并将您选择的完成项作为训练数据集。根据需要配置参数,选择要微调的基本模型。在此示例中,我们将选择 GPT-4o-mini 的最新快照

配置完成后,点击 "Run" 开始微调作业。该过程可能需要 15 分钟或更长时间,具体取决于训练数据集的大小。

评估微调的小模型

微调工作完成后,您可以对其运行 evals 以查看它与基本小型和大型模型的叠加情况。您可以在 Evals 产品中选择微调模型,以使用微调的小模型生成新的完成。

或者,您还可以存储微调模型生成的新聊天补全,并使用它们来评估性能。通过不断调整和改进:

  • 训练数据的多样性
  • 大型模型的提示和输出
  • 评估分级机的准确性

对于特定的任务子集,您可以将较小模型的性能提升到与大型模型相同的级别。

文章来源:模型蒸馏 -- ChatGPT中文版|ChatGPT开发文档|ChatGPT教程|ChatGPT官方文档

相关推荐
小咖自动剪辑3 分钟前
Base64与图片互转工具增强版:一键编码/解码,支持多格式
人工智能·pdf·word·媒体
独自归家的兔5 分钟前
从 “局部凑活“ 到 “全局最优“:AI 规划能力的技术突破与产业落地实践
大数据·人工智能
一个处女座的程序猿6 分钟前
AI:解读Sam Altman与多位 AI 构建者对话—构建可落地的 AI—剖析 OpenAI Town Hall 与给创业者、产品/工程/安全团队的实用指南
人工智能
依依yyy6 分钟前
沪深300指数收益率波动性分析与预测——基于ARMA-GARCH模型
人工智能·算法·机器学习
海域云-罗鹏16 分钟前
国内公司与英国总部数据中心/ERP系统互连,SD-WAN专线实操指南
大数据·数据库·人工智能
冬奇Lab18 分钟前
深入理解 Claude Code:架构、上下文与工具系统
人工智能·ai编程
Up九五小庞26 分钟前
本地部署 + Docker 容器化实战:中医舌诊 AI 项目 TongueDiagnosis 部署全记录-九五小庞
人工智能
John_ToDebug1 小时前
2025年度个人总结:在技术深海中锚定价值,于时代浪潮中重塑自我
人工智能·程序人生
自可乐1 小时前
n8n全面学习教程:从入门到精通的自动化工作流引擎实践指南
运维·人工智能·学习·自动化
king of code porter1 小时前
百宝箱企业版搭建智能体应用-创建应用
人工智能·大模型·智能体