模型蒸馏(ChatGPT文档)

文章来源: https://chatgpt.cadn.net.cn/docs/guides_distillation

模型蒸馏

使用蒸馏技术改进较小的模型。

模型蒸馏允许您利用大型模型的输出来微调较小的模型,使其能够在特定任务上实现类似的性能。此过程可以显著降低成本和延迟,因为较小的模型通常效率更高。

以下是它的工作原理:

  1. 使用聊天补全 API 中的 store 参数存储大型模型的高质量输出以存储它们。
  2. 使用大型和小型模型评估存储的完成项,以建立基线。
  3. 选择要用于蒸馏的 stored completions,并使用它们来微调较小的模型。
  4. 评估微调模型的性能,以查看它与大型模型的比较情况。

让我们通过这些步骤来了解它是如何完成的。

存储大型模型的高质量输出

蒸馏过程的第一步是使用像 OR 符合您的标准的大型模型产生良好的结果。生成这些结果时,您可以使用 Chat Completions API 中的选项存储它们。我们还建议您使用 metadata 属性来标记这些完成,以便以后轻松筛选。o1-preview``gpt-4o``store: true

然后,可以在 dashboard 中查看和筛选这些存储的完成。
存储大型模型的高质量输出
JavaScript (英语)

复制代码
import OpenAI from "openai";
const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-4o",
  messages: [
    { role: "system", content: "You are a corporate IT support expert." },
    { role: "user", content: "How can I hide the dock on my Mac?"},
  ],
  store: true,
  metadata: {
    role: "manager",
    department: "accounting",
    source: "homepage"
  }
});

console.log(response.choices[0]);

使用该选项时,完成将存储 30 天。您的完成项可能包含敏感信息,因此,您可能需要考虑创建一个具有有限访问权限的新项目来存储这些完成项。store: true

评估以建立基线

您可以使用存储的完成来评估较大模型和较小模型在任务中的性能,以建立基线。这可以使用 evals 产品来完成。

通常,大型模型在评估中的表现会优于小型模型。建立此基线可以让您衡量通过蒸馏/微调过程获得的改进。

创建训练数据集以微调较小的模型

接下来,您可以选择存储的补全子集作为训练数据,以微调较小的模型,例如 .将存储的补全过滤到你想用来训练小模型的补全,然后点击 "Distill" 按钮。几百个样本可能就足够了,但有时数千个样本的更多样化范围可以产生更好的结果。gpt-4o-mini

此操作将打开一个对话框以开始微调作业,并将您选择的完成项作为训练数据集。根据需要配置参数,选择要微调的基本模型。在此示例中,我们将选择 GPT-4o-mini 的最新快照

配置完成后,点击 "Run" 开始微调作业。该过程可能需要 15 分钟或更长时间,具体取决于训练数据集的大小。

评估微调的小模型

微调工作完成后,您可以对其运行 evals 以查看它与基本小型和大型模型的叠加情况。您可以在 Evals 产品中选择微调模型,以使用微调的小模型生成新的完成。

或者,您还可以存储微调模型生成的新聊天补全,并使用它们来评估性能。通过不断调整和改进:

  • 训练数据的多样性
  • 大型模型的提示和输出
  • 评估分级机的准确性

对于特定的任务子集,您可以将较小模型的性能提升到与大型模型相同的级别。

文章来源:模型蒸馏 -- ChatGPT中文版|ChatGPT开发文档|ChatGPT教程|ChatGPT官方文档

相关推荐
eBest数字化转型方案7 分钟前
2025年快消品行业渠道数字化营销系统全景透视与选型策略
人工智能
kkcodeer23 分钟前
大模型Prompt原理、编写原则与技巧以及衡量方法
人工智能·prompt·ai大模型
DevSecOps选型指南33 分钟前
SBOM风险预警 | NPM前端框架 javaxscript 遭受投毒窃取浏览器cookie
前端·人工智能·前端框架·npm·软件供应链安全厂商·软件供应链安全工具
rocksun36 分钟前
MCP利用流式HTTP实现实时AI工具交互
人工智能·mcp
xiaok1 小时前
docker network create langbot-network这条命令在dify输入还是在langbot中输入
人工智能
It_张1 小时前
LLM(大语言模型)的工作原理 图文讲解
人工智能·语言模型·自然语言处理
Darach1 小时前
坐姿检测Python实现
人工智能·python
xiaok1 小时前
LangBot 和消息平台均运行在 Docker 容器中
人工智能
queeny1 小时前
Datawhale AI夏令营 科大讯飞AI大赛(大模型技术) Task3 心得
人工智能