Azure 新上架 | GPT-5.4 mini / GPT-5.4 nano 登陆 Microsoft Foundry（国际版）

在出海企业加速部署 AI 应用的浪潮中，模型的性价比与响应速度，正在成为技术选型的关键变量。

近日，OpenAI 最新轻量化模型 GPT-5.4 mini 与 GPT-5.4 nano 正式登陆 Microsoft Foundry（国际版），面向全球开发者与企业开放部署。这意味着，出海团队可以在熟悉的 Azure 平台上，低门槛、高效率地调用这两款模型，构建从智能客服到数据分析的全链路 AI 能力。

GPT-5.4 mini：高效推理，适合生产级工作负载

GPT-5.4 mini 是本次上新的主力型号，专为「低延迟、高吞吐」的生产场景设计。相比旗舰模型，它在保持强劲理解与生成能力的同时，推理成本大幅下降，非常适合以下场景：

**智能客服与对话系统：**需要快速响应海量用户咨询，对并发量与响应延迟要求严苛；
**内容审核与分类：**在大量文本中完成高质量的分类、标签与风险识别；
**内部知识库问答：**帮助员工快速检索文档、获取业务洞察。

对于出海企业而言，GPT-5.4 mini 的高性价比意味着：可以在不显著增加预算的前提下，将 AI 能力铺开至更多业务线，而非仅局限在单一高价值场景。

GPT-5.4 nano：极致轻量，适合边缘与实时场景

如果说 GPT-5.4 mini 是「效率派」，那么 GPT-5.4 nano 就是「轻量派」的代表作。它的参数规模更小，响应速度更快，适合对资源占用极度敏感的场景：

**实时翻译与语音转写：**对延迟有毫秒级要求，且需要快速处理大量短文本；
**端侧嵌入与设备端 AI：**在边缘设备或私有化部署环境中运行，受限于硬件算力；
**数据预处理与清洗：**在正式分析前，快速完成文本标准化、去重与结构化。

GPT-5.4 nano 的出现，让企业在「什么场景用什么模型」的精细化调度上，有了更灵活的选择。

一站式部署：Foundry 平台简化模型调用

Microsoft Foundry（国际版）为这两款模型提供了统一接入层，开发者可以通过以下方式快速集成：

**API 调用：**兼容 OpenAI 标准的 Chat Completions 与 Embeddings 接口，存量代码几乎零改动；
**模型目录：**在 Foundry 控制台可直接浏览、对比、选择适合的模型；
**负责任 AI 承诺：**与所有 Azure OpenAI 服务一样，GPT-5.4 mini 与 nano 享有同等的隐私保护与合规保障。