OpenAI GPT Image 2 教程:API Key 获取、参数说明与 Python/Node.js 示例

做 AI 图片能力接入时,很多人第一反应还是"找一个能出图的模型"。但真正落到产品和工程里,你很快会发现,问题并不只是"能不能出图",而是:

  • 能不能稳定生成高质量图片
  • 能不能上传原图继续编辑
  • 能不能做多轮修改
  • 能不能控制尺寸、质量、压缩和格式
  • 能不能安全地把能力接进自己的项目

而在 OpenAI 当前官方 API 体系里,gpt-image-2 已经是图像生成方向的重要模型之一。官方模型页明确写到,它是一个 state-of-the-art image generation model,支持快速、高质量的图片生成与编辑,支持灵活尺寸和高保真图片输入。

一、GPT Image 2 是什么

从官方文档看,gpt-image-2 的定位非常清晰:它不是一个"只能一句话画图"的简易模型,而是一个面向 生成 + 编辑 的图像能力模型。官方给出的输入输出说明显示,它支持 文本和图片输入,图片输出 ;同时支持 v1/responsesv1/images/generationsv1/images/edits 等端点。

这意味着它适合的不只是简单生图,还包括:

  • 文本生成图片
  • 上传已有图片后继续编辑
  • 基于遮罩做局部重绘
  • 在对话式流程里完成多轮图像修改

官方当前也给出了 gpt-image-2-2026-04-21 快照,说明它已经是可明确锁定版本的正式模型,而不是实验名义下的模糊能力。


二、GPT Image 2 强在哪里

1. 不只是生成,还强调编辑能力

官方模型说明里明确写了:gpt-image-2 用于 fast, high-quality image generation and editing。这点很关键。很多开发者在接图像模型时,前期只关注"生成",但一旦做成产品,用户更常见的真实需求反而是"改图"。

比如这些场景就很典型:

  • 商品图换背景
  • 海报文案位置重新布局
  • 角色图风格统一
  • 局部替换物体
  • 先出草图,再多轮精修

2. Images API 和 Responses API 都能接

OpenAI 的图片生成指南写得很直白:

  • 如果你只是"根据一个 prompt 生成或编辑单张图片",优先用 Image API
  • 如果你想做"对话式、可编辑、多轮交互"的图像体验,优先用 Responses API

这其实就把两类开发路线分清楚了:

适合 Image API 的情况
  • 批量生成商品图
  • 固定模板海报生成
  • 单次编辑任务
  • 简单工具型接口服务
适合 Responses API 的情况
  • AI 设计助手
  • 聊天式出图产品
  • 上传图后反复修改
  • 图文混合的多轮工作流

三、输出参数有哪些,怎么调更合理

OpenAI 图片生成指南中列出了主要输出配置项,包括:

  • size:图片尺寸,比如 1024x10241024x1536
  • quality:渲染质量,比如 lowmediumhigh
  • format:输出格式
  • compression:JPEG / WebP 压缩等级
  • background:背景设置
    并且 sizequalitybackground 支持 auto

实战中可以这么理解:

预览图策略

如果你的产品需要更快返回结果,建议优先用:

  • quality=low
  • quality=medium

成片导出策略

如果是用户最终下载或交付的图片,建议再用:

  • quality=high

常见尺寸建议

  • 方图封面:1024x1024
  • 电商竖图:1024x1536
  • 横版内容头图:可以按业务场景选择更宽比例

这样做的好处是:把速度和成本控制住,同时让最终交付画质不打折。相关参数能力已在官方图片生成指南中明确列出。


四、OpenAI API Key 怎么获取

很多人会把"ChatGPT 订阅"和"OpenAI API 能力"混在一起,但这两者不是一回事。

如果你要做开发调用,必须去 OpenAI Developer Platform 获取 API Key。OpenAI 帮助中心明确说明:你的 Secret API key 可以在 API key page 找到。

标准流程如下:

第一步:登录 OpenAI Developer Platform

进入开发平台后,打开 API Key 页面。

第二步:创建 Secret API Key

在页面中创建新的密钥,用于服务端调用。

第三步:配置计费

如果你要正式调用 API,还需要确保你的开发者平台账户有可用的 API 计费设置。官方 Pricing 页面已经列出 gpt-image-2 的标准价格与 Batch 价格。

第四步:国内开发者快速获取:UIUIAPI (国内/亚太最佳选择)

对于国内开发者及亚太地区开发者,UIUIAPI 是目前最便捷、高性价比的 gpt-image-2 API 接入方案。支持 OpenAI( gpt-image-2 )Claude(含 Opus 4.7)GeminiDeepSeek 等 300+ 主流模型。

UIUIAPI 获取 API Key 步骤:

访问 uiuiapi 注册登录。

进入令牌管理 → 添加新令牌(设置额度)。

复制生成的 sk- 开头 API Key。

在代码中设置 base_url 为 https://sg.uiuiapi.com(或官方提供的节点)。


五、接入前一定要知道的 3 个安全点

这部分非常重要,尤其是做网页应用和小工具时,最容易踩坑。

1. 不要把 API Key 放在前端

OpenAI 官方明确写到:Never deploy your key in client-side environments like browsers or mobile apps. 因为一旦暴露,别人就可以拿你的 key 发请求,带来额外扣费或账户风险。

2. 不要提交到代码仓库

官方同样明确提醒:不要把密钥提交到仓库里。无论是公开仓库还是私有仓库,都存在泄露风险。

3. 用环境变量管理

OpenAI 推荐统一使用 OPENAI_API_KEY 作为环境变量名。在 Windows 下也给出了 setx OPENAI_API_KEY "<yourkey>" 的方式。

一句话总结就是:

前端只调用你的后端,后端再调用 OpenAI API。


六、GPT Image 2 的价格怎么理解

OpenAI Pricing 页面已经列出了 gpt-image-2 的价格:

Standard

  • Image input:$8.00 / 1M tokens
  • Cached input:$2.00 / 1M tokens
  • Output:$30.00 / 1M tokens
  • Text input:$5.00 / 1M tokens

Batch

  • Image input:$4.00 / 1M tokens
  • Cached input:$1.00 / 1M tokens
  • Output:$15.00 / 1M tokens
  • Text input:$2.50 / 1M tokens

这里最关键的不是死记数字,而是理解两点:

第一,图片生成已经不是简单的"按张收费"思维。

第二,分辨率、是否多轮编辑、是否高质量导出,都会影响整体成本。官方也建议结合图片生成 guide 中的 calculator 来估算。


七、是否需要额外验证

这一点很多人会忽略。OpenAI 图片生成指南中明确提到:在使用 GPT Image 模型(包括 gpt-image-2)前,你可能需要完成 API Organization Verification

所以如果你出现:

  • key 没问题
  • 代码没报错
  • 但图片能力仍无法正常使用

那就要回头检查开发者控制台里的组织验证状态。

八、开发调用示例

1. Python:生成图片

python 复制代码
import base64
from openai import OpenAI

client = OpenAI()  # 默认读取环境变量 OPENAI_API_KEY

result = client.images.generate(
    model="gpt-image-2",
    prompt="一张极简科技风的方形产品海报,深色背景,中央发光芯片,留有标题排版空间",
    size="1024x1024",
    quality="high"
)

image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

with open("poster.png", "wb") as f:
    f.write(image_bytes)

print("图片已保存为 poster.png")

这类写法对应的是官方支持的 v1/images/generations 路线,而 gpt-image-2 确实支持该端点。

2. Python:编辑图片

python 复制代码
import base64
from openai import OpenAI

client = OpenAI()

result = client.images.edit(
    model="gpt-image-2",
    image=open("input.png", "rb"),
    prompt="保持主体不变,把背景改成高级灰摄影棚风格,并增加产品边缘高光"
)

image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

with open("edited.png", "wb") as f:
    f.write(image_bytes)

官方图片生成指南中已经展示了 images.editgpt-image-2 的配合方式。

3. Node.js:Responses API 多轮图像体验

javascript 复制代码
import OpenAI from "openai";

const openai = new OpenAI({
  apiKey: process.env.OPENAI_API_KEY,
});

const response = await openai.responses.create({
  model: "gpt-5.4",
  input: "生成一张蓝白科技风运营海报,包含数据面板、AI 中心视觉和标题留白",
  tools: [{ type: "image_generation" }],
});

console.log(response);

官方图片生成指南给出的建议也很明确:如果你要做可编辑、对话式的图像体验,就优先走 Responses API。


九、GPT Image 2 适合哪些人

如果你是下面这些角色,GPT Image 2 会比较有价值:

  • 做 AI 绘图产品的开发者
  • 做图片编辑器、海报工具、商品图工具的团队
  • 做运营、设计自动化工具的人
  • 想在应用里接入"聊天 + 出图 + 改图"闭环的产品经理和工程师

因为从官方给出的接口能力来看,gpt-image-2 已经覆盖了"生成、编辑、参数控制、多端点接入"这一整套能力链路。


十、界智通(jieAGi)结语

如果只用一句话概括 GPT Image 2,我会这样说:

它不是一个只会画图的模型,而是一套更适合真实产品接入的图像生成与编辑能力。

它的价值不只在"生成效果",更在于:

  • 支持文本生成图片
  • 支持图片编辑与高保真输入
  • 支持 Image API 与 Responses API 两种接入路线
  • 支持尺寸、质量、格式、压缩等工程化控制
  • 支持版本快照与更明确的生产接入方式

对于开发者来说,真正正确的接入路径是:

先拿到 API Key,再做好后端安全封装,再根据业务形态选择 Image API 或 Responses API,最后再做成本与质量平衡。

相关推荐
knight_9___2 小时前
RAG面试篇9
java·人工智能·python·算法·agent·rag
m0_674294642 小时前
HTML怎么限制输入字符数_HTML input maxlength属性用法【详解】
jvm·数据库·python
石榴树下的七彩鱼2 小时前
智能抠图API怎么选?AI抠图多语言接入实战(Python/Java/PHP/JS完整教程)
java·python·智能抠图·ai抠图·api接入·图片去背景·电商工具
maqr_1102 小时前
layui table单元格编辑 layui表格如何实现可编辑
jvm·数据库·python
小炫y2 小时前
bilibil
python
z4424753262 小时前
HTML函数开发用旋转屏有优势吗_特殊硬件形态适配说明【方法】
jvm·数据库·python
Ares-Wang2 小时前
Flask》》flask-login
后端·python·flask
wangjialelele2 小时前
从零入门 LangChain:Python 语法详解 + 工具开发 + 结构化输出实战
开发语言·人工智能·python·语言模型·langchain
配奇2 小时前
神经网络基础
人工智能·python·深度学习·神经网络