深度剖析！GPT-image-1 API 开放对 AI 绘画技术生态的冲击！

4月24日凌晨，OpenAI正式发布了全新的图像生成模型"gpt-image-1"，并通过API向全球开发者开放使用，这意味着其GPT-4o的图像生成能力正式向开发者开放！

在这之前，GPT-4o的图像生成功能于今年3月25日由 OpenAI 创始人兼 CEO 萨姆・阿尔特曼直播发布，次日正式上线，在海内外都掀起了不小的关注和讨论。

这是 OpenAI 首次将图像生成功能直接集成到多模态模型GPT-4o中，通过统一训练框架，模型能同时理解文本、图像和上下文，用户仅需通过自然语言交互，就能实现从文本到图像的创作。精准指令遵循和上下文感知能力，令 OpenAI 的用户赞不绝口。

上线仅一天后，GPT-4o生成的吉卜力风格图片便在网络上掀起了病毒式传播。用户只需简单指令，就能将普通图片转换为吉卜力风格，不管是人物还是城市风景皆可。画面质感可媲美吉卜力工作室原画团队，连 CEO 萨姆・阿尔特曼也直接换上吉卜力风格头像为 GPT-4o 宣传。

而4月24日发布的 gpt-image-1 模型，基于 GPT-4o 的多模态能力，同样能生成吉卜力风格的图像，同时更胜 GPT-4o 的图像生成功能，正如 CEO 萨姆・阿尔特曼在其推特上提到的，API版本与ChatGPT版本的不同之处在于：gpt-image-1可以支持各种高级功能的定制，比如控制生成的图像质量与生成速度、背景、输出格式等。

在API定价方面，gpt-image-1具有明显优势。gpt-image-1 API 采用基于 token 的计费方式，文本输入、图像输入和图像输出的 token 分别计价，文本输入 token 每百万 5 美元，图像输入 token 每百万 10 美元，图像输出 token 每百万 40 美元。

以生成方形图像为例，低质量图像每张约 0.02 美元（约 0.15 元人民币），中等质量每张约 0.07 美元（约 0.50 元人民币），高质量图像每张约 0.19 美元（约 1.37 元人民币）。

此处插入一则通知，中小企业和个人开发者可以通过算力租用实现AI绘画、AI模型训练。比如，算力云平台就专为中小企业和高校实验室提供算力租用服务，目前有 RTX 4090/3090/2080Ti 等充足的显卡在香港、台湾多地域可租用。

无需高配电脑，玩转AI绘画！云端快速部署Stable Diffusion的步骤分享！

当前AI绘画市场主要由 MidJourney 和 Stable Diffusion 主导，MidJourney 以出色的艺术风格表现力和易用性，收获了大量个人创作者与小型团队的青睐；Stable Diffusion 凭借开源特性，让开发者能够对模型进行个性化调整，在专业领域与企业应用中广泛扎根。二者已在市场份额、用户群体及应用场景等方面形成了相对稳定的格局。

**然而，gpt-image-1入场极有可能给AI绘画赛道带来诸多变数。**从技术实力来看，GPT-image-1 基于强大的 GPT-4o 多模态架构，对复杂文本提示的理解与转化能力十分出众，能生成细节丰富、精准度高的图像，甚至在图像中文字的渲染上达到了新高度，解决了过往AI绘画文字易出错、排版混乱的难题，这对注重图文结合效果的广告设计、出版印刷等行业而言极具吸引力。功能特性上，它不仅支持多种风格图像生成，涵盖写实、动漫、复古等，还能灵活调整输出图像的质量、尺寸、格式等参数，这种高度定制化服务是 MidJourney 和 Stable Diffusion 所欠缺的。

商业合作层面，gpt-image-1 API也已展现出强劲势头，Adobe、Figma、Canva 等知名平台已经纷纷将其集成到自家产品中，借助这些平台庞大的用户基础，GPT-image-1 有望迅速渗透到各类设计工作流程中，改变用户对AI绘画工具的选择倾向。可以预见，随着 GPT-image-1 的不断优化与应用，AI 绘画市场或将重新洗牌，一场围绕技术、用户体验与市场份额的激烈竞争即将拉开帷幕。

以上是算力云今日内容分享，感兴趣的朋友多多关注。