Image2 生成 PPT 的最后分水岭:Prompt is all you need
最反直觉的一点是:最后几乎没打开 PowerPoint 去救版式。
不是先让 AI 写大纲,再把内容塞进模板;也不是让它吐一堆 HTML、SVG、PPTX 对象,最后人类继续拆文本框、挪图层、修页脚。
真正好用的那条路更狠一点。
把整页直接当成一张成品图来做。
Codex 负责读论文、读材料、拆页面、写提示词。Image2 负责把每一页变成 16:9 的 4K 成品图。满意的留下,不满意的继续让 Codex 调 Image2 edit 改。最后把这些图组装成 PPTX 或 PDF。
中间不再执着于"这一段文字能不能双击编辑"。
因为这一轮 AI PPT 的最后分水岭,已经不在"文本框还能不能拖动"上。
它在另一层:你有没有一套能复现、能批量、能继续修改的 prompt。
Prompt is all you need.

别再把 Image2 生成物拆回传统 PPT
我看到不少人讨论 Codex 做 PPT,流程大概是:先生成页面,再想办法把它转回可编辑 PPT。
这条路我非常不赞同。
"可编辑"当然重要。
问题是,很多人把可编辑性放错了地方。你把一张 Image2 做好的页面拆成形状、文本框、SVG、PPTX 对象,看起来重新获得了控制权,实际上把质量拖回了旧世界。
版式变弱了。
字体变散了。
图和字之间那种一次成型的设计感也没了。
最后你得到的是一具"可编辑的尸体 ":每个器官都能动,但整体气质已经没了。
真正应该可编辑的,不是页面里的每一个文本框 。
是生成这页的 prompt。
如果标题想换,改 prompt。内容想压缩,改 prompt。底板想更克制,改 prompt。某页不满意,让 Codex 根据验收意见重写本页变化部分,再交给 Image2 edit。
这才是新的编辑层。
第一步,先做一张能压住全场的底板
底板就是你的 PPT 母版。
它不负责讲内容,只负责管气质:顶部装饰、底部装饰、配色、边缘结构、中央留白。
重点只有一个:中间必须空 。
很多 AI PPT 难看,问题不在模型不会画。
问题在它一上来就想把每一寸都填满。标题、图标、圆角卡片、抽象背景、渐变光效,全往里面塞。单页看着热闹,十页放在一起就像十个不同外包做的。
我的做法是先把自由度收掉。
先让 Image2 只生成底板,不写正文,不放要点,不生成假图表。上下边缘可以有设计,中央留白必须干净。
你可以直接用这段提示词起步:
生成一张 16:9、4K、可用于科技/学术汇报 PPT 的空白底板。
风格:深蓝 + 冰蓝 + 少量橙色强调,干净、克制、科技感,不要卡通。
顶部:左侧有深蓝斜切装饰区,内含非常简洁的线性图标;右侧有细横线和小号数字方块位置。
底部:只有一条窄版装饰条,带轻微几何纹理和细线结构。
中央:必须保留大面积纯白内容区,不要任何文字、图表、卡片、图标或占位符。
禁止:不要标题、不要页码、不要日期、不要 Logo、不要虚假数据、不要大面积背景纹理。
输出:一张可作为统一母版的 PPT 背景图。
底板这一步别怕多跑几张。你挑的是一套 PPT 的语气,不是单张"漂亮背景"。

第二步,把每一页 prompt 拆成五块
一页 PPT 最怕什么?
怕模型临场发挥。
你只说"做得高级一点",它就会开始自作主张:底部条变厚,顶部装饰换位置,页码多出来,Logo 冒出来,内容区被背景纹理占掉。
所以单页 prompt 不能写成一句愿望。
它要像一张施工单。
第一块,锁死底板。
【统一底板约束,每页必须严格遵守】
使用用户提供的 16:9 4K 底板作为唯一母版。
上下区域保持完全不变:
-
顶部:左侧深蓝斜切区域、线性图标、白色过渡区、右侧数字方块、细横线全部保留。
-
底部:窄版装饰条、几何纹理、细线结构全部保留。
-
底部条必须保持窄版高度,禁止变厚、上移或占用中央内容区。
-
禁止重画、移动、放大、缩小、替换这些底板元素。
唯一允许变化的底板元素:顶部数字方块的数字。
不要添加页码、日期、Logo、额外页脚文字。
中央白色内容区是唯一可编辑区域。
Image2 只负责排版,不得自行改写内容为泛泛短句。
这段最重要。
底板描述要具体到"左侧深蓝斜切区""右侧数字方块""底部窄版装饰条"。不要写"顶部有蓝色装饰"这种废话。你越含糊,模型越容易把母版重画掉。
第二块,强迫它做视觉设计。
【强视觉设计要求,必须体现在画面中】
这不是普通文字页,必须做成精修版汇报页。中央内容区要有设计感:
-
主标题用大号深蓝,左侧可加竖线装饰。
-
正文不要堆成项目符号列表,排成 3-4 个信息卡片、分区条或标签。
-
每页至少 3 种视觉元素:渐变卡片、细线分隔、编号圆点、图标标签、强调色词、结论色带、流程箭头等。
-
信息量足但高级:字号大、行距舒适、重点醒目,不能大片空白,也不能太密。
-
风格:学术、科技、商务,克制,不要卡通,不要花哨。
-
所有新增元素只放在中央白色内容区。
不加这一块,它很容易给你一页"标题 + 六个圆点"。
那不是 PPT。
那是 Word 换了个横向画布。

第三块,给本页固定设置。
【本页固定设置】
顶部数字方块显示:03
本页主标题:为什么不要把 Image2 页面再转成可编辑 PPT
第四块,给完整内容。
这里不要偷懒。
Image2 只负责排版,不负责替你想信息 。真正的信息应该由 Codex 从论文、报告、课程材料、产品文档里先拆出来。
【需要排入中央白色内容区的完整文字】
-
传统可编辑 PPT 的优势是后期可拖拽,但它会牺牲一次成型的视觉完整性。
-
Image2 生成页的优势是整页风格一致、图文关系天然绑定,更适合演示交付型材料。
-
新的可编辑层应该前移到 prompt:改标题、改信息密度、改版式要求,都通过 prompt 重跑或 edit 完成。
-
对演讲、组会、路演、课程展示来说,观众看到的是成品页,不是你的图层面板。
结论强调:PPT 的最小编辑单元,正在从文本框变成 prompt。
第五块,写禁止项。
【本页禁止项】
不要页码;不要日期;不要额外 Logo;不要改动底板上下元素;不要生成虚假数据图表;不要把正文改写成泛泛口号。
这五块合起来,才是一页真正可控的 Image2 PPT prompt。
Codex 的价值,不是"帮你写几句话"
很多人低估了 Codex 在这里的作用。
它不是文案助手。
它是整套 PPT 的生产经理。
你把论文、会议材料、产品文档丢给它,它要先判断:这套 PPT 给谁看?最后希望对方记住什么?哪些页讲背景,哪些页讲方法,哪些页讲结果,哪一页需要图,哪一页只需要一句重话。
然后它把每页拆成固定部分和变化部分。
固定部分,是底板约束、视觉设计规则、禁止项。
变化部分,是页码、标题、具体内容、结论强调、插入图片。
这一步做对了,后面批量生成才不会变成赌博。
你甚至可以直接让 Codex 输出一个页面清单:
请基于这篇论文,为一套 8 页学术汇报 PPT 生成 Image2 提示词包。
要求:
-
先给出整套 PPT 的页码节奏:每页标题、核心信息、是否需要插图。
-
每页 prompt 必须包含:统一底板约束、强视觉设计要求、本页固定设置、本页完整内容、本页禁止项。
-
每页正文必须来自论文或我提供的材料,不要泛化成空话。
-
每页都给出验收标准:底板是否保持、文字是否完整、视觉元素是否够、有没有多余 Logo/页码。
-
输出为 JSON 或 Markdown,方便后续批量调用 Image2。
Codex 写 prompt,Image2 出页面 。
一个负责判断和拆解,一个负责视觉和成片。
这比"AI PPT 一键生成"更慢一点,但成品更像你真的能拿去讲的东西。

修改也不要回到手工时代
真正的分水岭在这里。
如果一页不满意,不要马上打开 PPT 拖来拖去。
你应该把问题写回 prompt。
比如:
基于上一版页面继续编辑。
保持底板上下装饰完全不变,中央内容结构保留。
需要修改:
-
主标题缩短为"Prompt 才是新编辑层"。
-
三张卡片的文字各压缩 20%,字号略放大。
-
结论色带移到底部中央内容区,不要压到底板装饰条。
-
橙色只保留在结论色带和箭头上,其他强调改为深蓝。
不要增加新图标,不要生成页码,不要改动顶部数字方块。
这才是 Image2 edit 真正适合干的事。
你不是在修一页 PPT。
你是在修这页 PPT 的生成规则。
一旦规则改对,下一页、下一套、下一次组会都能复用。
什么时候不要这么做?
我不想把这篇写成"以后 PPT 都不需要可编辑了"。那也不准确。
如果你做的是公司标准模板,要多人来回改;如果里面有大量表格、法务文字、财务数据;如果后面每个数字都要追溯、每个图表都要更新,那传统可编辑 PPT 仍然有价值。
但很多演示场景不是这样。
组会汇报、课程展示、项目路演、读书分享、论文讲解、内部 demo,大多数时候真正重要的是:这套东西能不能讲清楚,风格能不能统一,现场投屏够不够稳。
观众不会关心你的文本框能不能双击。
他只会看到那一页有没有压住场。
我现在会这样做一整套 PPT
先做底板。
再让 Codex 读材料,拆出页码节奏。
然后让 Codex 为每页写五段式 prompt:底板约束、视觉设计、本页设置、本页内容、禁止项。
Image2 每页生成 2-3 个候选,挑最稳的。
不满意,继续用 edit 改 prompt。
最后把选中的 PNG 组装成 PPTX 或 PDF。
听起来像绕远路。
但你试过一套就会发现,这条路反而少返工。因为你不再跟几十个文本框肉搏,也不再为了"可编辑"牺牲整页完成度。
PPT 的旧编辑层,是文本框、形状和图层。
PPT 的新编辑层,是底板、提示词和验收标准 。
谁先把这层想明白,谁就先跨过 Image2 生成 PPT 的最后分水岭。
• OpenAI|Image generation guide
• 用户实测经验:Codex + 提示词 + Image2 直接生成两套 PPT;真实页面涉及隐私,本文只使用匿名示例图演示方法。