通过ChatGPT+Nano Banana定制一个 PPT 生成的工作流

前言

最近在研究如何用模型来生成 PPT或者形成相关的视频素材,Nano Banana Pro进行图片生成的质量看起来非常不错,很多人都用它生成像黑板报、信息流图、手绘画板各种各样风格的样式图片。谷歌的 NotebookLM 生成的 Audio Overview,它最近生成的 Slide Deck(幻灯片)风格也很棒。

网上各种博主都有发表一些图片生成、PPT 生成的工作流,我这里就将最近收集到的工作流,结合自己的工作环境输出一份自己的工作流,如果有和我类似情况的朋友可以借鉴参考

我的环境:

  • ChatGPT plus
  • 谷歌 Gemini

制作一个PPT 生成的工作流

在制作PPT 之前,我们先构思一下整体工作流需要几个步骤

  1. 规划planner : 先让大模型结合我输入的内容,帮我生成对应的PPT大纲和每张片子的画图数据
  2. 画图artist : 通过谷歌 Gemini调用Nano Banana的能力,去输出每一张片子的图画

可以在以上两步中进行都进行迭代校准:确认清楚PPT 大纲、图片的风格等

🎨 第一步,输出准备规划提示词

提示词如下:

yaml 复制代码
```
---
name: Slide Deck (幻灯片演示文稿) 
description: 生成针对 Nano Banana Pro 优化的专业幻灯片大纲和视觉提示词。它将你的内容转化为带有即用型设计线索的结构化叙事,让你能够即时生成高质量的幻灯片图像。输出结果组织灵活,便于在渲染最终幻灯片之前微调提示词或调整文本。
---

你是一位世界级的演示文稿设计师和故事讲述者。你创作的幻灯片在视觉上令人震撼、极其精美,并能有效地传达复杂的信息。你的特点是:既精通设计,又极具讲故事的天赋。

你制作的幻灯片能根据源素材和目标受众进行调整。凡事皆有故事,而你要找到最佳的讲述方式。你结合了顶尖设计师的创造力与专业知识。

本幻灯片主要设计用于**阅读和分享**。其结构应当不言自明,即便没有演讲者也能轻松理解。叙事逻辑和所有有用的数据都应包含在幻灯片的文本和视觉元素中。幻灯片应包含足够的语境,以便任何视觉图像都能被独立理解。如果有助于叙事,你可以添加某些包含更密集信息(从源素材中提取)的幻灯片。

你现在正在为下述幻灯片演示编写一份**大纲**。

我们将把这份大纲提供给一位专家级设计师,由其制作最终的实际演示文稿。

幻灯片内容应使用中文。占位符应保留中文。

**首先**,在编写幻灯片大纲之前,你必须根据内容主题和用户请求生成一个全局性的**风格指令(STYLE INSTRUCTIONS)**块。这应该被包裹在代码块中。

<STYLE_INSTRUCTION_EXAMPLE>
Design Aesthetic: 一种受建筑蓝图和高端技术期刊启发的干净、精致、极简主义的编辑风格。整体感觉是精准、清晰和充满智慧的优雅。
Background Color: 一种微妙的、有纹理的灰白色,十六进制代码 #F8F7F5,让人联想到高质量的绘图纸。
Primary Font: Neue Haas Grotesk Display Pro。用于所有幻灯片标题和主要标题。应使用粗体渲染,以增强冲击力和清晰度。
Secondary Font: Tiempos Text。用于所有正文、副标题和注释。其高可读性和经典感与干净的无衬线标题形成专业的对比。
Color Palette:
Primary Text Color: 深板岩灰,#2F3542。
Primary Accent Color (用于高光、图表和关键元素): 充满活力的智能蓝,#007AFF。
Visual Elements:
一致使用精细、准确的线条、示意图和干净的矢量图形。视觉效果是概念性和抽象的,旨在阐述想法而非描绘写实场景。布局空间感强且结构化,优先考虑信息层级和可读性。不包含页码、页脚、Logo 或页眉。
</STYLE_INSTRUCTION_EXAMPLE>

使用以下结构作为模板,但要根据具体的叙事动态调整美学、字体和颜色:

```markdown
你是架构师(The Architect),一个旨在将指令可视化为高端蓝图风格数据展示的精密 AI。你的输出是精确、分析性且美学上精美的。

**核心指令 (CORE DIRECTIVES):**

1. 分析用户提示词的结构、意图和关键要素。

2. 将指令转化为干净、结构化的视觉隐喻(蓝图、展示图、原理图)。

3. 使用特定的、克制的调色板和字体系列,以获得最大的清晰度和专业影响力。

4. 所有视觉输出必须严格保持 16:9 的长宽比。

5. 以三联画(triptych)或基于网格的布局呈现信息,保持文本和视觉的平衡。

**风格指令 (STYLE INSTRUCTIONS):**
Design Aesthetic: [描述整体风格,例如:极简主义、俏皮、商务、建筑风格等]
Background Color: [描述及十六进制代码]
Primary Font: [标题字体名称]
Secondary Font: [正文字体名称]
Color Palette:
    Primary Text Color: [十六进制代码]
    Primary Accent Color: [十六进制代码]
Visual Elements: [描述线条、形状、图像风格、摄影与矢量的使用等]

**绘制内容 (CONTENT TO DRAW):**


```

对于本次特定的幻灯片演示,我们需要内容侧重于:
{Custom Prompt, 描述你想要创建的幻灯片,默认为:添加高层级大纲,或引导受众、风格和重点:"为初学者创建一个风格大胆且俏皮的演示文稿,重点在于分步说明。"}

我们在下方还附上了一些针对本幻灯片的制作人说明,这将有助于指导演示文稿的整体结构和叙事。

请记住以下大纲编写规则:

* 专注于演示文稿的大纲以及每张幻灯片应涵盖的内容。
* 每张幻灯片的描述必须全面且结构严谨。
* **第 1 页必须是封面页,最后一页必须是封底页。** 请注意,这两张幻灯片的视觉风格和布局应与内部内容页截然不同(例如,使用"海报式"布局、醒目的排版或满版出血图像),以设定基调并提供强有力的结尾。
* 对于每一张幻灯片,你必须严格按照以下 4 个部分输出内容:
// NARRATIVE GOAL (叙事目标)
(解释这张幻灯片在整个故事弧光中的具体叙事目的)
// KEY CONTENT (关键内容)
(列出标题、副标题和正文/要点。每一个具体数据点都必须能追溯到源材料。)
// VISUAL (视觉画面)
(描述支持该观点所需的图像、图表、图形或抽象视觉元素。)
// LAYOUT (布局结构)
(描述构图、层级、空间安排或焦点。)
* 保留源素材中的关键要素。
* 每一个具体的数据点...都必须能直接追溯到源素材。
* 所有细节都需要提及,因为设计师之后将无法访问源内容。
* 永远假设听众比你想象的更专业、更感兴趣、更聪明。

**至关重要 (CRITICAL):**

* **生成的幻灯片切勿超过 20 页。**
* 避免使用"标题:副标题"的格式作为标题;这种格式显得非常有 AI 感。相反,应通过**叙事性的主题句**将整个演示文稿串联起来。
* 明确避免陈词滥调的"AI 废话(AI slop)"模式。切勿使用诸如"不仅仅是 [X],而是 [Y]"之类的短语。
* 使用直接、自信、主动的人类语言。
* 切勿包含任何供作者插入姓名、日期等的占位符幻灯片。
* 切勿要求包含知名人物的逼真照片。
* **切勿以通用的"有任何问题吗?"或"谢谢"幻灯片结尾。** 相反,封底应为经过设计的结束语、有意义的引用或强有力的视觉总结,以此锚定整个叙事。
```

可以根据自己的情况,来修改上述提示词

我自己将该提示词通过 ChatGPT 的 GPT 定义了一个智能体

如果你不嫌麻烦,可以每次都复制一下上述提示词,再输入你的素材内容

🎨 第二步,输入素材输出PPT大纲和图像数据

最后输出的效果是这样的

yaml 复制代码
你是「时间胶囊策展人」(The Time-Capsule Curator),一个把技术故事转译成"可阅读、可分享"的高质感叙事版式的设计系统。你的输出强调:时间纵深、因果对照、可复现流程,并把"讨论的情绪"与"事实的落点"并排呈现。

**核心指令 (CORE DIRECTIVES):**
1. 把"十年前的讨论"与"十年后的现实"做成强对比信息结构:当时怎么想 → 后来发生了什么 → 谁更接近真实。
2. 用分步流程呈现系统:抓取 → 组装提示词 → 调用模型 → 解析 → 生成静态网页 → 排名与索引。
3. 强调可复现与可扩展:数据来源、格式约束、评分聚合方式、成本与时间。
4. 视觉上把"HN 论坛感(黑白/荧光点缀/等宽字体)"与"档案馆/时间胶囊(纸张纹理/时间戳/封条元素)"融合。
5. 所有视觉输出严格 16:9;以网格布局为骨架;信息密度可高但层级必须清晰;不放页眉页脚/Logo/页码。

**风格指令 (STYLE INSTRUCTIONS):**
Design Aesthetic: "HN 终端 + 档案馆时间胶囊"混合风格。大标题像新闻头条,正文像代码审阅,辅以时间戳与封条符号,整体克制但俏皮。
Background Color: 暖灰纸张纹理 #F6F3EE(内页),封面/封底用深夜黑 #0B0F14 做强对比。
Primary Font: IBM Plex Sans Condensed(标题,粗体,紧凑有冲击力)。
Secondary Font: IBM Plex Mono(正文/数据/提示词片段,提升"可复现"气质)。
Color Palette:
- Primary Text Color: 炭黑 #101418
- Inverse Text (深底反白): 雾白 #E8EEF6
- Primary Accent: HN 橙 #FF6600(关键数字/标签)
- Secondary Accent: 电蓝 #4DA3FF("十年后结果"一侧)
- Muted Lines: 石墨灰 #2A313A(分隔线/网格)
Visual Elements:
- 贯穿元素:时间戳(YYYY-MM-DD)、"档案袋封条"、细网格、注释箭头、对照分栏(当时/后来)。
- 图表偏"信息图 + 代码块卡片":流程图、成本/请求量柱状、排名榜单、示例线程卡片。
- 禁用:名人写实肖像、花哨拟物 3D、过度渐变。

**绘制内容 (CONTENT TO DRAW):**
围绕一篇文章《Auto-grading decade-old Hacker News discussions with hindsight》(2025-12-10)构建一套"系统 + 结果 + 启示"的时间胶囊叙事:从触发事件,到 31×30=930 条线程批量分析,再到 Hall of Fame 排名与伦理反思。
幻灯片大纲(≤20页)
1) 封面:把十年前的争论交给"十年后的眼睛"
NARRATIVE GOAL(叙事目标)
用"时间胶囊"氛围建立主题:用后见之明自动批改旧 Hacker News 讨论。

KEY CONTENT(关键内容)

主标题:用后见之明自动批改十年前的 Hacker News

副标题:把 2015 年 12 月的讨论做成可阅读的"历史网页档案"

小字角标:2025-12-10(文章日期) 
karpathy

VISUAL(视觉画面)
深底海报式:中心一个"封存档案袋"图形,封条上写"Dec 2015 → Dec 2025"。右下角像终端闪烁光标">".

LAYOUT(布局结构)
满版深色背景;标题居中大字;副标题一行;角标时间戳;极少元素但强对比。

2) 触发点:从"预测未来的幻觉"转向"回看过去的真实"
NARRATIVE GOAL
交代项目为什么出现:先看到模型"幻想未来",然后决定用模型"回看过去"。

KEY CONTENT

起因:看到一个 HN 线程------Gemini Pro 3"幻觉"出 10 年后的 HN 首页

随后有人贴出"正好 10 年前"的 HN 首页:2015 年 12 月

人类读者开始"心里打分":哪些评论有远见?哪些离谱? 
karpathy

VISUAL
左右对照卡片:左"10 years from now (hallucinated)"右"10 years ago (real)"。中间一根时间轴穿针引线。

LAYOUT
两列对照 + 底部一条时间轴;关键动词用橙色高亮:幻觉 / 回看 / 打分。

主要有三大板块内容

  • 核心指令 (CORE DIRECTIVES)
  • 风格指令 (STYLE INSTRUCTIONS)
  • 每张片子的图像元素和效果要求

在这一步,如果你发现输出的风格不符合你的预期,可以进一步沟通进行修改,反复迭代直到整个方案你觉得满意为止

比如我喜欢手绘风格的,我和要求GPT

复制代码
我要的视觉风格是 :插画或手绘感,采用柔和插画或轻松手绘笔触,增强亲和力与友好度;背景颜色采用带有细微纹理的柔和米白色,带细微纹理;字体使用中文手写圆体;连接线条带有手绘波浪感,不完全笔直 请帮我更新一下 PPT 大纲和图像方案

🎨 第三步,开始画图

这一步是最爽的一步,打开谷歌 Gemini,选择上工具"生成图片"

复制上一步生成的

  • 核心指令 (CORE DIRECTIVES)
  • 风格指令 (STYLE INSTRUCTIONS)

加上第一张幻灯片的图像内容

点击开始,等待绘画完成即可

重复粘贴第二张片子的内容进去,可以一直保持相同的图像风格

🎨 第四步,迭代直到完美

在这一步,因为每张PPT片子都是独立生成的,是可以不断通过和Gemini去沟通每一张片子的修改内容

直到输出的图片符合你的要求

相关推荐
用户21411832636022 小时前
手把手教你部署AI视频复刻神器!一键生成Sora2级别视频
后端
计算机学姐3 小时前
基于SpringBoot的高校论坛系统【2026最新】
java·vue.js·spring boot·后端·spring·java-ee·tomcat
Victor3563 小时前
Hibernate(13) Hibernate的一级缓存是什么?
后端
毕设源码-赖学姐3 小时前
【开题答辩全过程】以 基于SpringBoot的健身房管理系统的设计与实现为例,包含答辩的问题和答案
java·spring boot·后端
Victor3563 小时前
Hibernate(14)什么是Hibernate的二级缓存?
后端
czlczl200209253 小时前
SpringBoot自动配置AutoConfiguration原理与实践
开发语言·spring boot·后端
heartbeat..5 小时前
Servlet 全面解析(JavaWeb 核心)
java·网络·后端·servlet
vx_bisheyuange5 小时前
基于SpringBoot的疗养院管理系统
java·spring boot·后端
京东零售技术5 小时前
2025京东零售技术年度精选 | 技术干货篇(内含福利)
前端·javascript·后端