用 TRAE Work 做 PPT，最重要的不是「生成」

本文作者：大模型善后工程师-K 叔，TRAE 核心用户

前言

TRAE Work 不是"输入主题就吐出完美 PPT"的魔法按钮。它真正的价值，是把散落在文章整理、页面设计、素材生成、导出验收里的繁琐工作，放进一条能持续迭代的链路里，不过前提是你先把"怎么才算做好"讲清楚。

过去我做 PPT，一直抱着一个朴素的想法：只要 AI 能把页面生成出来，后面的事就轻松了。真正多做几轮之后才发现完全不是这样。

这篇文章想聊的不是"怎么写一句万能 Prompt"，而是记录一次具体经验：用 TRAE Work 做 PPT 时，我是怎么先把"怎么才算做好"定义清楚，再让工具一点点往前推进的。

全程我会穿插一个真实例子：把 OpenAI 的两篇文章整理成一次社区分享。

看完本篇文章你可以了解到：

为什么难的不是"生成 PPT"，而是"生成之后"

长文如何拆成"每页一个判断"

我实际跑通的五步链路（可复用方法论）

视觉方向：先定义"不要什么"

image-gen 只做材料，不替你写事实

那些肉眼一次看不出的小问题

预览与验收：最后一段路

一张可以随手复用的检查清单

一、为什么难的不是"生成 PPT"

PPT 是个特殊物种。

它不是一篇文章，也不是一张海报。文章写清楚就能读，海报好看就能发，但 PPT 往往还要能讲、能改、能导出、能被批注，打开后文字最好还能编辑。

所以很多问题不是在生成之前出现，而是在生成之后才慢慢冒出来：

封面第一眼不够抓人
页面看起来像网页截图
标题读起来不像正常人会说的话
背景纹理压住了文字
文字框比文字本身宽出一大块，选中后才发现对象和视觉并不一致

这些问题单独看都不大，叠在一起，就会让一份 PPT 卡在"差不多有了 "和 "可以交付 "之间。

适用边界：

这套方法更适合对外分享、需要反复修改、最后要交付 PPTX 的场景。如果只是内部讨论草稿，没必要每步跑满，可以先保留 memo 和 slide plan，等内容确实值得做成正式 PPT，再补设计、image-gen 和验收流程。
memo 指的是你在正式做 PPT 之前，先整理出来的一份"想法备忘 / 内容纲要"文档，简单可以理解为备忘录。

具体实战

我读了 OpenAI 的两篇文章，一篇讲 Harness Engineering ，一篇讲开源的 Codex 编排工具 Symphony 。单独看都是技术文章，但放在一起读，能感受到背后的递进关系：先让单个 Agent 在工程环境里跑稳，再面对多个 session 同时运行、人开始盯不过来的问题。

于是我把这份读后感整理成一套社区分享 PPT。这个例子刚好也可以说明：一份好 PPT 不是把两篇文章翻译成页面，而是先把" 我读完以后真正想讲什么 "抽出来。

二、一开始也以为，难的是生成 PPT

很多人第一次用 AI 做 PPT，大概率都从一句话开始：

复制代码

帮我根据这篇文章做一份分享 PPT。

这句话可以作为入口，但只给到这里，后面通常很难收。因为 PPT 不是把内容放进页面就结束，它还涉及一连串判断：

这套内容是给谁看的？
每一页到底想让观众记住什么？
哪些是事实，哪些只是我的理解？
这套视觉应该像分享材料，还是像产品后台、网页组件、信息图？
最终怎么判断它已经可以交付？

这些问题不先说清楚，AI 会按自己最容易理解的方式去做：例如生成一套很规整的页面，每页有卡片、标题、小点、状态条，看起来完整，但放到分享场景里就觉得不对：像网页截图，像后台页面，像设计 demo，就是不像一套能站在台上讲的 PPT。

这不是工具的问题，是我们没有先把判断标准讲出来。所以我后来会先做两件事：

先分析，不生成：用 kz-article-deep-analysis 技能分别拆两篇文章的核心议题、核心主张、论证骨架和认知增量，尤其看两篇之间有没有递进关系。

再整理 memo：基于分析结果做二次组织，得到的不是摘要拼接，而是带着判断的 memo。

这份 memo 不需要复杂，但至少要回答：

两篇文章各自在回应什么问题？
这次分享的主线是什么？
读者/听众是谁？
文章里哪些判断必须保留？
哪些说法有事实边界？
这套 PPT 最后要输出什么文件和预览？

拿这次 Codex Symphony 的分享来说，前面先确认了一条主线：不是把 Harness、Symphony、Loop Engineering 并排解释一遍，而是讲一个递进过程。

先有 Harness，让单个 Agent 在项目里跑稳。等 session 多起来，人开始盯不过来，于是才自然出现 Symphony 这种调度实践。

主线一旦确认，后面的页面就不再是随便摆内容：封面为什么讲"人站的位置变了"、第 9 页为什么不能写成"官方定义"、每页标题为什么要短一点，这些判断都有了来源。

这也是 "读后感做 PPT" 和 "文章摘要做 PPT"的差别。

摘要会拆成"第一篇讲什么、第二篇讲什么、最后总结一下"，能做但很平，真正适合分享的，是把读完后形成的判断讲出来。

这次的判断就是：

复制代码

AI 编程的新词不是凭空冒出来的。
先有 Harness 解决"Agent 怎么跑稳"。
再有 Symphony 回应"Agent 多起来以后，人怎么盯得住"。
真正变化的，不只是工具，而是人站的位置。

所以我现在更习惯把第一步写成：

bash 复制代码

请先不要生成 PPT。
先使用 $kz-article-deep-analysis 分别分析这两篇文章。（$kz-article-deep-analysis这个是我自己的skill）
每篇都提取核心议题、核心主张、论证骨架、认知增量和边界条件。
然后基于两份分析结果，整理一份 memo、主线和每页要表达的核心判断。
输出后停住，等我确认。

这个"停顿"很重要。它让人先把方向看一遍，也让后面的修改不至于变成无休止的"再高级一点"、"再好看一点"。

这里还有一个小技巧：让 AI 把 memo 保存成文档，而不是在对话里临时说一版。

文档化以后，你和 AI 的沟通就有了固定锚点，可以直接围绕 memo.md 来改：这句是不是主线、哪页多讲了一个观点、某个判断有没有越过事实边界。

这比生成一整套 PPT 后再回头改要轻很多。

PPT 一旦生成，问题会混在一起：可能主线不对、标题不自然、视觉不舒服、文本框太宽。

你说"整体调一下"，AI 很难判断该改内容、改设计还是改文件。

但停在 memo 阶段，修改成本就低得多。

三、长文要先变成"每页一个判断"

文章和 PPT 最大的区别不是字数，而是观看方式。文章可以慢慢铺垫，分享型 PPT 不行，观众每页停留时间很短，一页塞三个观点，讲的人累，听的人散。

所以我会先做 slide plan，不追求漂亮，先把每页功能说清楚：

rust 复制代码

Slide 03
Claim： AI 编程的痛点在往后移。
Proof object： Harness -> sessions -> supervision overload -> Symphony。
Layout： process sequence。

这里最有用的是 Claim。它不是标题，也不是文案，而是这一页必须讲清楚的那句话。先有这句话，标题和设计才有依附的东西。

这次 PPT 改过很多标题。早期偏概念：例如"认知递进""模式变化""官方边界"，在文章里能解释，放到标题上就太重。后来改成更像现场会说的话：

偏概念的旧标题

认知递进
模式变化
官方边界

像人话的新标题

AI 新词不是凭空冒出来的
痛点在往后移
session 多了，人盯不过来
关系可以这样讲

这套读后感 PPT 最后拆成了 11 页 ，是按读后的认知顺序来拆，而不是按两篇文章的目录：

vbnet 复制代码

01 封面：从 Harness 到 Symphony，真正变的是人站的位置
02 Hook：AI 没改掉技术演进规律，只是把问题暴露得更快
03 递进：AI 编程的痛点在往后移
04 Harness：第一阶段不是调度，而是先让 Agent 跑稳
05 现场：项目现场越清楚，单个 Agent 越容易跑稳
06 新瓶颈：Agent 跑稳后，瓶颈从写代码转向盯 session
07 Symphony：session 多起来之后，调度实践就变得自然
08 模式变化：真正变的是人站的位置
09 边界：可以用 Loop Engineering 理解，但不能说成官方定义
10 给小团队：别急着抄 Symphony，先看自己卡在哪一层
11 收束：先补 Harness，再谈 Orchestration

判断标题好坏有个简单办法： 把标题单独读一遍。 如果这句话我不会在现场说出来，那它大概率就不该放在页面最上面。再短一点，再直一点，少一点概念包装。

四、实际跑通的五步链路

与其复述每一条 prompt，我更想留下几个关键节点：下次再做类似 PPT，至少要守住这些地方。

第一步：深度解读 + memo

先把两篇文章各自的核心议题、核心主张和边界拆出来，再合并成 memo.md。要反复和 AI 对齐，直到"这套分享到底讲什么"能一句话说清。

第二步：memo 拆成 slide plan

每页只保留一个 claim，写清对应的 proof object。先不追求文案漂亮，重点确认每页有没有存在的必要，以及要让观众记住什么。

第三步：写 design brief

先写清楚"不要像什么"，再写希望接近什么效果。比如：不要网页截图感、不要 dashboard、不要把事实文字拷进图片里。

brief 写清楚，后面生成页面才不容易跑偏。

第四步：用 kz-design 生成 PPTX 和预览

这个 kz-design 是我自己设计的 PPT skill

这一步输入的不再是"帮我做个 PPT"，而是已确认的 memo.md、slide plan 和 design brief。

$kz-design 负责把内容翻译成 deck：固定 16：9 画布、可编辑 PPTX、页面节奏、字体层级、图形关系、无文字背景资产、逐页预览和 contact sheet。

它不应该重新猜文章逻辑，也不应该把个人理解改成官方定义。

PPTX 只是交付文件，逐页截图和 contact sheet 才是验收工具，每次大改后都要重新看整套节奏，而不是只盯刚改的那一页。

第五步：根据批注逐项修 + 清理文件

反馈要拆成可执行的小问题：标题是否像人话、文字框是不是太宽、mask 有没有跟着文字重算、背景安全区有没有被占用、旧文案有没有残留。

不要只说"帮我整体优化一下"。

最后做一次文件清理：多轮 image-gen、导出、预览后目录里容易留下中间文件，明确最终保留哪些 PPTX、预览图和可复用资产，否则下次回头很容易分不清哪个才是最终版。

五、视觉目标 ≠ "高级点"

做 PPT 时最容易给 AI 的视觉要求是：

复制代码

做得高级一点，有科技感，适合社区分享。

这句话听起来没问题，但很难执行。

因为"高级 "有太多种理解，AI 很可能走向一套常见科技风：蓝紫渐变、玻璃卡片、等距组件、状态点、仪表盘布局，这些不一定难看，但会把页面带向网页、产品 UI、后台截图。

这次最有帮助的反馈，反而是一个反向判断："整体风格太像网页截图了，不像 PPT"，一句话就把问题说清了。

后面我不再只写"请帮我优化的更好看"，而是把 design brief 写得更具体：

不要等距卡片
不要按钮感很强的标签
不要 dashboard 式页面
不要把每页都做成产品 UI
希望更像社区分享里的纸张笔记、批注、撕边标签和现场讲解

设计往往不是先定义"我要什么"，而是先定义"我不要什么"。反例越清楚，AI 越容易避开默认模板。

放到这套读后感 PPT 里：它不是 OpenAI 官方发布会，也不是产品 UI 演示，所以不需要假装有一堆系统截图、状态点和控制台组件。

更合适的方向，是做成一份社区分享里的纸面笔记：暖色纸张、黑色文字、撕边标签、少量批注，用流程图和对比页把递进关系讲清楚。

⚠️注意：不使用 OpenAI logo，不伪造产品截图。因为这套 PPT 讲的是我的读后理解，不是官方物料。视觉可以有质感，但事实层要干净。

别忘了"背景安全区"

用 image-gen 做背景时很容易被质感吸引：纸张、胶带、撕边、色块都好看。

但真正放文字时才发现：好看的背景不等于可用的背景。

右上角有胶带、底部有撕纸边、左下角有大色块，这些地方就不能随便放正文。

所以我会让 design brief 明确写 safe area，哪怕不精确也要先说清楚：

复制代码

常规内容尽量放在中间纸面区域。
底部不要贴得太低。
左下角有装饰色块时，正文尽量避开。
页码和来源信息不要压到纹理边缘。

六、image-gen 适合做材料，不适合替你写事实

这次我对 image-gen（AI 图片生成）的看法也变了：它很适合帮 PPT 增加质感，但不适合直接承担所有内容。

分工原则：图片负责气质，文字负责事实。

凡是有事实、有标题、有术语、有中文说明的地方，都尽量让文字留在 PPT 的可编辑文本层里。

image-gen 适合做

无文字纸张背景
低对比工作流纹理
撕边标签
胶带、纸条、印刷颗粒等材料

不让它直接画进去

标题
页码
引用来源
关键术语

原因很现实：中文可能生成错、文案后面大概率会改、别人打开还要挪位置。事实文字一旦拷进图片，检查和修改都会变麻烦。

这次比较有收获的一步，是把一张撕边标签处理成白色 alpha mask。有了这个 mask，后面需要黑色、绿色、黄色标签时，就不用每次重新生成图片，用代码着色，再按文字长度做九宫格缩放，就能在不同页面复用。

这一步生成的不是最终页面，而是一批无文字底板素材：纹理、标签、badge、面板和高亮条。后面按颜色和尺寸复用，文字仍留在 PPT 文本层。

这个细节看起来工程化，但对 PPT 很有用：一套 PPT 里很多视觉元素不止出现一次，标签、底板、提示条、强调块如果每页手工调，后面会越来越乱。

把它做成可复用资产，风格更稳定，修改也更轻松。

这也是 TRAE Work 适合接住的一段工作，它不只帮你"想一个设计"，还能把设计里可重复的部分变成一套能继续用的资产。

七、有些小问题，肉眼一次看不出来

这次有个很小但典型的问题：有些文字标签看起来上下边距不舒服 。第一眼以为是背景图或底图没做好，后来发现真正影响视觉的是文字框本身：文字框比实际文字宽很多，右边就显得空，宽度估算太紧，到了 PowerPoint 里又可能意外换行。

这种问题很微妙：单看导出图片只觉得"哪里怪怪的"，一旦选中对象，才能看到文本框和视觉对象并不匹配。

所以我后来会把文字框也纳入检查：

单行文字有没有意外换行
短文字的文本框有没有过宽
背景底纹有没有跟着文字框重新计算
上下左右留白是不是大致均衡
文字是不是仍然可以编辑

很多 PPT 看起来不够精致，不一定是设计方向错了，而是这些小关系没有对齐。

比如封面右侧的 Human on the Loop 标签，一开始背景宽度偏大、整个标签显得松；解决办法不是简单缩图，而是重新计算文字框宽度，再按文字框和留白重新生成 mask。

如果只让 AI"再美化一下"，它不一定知道你在说什么。把问题拆成"文字框宽度 "、"mask 尺寸 "、"padding 是否均衡"，反而更容易改到位。

八、最后一段路，靠预览和验收

PPT 做完后，我现在不敢只打开第一页看一眼就说完成。

因为改 PPT 有个常见问题：你盯着刚改的那一页，就很容易忘掉整套节奏。

封面好看了，中间某页突然变挤；第 9 页文案改顺了，旧文案还残留在隐藏对象里；某个标签宽度调好了，又导致另一页换行。

所以我会让工具做四类检查：

这些检查并不复杂，却很容易被忽略。如果目标是交付一个文件而不是看一张截图，这些检查就很值得： 它们能把"凭感觉还行"的地方，变成可以复核的结果。

那套读后感 PPT 也是这样收尾的：每次大改后重新导出 PPTX，渲染成 11 张预览拼成 contact sheet，一眼就能看出封面撑不撑得住、第 9 页边界说明是不是太硬、后面 checklist 页是不是突然像表格。

尤其是第 9 页，最初标题是"别说成官方定义"，意思没错但读起来生硬。后来改成"关系可以这样讲"，下面补一句"更像一种实践，不是官方定义"。

这是 PPT 里很常见的平衡：标题要像人话，但边界不能丢。

九、我现在会怎么给 TRAE Work 派任务

如果现在重新做一套 PPT，我不会把任务写成一句完整的大 Prompt，而是拆成几轮，每轮只解决一类问题。

第一轮 · 先分析、再整理，不生成 PPT

css 复制代码

请先不要生成 PPT。
先使用 $kz-article-deep-analysis 分别分析这两篇文章。
每篇都提取核心议题、核心主张、论证骨架、认知增量和边界条件。
再基于两份分析结果整理一份读后感 memo。
不要逐段摘要，重点提取它们之间的递进关系。
再整理 claim spine 和 10 页左右的 slide plan。
每页只保留一个 claim，并写出 proof object。
输出后停住，等我确认。

第二轮 · 写设计 brief

diff 复制代码

基于已确认的 slide plan，写 design brief。
重点写清楚：
- 这套 PPT 不要像什么
- 视觉方向和参考对象
- 背景安全区
- 哪些文字必须可编辑
- 哪些元素可以用 image-gen 生成
- 哪些说法只是读后理解，不能写成官方定义

第三轮 · 交给 kz-design 生成和导出

bash 复制代码

使用 $kz-design，基于已确认的 memo、slide plan 和 design brief 生成可编辑 PPTX。
不要重新猜文章逻辑，不要把个人理解写成官方定义。
文字保留为 PPT 文本层。
图片只做背景、材质和装饰。
每页导出 PNG 预览。
生成 contact sheet。
记录验证结果。

第四轮 · 根据批注逐项改

复制代码

根据我标注的问题逐项修改。
每次修改后重新导出 PPTX、预览图和 contact sheet。
检查旧文案、文字换行、安全区和 PPTX 可打开性。
尤其检查底纹和文字这类边界是否合适，不只是具体参数，更要检查视觉效果是否合适。

这样拆看起来慢，实际更稳。方向错了就停在方向层改，设计不对就停在设计层改，文件有问题就回到导出验证层改。最怕的是一开始把所有事情混在一起，最后你也说不清到底是内容不对、设计不对，还是文件本身有问题。

十、一张可以随手复用的检查清单

把这次经验压成一张清单，我会保留这些问题：

这套 PPT 的一句话主线写清楚了吗？

每页是不是只讲一个判断？

标题是不是现场真的会说的话？

哪些是事实、哪些是个人理解，边界说清了吗？

视觉 brief 里有没有写清楚"不要像什么"？

背景有没有留出安全区？

image-gen 是否只承担背景、材质和无文字资产？

事实文字是否保留为可编辑文本？

标签、底板、mask 是否能复用，而不是每页手工调？

有没有导出逐页预览和 contact sheet？

有没有检查旧文案、placeholder、意外换行和遮挡？

PPTX 是否能正常打开或重新导入？

读后感做 PPT，有没有把"文章摘要"变成"你的判断"？

这张清单不一定每次都要完整跑：内部草稿可以轻一点；要交付、分享、发给别人继续改，就值得认真一点。

写在最后：人的工作没消失，只是换了位置

我现在对 TRAE Work 做 PPT 的期待，比一开始更现实了。

它不一定一次给我完美作品，也不该替我决定内容主线、事实边界和审美判断。但只要我能把这些讲清楚，它就很适合接住中间那段繁琐工作：整理结构、生成页面、调整视觉、导出预览、按反馈继续改，再把文件检查一遍。

过去做 PPT，很多时间花在反复挪文本框、换底板、看一页改一页、改完又不放心。现在这部分可以更多交给工具跑起来。

人的工作没有消失，只是换了位置。以前人站在每个细节里，一点点手工改；现在更像站在流程上面：先讲清楚要什么，再看结果哪里不对，最后判断能不能交付。

对我来说，这才是用 TRAE Work 做 PPT 最值得沉淀的地方：它不是让人少思考，而是让人把思考放在更前面，也放在更关键的位置。