Codex 从零开始保姆级使用指南

这篇指南的目标很简单：让一个没用过 Codex 的人，在 15 分钟内安全完成第一件小事，然后知道下一步怎么继续学。

Codex 不是普通聊天窗口。它更像一个能进入你项目文件夹工作的 Agent：可以读文件、写文件、运行命令、打开预览、调用插件、沉淀规则，也会在高风险动作前请求授权。新手最重要的不是一次学完所有功能，而是先学会一个闭环：

text 复制代码

给项目 -> 给目标 -> 让 Codex 先读 -> 看计划 -> 授权低风险操作 -> 验收结果 -> 沉淀规则

1. 先完成一个 15 分钟安全任务

先别急着装插件、跑自动化、改代码。第一次用 Codex，建议只做一个低风险任务：让它在一个空文件夹里生成一份简单说明文档。

这个任务的好处是：不会碰你的重要文件，不需要开发环境，也能完整体验 Codex 的核心流程。

1.1 准备一个空文件夹

在电脑上新建一个文件夹，比如：

text 复制代码

codex-first-test

里面先不要放重要文件。你可以只放一个空白文本文件，也可以完全空着。

$截图占位 01：新建空项目文件夹$
截图内容：文件管理器里显示 codex-first-test 文件夹，里面为空或只有一个简单测试文件。

建议尺寸：16:9 横图，宽度 1200px 以上。

命名建议：images/01-empty-test-folder.png

1.2 在 Codex 里打开这个文件夹

选择刚才的新建的文件夹作为项目或工作目录。不同版本入口名字可能不同，常见叫法包括"Open folder""选择项目""打开工作区"等。

打开后，先输入：

text 复制代码

请先读取当前项目目录，不要修改任何文件。告诉我这里有哪些文件、你认为这是一个什么项目、下一步可以做什么。

你要看到的结果是：Codex 只读目录，不写文件，并说明当前文件夹很空。

如果它准备修改文件，先停下来，让它解释要改什么。

1.3 让 Codex 创建第一份 README

继续输入：

text 复制代码

请在当前项目里创建一份 README.md。内容只写三部分：

1. 这个文件夹是我的 Codex 新手测试项目。
2. 我今天要练习让 Codex 安全读写文件。
3. 下一步我会让 Codex 修改这份 README。

创建前先说明会新增哪个文件。创建后告诉我如何验收。

这一步你要关注三件事：

Codex 是否说明了会创建 README.md。
是否只在当前测试文件夹里写文件。
创建后你能否在侧边栏、文件列表或编辑器里看到这个文件。

1.4 验收结果

打开 README.md，检查内容是否符合要求。然后让 Codex 做一次小修改：

text 复制代码

请把 README.md 里的"下一步我会让 Codex 修改这份 README"改成"我已经完成了第一次 Codex 文件修改练习"。只改这一句，改完告诉我改了哪里。

这一步是为了练习"明确修改范围"。你不要只说"优化一下"。第一次练习越小越好。

1.5 第一次练习的成功标准

完成后，你应该能回答这 5 个问题：

Codex 当前在哪个文件夹里工作？
它新增了哪个文件？
它修改了哪一句？
这次操作有没有碰到测试文件夹外面的文件？
如果下次要改重要文件，你会先让它做什么？

推荐答案是：先让它读目录、列计划、说明影响范围，不要直接大改。

2. 你需要准备什么

你需要：

一个可用的 ChatGPT / OpenAI 账号。
一台电脑。
稳定网络。部分地区访问、下载和登录需要代理。
一个可以安全测试的文件夹。

下载入口可以从官方页面开始：

text 复制代码

https://chatgpt.com/zh-Hans-CN/codex/get-started/

登录方式以你当前界面为准。常见方式是用 ChatGPT 账号登录；如果界面提供 API Key 或其他登录方式，再按官方提示操作。

3. Codex 到底是什么

你可以把 Codex 理解成"带工具的 AI 工作台"。它的强项是：

读懂本地项目文件和上下文。
写代码、改文档、生成网页、表格、PPT、PDF 等产物。
在你的授权范围内执行终端命令。
通过 Browser、Chrome、Computer Use、MCP、插件等能力连接外部世界。
用 AGENTS.md、Memory、持久线程保存长期规则和工作上下文。
用自动化和 Goals 处理长期、重复、可验证的任务。

普通 ChatGPT 更像"你发材料，它在对话里回答"。Codex 更像"你给它一个工作空间，它能在里面动手"。这个差异很重要，因为一旦能动手，就必须学会权限、边界和验收。

4. 文件、项目和权限

4.1 什么是项目

Codex 里的"项目"基本对应你电脑上的一个文件夹。你选中一个文件夹后，Codex 会把这个文件夹当成主要工作范围。

项目不一定是代码仓库。它可以是：

写作草稿文件夹。
会议记录文件夹。
视频素材文件夹。
个人知识库。
网站或软件项目。

好用的第一句话是：

text 复制代码

请先读取当前项目结构，不要修改文件。告诉我这个项目大概是做什么的、核心文件在哪里、下一步应该看什么。

4.2 权限模式怎么理解

不同版本的权限名称会变化，但你可以按风险理解：

权限类型	你可以怎么理解	新手建议
只读或低权限	Codex 主要读取项目，不随便写文件或执行敏感命令	适合第一次探索项目
需要审批	Codex 想写文件、运行命令、访问外部路径时会请求你批准	最适合新手
高权限或完全访问	Codex 能做更大范围的操作	不建议新手长期打开

审批弹窗出现时，不要只看"允许"按钮。你要看三件事：

它要执行什么命令或修改什么文件。
影响范围是不是当前项目。
操作能不能撤回。

4.3 高风险动作判断表

遇到这些动作，先拒绝或让 Codex 解释清楚：

动作	风险	正确问法
删除文件	可能不可恢复	"先列出要删除的文件和原因，不要执行。"
批量重命名	可能把素材顺序打乱	"先输出重命名方案，等我确认。"
安装系统工具	可能改环境	"先检查现状，说明安装方式和影响路径。"
修改 shell 配置	可能影响终端	"先说明会改哪个配置文件，给回滚方式。"
发布、发送、付款	不可逆或有外部影响	"只生成草稿，不要直接发送/发布/付款。"
使用真实登录态	涉及隐私和账号	"只读取必要信息，操作前逐步确认。"

5. 文件操作能做什么

文件操作是 Codex 和普通聊天工具最大的区别之一。

典型用法：

text 复制代码

请扫描这个文件夹里的所有 Markdown，按主题分组，生成一个索引文件。保留原文件不动。

text 复制代码

请整理这些会议记录，输出一份按项目、负责人、待办事项分类的汇总。先不要改原始记录。

text 复制代码

请检查这个项目的 README 是否过期，先列出问题和证据，不要直接改。

text 复制代码

请把这个文件夹里的视频素材按实际内容重命名。先统计数量，抽取关键帧判断内容，再给出重命名方案，等我确认后再执行。

新手要记住一个规则：第一次让 Codex 处理重要文件时，先让它"读"和"列方案"，不要直接"改"。

6. 命令行和环境安装

Codex 在授权后可以执行终端命令。对新手最有价值的地方是：它能帮你检查和配置开发环境。

好的命令行任务应该包含三步：

先检查现状。
缺什么再安装。
安装后验证结果。

可以这样说：

text 复制代码

请检查我的电脑是否已安装 Node.js、Git 和 pnpm。先只检查并报告版本，不要安装。确认缺什么后，再给出安装计划。

确认计划后再说：

text 复制代码

请按刚才的计划安装缺失工具。涉及系统级修改、删除文件、修改 shell 配置、申请管理员权限前，必须先问我。安装后验证版本。

不要只说：

text 复制代码

帮我装一下 Node。

这句话太短，Codex 不知道你能接受哪种安装方式，也不知道能不能修改系统环境。

6.1 安装新 CLI 或工具

如果工具很知名，可以直接说名字：

text 复制代码

请检查我是否安装了 GitHub CLI。若未安装，先说明官方安装方式和影响路径，等我确认后再安装。安装完成后验证 gh 是否可用，并告诉我下一步如何登录。

如果工具不够知名，给官方链接：

text 复制代码

请根据这个 GitHub 仓库的 README 安装这个 CLI：<链接>。只使用官方文档里的安装方式，安装后运行最小示例验证。

同名项目很多。你不给官方链接，Codex 有概率找到不相关项目。

6.2 Agent IDE 为什么有用

Codex 能查看和修改文件，但精细编辑时，专业编辑器仍然有用。你可以安装 Cursor、VS Code 等编辑器，把它们作为人工检查和精修工具。

提示词：

text 复制代码

请检查我是否已安装 Cursor 或 VS Code。不要安装新软件，先告诉我当前可用的编辑器，以及 Codex 能否从当前项目打开它。

7. 上下文、额度和压缩

上下文就是当前线程里 Codex 能参考的信息，包括你的对话、文件片段、工具结果、计划、错误信息等。

上下文越满，Codex 越容易变慢、变贵、变钝。你会看到它开始忘记前面约定、重复问问题，或者抓不住重点。

任务告一段落时，可以让它先整理：

text 复制代码

请把当前任务的关键决策、文件路径、已完成事项、未完成事项、验证结果整理成一段 compact summary。

然后再压缩上下文。不同版本的压缩入口不同，有的支持输入：

text 复制代码

/compact

以你当前界面为准。

8. 让 Codex 下次还懂你：AGENTS.md 和 Memory

Codex 的长期规则不要只放在聊天里。聊天会变长、会压缩、会丢细节。稳定规则应该写进文件。

8.1 全局 AGENTS.md

全局规则适合写你的长期偏好，比如：

markdown 复制代码

# 我的 Codex 使用偏好

- 默认用中文回答。
- 先给结论，再给依据。
- 修改文件前先读相关上下文。
- 不要删除文件，除非我明确要求。
- 生成长文时保留原始信息点，不要为了流畅删掉细节。
- 代码任务完成后说明验证方式和未验证项。

入口以当前界面为准，常见位置在设置、个性化、自定义指令或类似入口。

8.2 项目级 AGENTS.md

项目级规则只对当前项目生效，文件名通常是：

text 复制代码

AGENTS.md

注意大写。

项目有了一定内容后，可以让 Codex 生成草稿：

text 复制代码

请阅读当前项目结构和 README，生成一份项目级 AGENTS.md 草稿。内容包括项目目标、目录说明、运行命令、测试命令、代码风格、禁止修改的路径、交付前验证要求。先给草稿，不要写入文件，等我确认。

项目级 AGENTS.md 的价值是：你清空对话或开新线程后，Codex 仍然能快速理解项目规则。

8.3 自动 Memory

自动 Memory 用来保存一些可复用偏好。它适合辅助召回，不适合承载严肃规则。

建议：

稳定规则写进 AGENTS.md。
可追溯事实写进知识库或项目文档。
临时偏好可以留在当前线程。
错误记忆要及时删除或更正。

9. 大型任务怎么交给 Codex

复杂任务不要一上来就让 Codex 直接做。先让它计划。

适合先计划的任务：

从零做网站。
重构一个项目。
整理几十份资料。
做一套 PPT。
写一个自动化工作流。
安装一套复杂环境。

推荐流程：

选项目文件夹。
描述目标。
让 Codex 提问或生成计划。
你检查计划，补充约束。
执行。
中途干预。
验收结果。

提示词：

text 复制代码

我想从零做一个个人主页。目标是展示我的简介、作品、联系方式和最近文章。请先问我必要问题，生成实施计划，不要直接写代码。计划里要列出会创建哪些文件、如何预览、如何验收。

中途发现方向不对，可以直接补充：

text 复制代码

刚才的视觉方向太商务了。请改成更像独立创作者主页，减少营销感。先说明会改哪些文件，再执行。

很多时候 Codex 不会立刻打断当前工具调用，而是在下一个合适节点吸收你的新指令。所以你越早干预，返工越少。

9.1 Fork 怎么用

如果一个线程前面聊得很好，后面跑偏了，可以从合适节点 Fork。Fork 适合：

想试另一个方案。
想回到没跑偏的历史节点。
不想污染主线对话。

不要在一个跑偏线程里无限纠缠。方向岔开就分支。

10. 侧边栏、浏览器预览和批注

Codex 的侧边栏可以展示 Markdown、表格、PPT、PDF、网页、代码 diff 等产物。网页项目尤其适合直接预览。

提示词：

text 复制代码

请启动本地开发服务器，在 Codex 侧边栏打开预览。检查桌面端和手机端布局，发现明显问题直接修。修完告诉我改了哪些文件。

内置浏览器常用于：

预览本地网页。
测试按钮、表单、跳转。
检查移动端布局。
对页面元素做批注。

轻量项目可以只做一个 index.html，直接预览。静态展示、交互小工具、浏览器幻灯片、数据分析小页面都很适合。

11. 插件：连接外部服务

插件的作用是把 Codex 接到外部平台和工具上。新手先知道用途，不要一口气全装。

常见插件或外部能力：

能力	用途	适合场景	新手建议
Browser	应用内浏览器自动化	测试本地页面、公开网页	可以早学
Chrome	使用真实 Chrome 登录态	Gmail、公司后台、已登录网站	谨慎授权
Computer Use	操作桌面图形界面	只能点界面完成的流程	后学
GitHub	仓库、PR、Issue、CI	代码协作	有代码项目再学
OpenAI Developers	查官方开发资料	API、Agents、Codex、模型文档	很有用
Vercel / Netlify	部署网站	前端上线、预览环境	做完网页再学
Sentry	查线上错误	bug 定位、影响评估	团队项目再学

选择规则：

本地网页测试：优先 Browser。
需要真实网页登录态：考虑 Chrome，但每一步都要确认。
浏览器解决不了、必须操作桌面 App：再考虑 Computer Use。

11.1 部署网站

如果你做了个人主页，可以用 Netlify 或 Vercel 相关能力部署。

提示词：

text 复制代码

请检查当前项目是否适合部署到 Netlify 或 Vercel。先说明构建命令、输出目录、会创建什么站点、是否会公开访问。不要部署，等我确认。

确认后再让它部署。绑定自定义域名、修改 DNS、公开发布都属于高风险外部动作，必须人工确认。

12. Skills：把好流程沉淀成可复用能力

Skill 是给 Codex 的"行动指南 + 工具包"。它适合沉淀重复工作流，比如：

每周 GitHub 热门项目推荐。
中文技术文章审稿。
小红书图片卡片生成。
网页转 Markdown。
PPT 生成。
文档合并。

新手不要一上来闭门造 Skill。正确方法是：先跑通一次真实流程，再沉淀。

例子：自动写《本周 GitHub 热门项目推荐》。

第一步，找项目：

text 复制代码

请整理本周 GitHub 热门 AI 编程、研究、学习项目，列出项目名、链接、star 数、核心作用和适合人群。

第二步，筛选并写文章：

text 复制代码

从上面项目里选出 5 个最值得推荐的，写一篇《本周 GitHub 热门项目推荐》。每个项目必须包含：一句话价值、适合谁、亮点、使用门槛、推荐理由。

第三步，打磨格式：

text 复制代码

请加一个固定开头和结尾，生成适合公众号发布的 Markdown，并为每个项目设计一张配图提示词。

第四步，沉淀 Skill：

text 复制代码

请把以上流程整理成一个可复用 Skill。要求包括触发场景、输入要求、执行步骤、质量标准、输出格式、失败处理和示例提示词。

13. MCP：连接更多工具和知识源

MCP 可以理解为一种让 Codex 连接外部工具、数据库、知识库、服务的协议。小白不用手写配置，直接把目标 MCP 的官方链接给 Codex。

安装 MCP 的正确姿势：

给官方链接。
让 Codex 阅读 README。
让它说明权限和风险。
确认后安装。
重启或授权。
在设置里确认 MCP 服务器状态。
做一个最小调用测试。

提示词：

text 复制代码

请帮我安装这个 MCP：<官方链接>。先阅读 README，说明它能访问什么、需要哪些权限、会修改哪些配置文件、如何卸载。不要安装，等我确认。

推荐优先级：

先学：Chrome DevTools MCP、GitHub MCP、OpenAI Developers / 文档类 MCP。
做产品再学：Supabase、Neon、Vercel、Cloudflare。
做设计再学：Figma、ShadCN。
做内容再学：Replicate、图片或视频生成类 MCP。
企业或付费相关谨慎学：Stripe、内部数据库、公司后台类 MCP。

14. 自动化：让 Codex 定时工作

自动化不是普通提醒。普通提醒只是叫你，Codex 自动化可以按计划执行一套工作流。

有两类常见自动化：

独立自动化：按计划启动一个新任务，适合日报、周报、例行检查、定时生成内容。
线程自动化：定时回到同一个持久线程继续推进，适合监控反馈、跟进长期任务、等待外部状态变化。

新手第一条自动化只做低风险草稿：

text 复制代码

请帮我创建一个自动化任务：每周一上午 9 点，整理本项目过去一周新增 Markdown，生成周报草稿，保存到 reports/drafts，不自动发布、不发送消息、不删除或覆盖原文件。

自动化任务要写清：

什么时候运行。
在哪个项目或文件夹运行。
使用什么输入源。
产出什么格式。
是否允许发布、发消息、改线上内容。
失败时怎么报告。

15. Goals：给长期任务一条终点线

Goal 适合长时间、可验证、有明确完成标准的任务。它会让 Codex 持续工作，直到达到目标或需要你介入。

差的 Goal：

text 复制代码

按这个计划实现一下。

好的 Goal：

text 复制代码

把这个 Python 工具迁移到 Rust。完成标准：

1. 所有现有单元测试通过。
2. CLI 参数兼容旧版本。
3. README 更新迁移说明。
4. 性能基准不低于旧版本。
5. 每完成一个阶段报告一次。
6. 不要删除旧实现，直到我确认。

Goal 的核心是验证器。可用验证器包括：

单元测试。
端到端测试。
性能基准。
可复现 bug。
验证矩阵。
明确的人工验收清单。

没有验证器的长期任务容易变成许愿。Codex 会很努力，但你很难判断它是否真的完成。

16. 手机控制和 Appshots

如果你的版本支持手机控制，可以用手机端 ChatGPT 查看任务进度、批准权限、补充说明。任务实际运行在电脑环境里，手机只是控制入口。

使用前确认：

手机和电脑登录的是你自己的账号。
电脑端 Codex 处于你信任的项目里。
不要在手机上随手批准看不懂的高风险操作。

Appshots 是把当前窗口截图和文字上下文发送给 Codex 的能力。Mac 上常见触发方式是两边 command 按键一起按。

适合：

看到网页 bug，直接发给 Codex 修。
看到设计稿，让 Codex 还原成页面。
看到报错弹窗，让 Codex 判断原因。
看到复杂界面，让 Codex 解释当前状态。

涉及隐私窗口、聊天记录、后台系统、客户数据时，不要随便 Appshot。先确认画面里没有敏感信息。

17. 常见卡点和处理方式

17.1 登录失败

先检查网络和账号。不要把密码、验证码、API Key 直接发给 Codex。需要登录网页时，优先自己操作。

可以问：

text 复制代码

我现在卡在 Codex 登录。请只根据屏幕提示解释可能原因，不要让我提供密码、验证码或 API Key。

17.2 Codex 找不到文件

常见原因是项目文件夹选错了。

问：

text 复制代码

请告诉我你当前能看到的工作目录路径，并列出第一层文件。不要修改文件。

17.3 命令执行失败

不要急着让它重试。先让它解释错误：

text 复制代码

刚才命令失败了。请解释错误原因，区分是网络问题、权限问题、命令不存在、依赖缺失还是项目配置问题。先不要继续执行。

17.4 文件被改坏了

先停，不要连续追加修改。让 Codex 列出刚才改过的文件：

text 复制代码

请列出你刚才修改过的文件、每个文件改了什么、如何恢复到修改前。先不要执行恢复。

如果项目有 Git，再让它查看 diff：

text 复制代码

请查看当前 git diff，按文件说明变更。不要提交，不要回滚。

17.5 上下文满了

先整理，再压缩：

text 复制代码

请整理当前任务的 compact summary，包括目标、已改文件、关键决策、未完成事项、验证结果和下一步建议。

18. 新手避坑清单

不要让 Codex 一上来大改。先读项目、列计划、确认影响范围。
不要批准看不懂的高风险命令。让它解释命令用途、影响路径、回滚方案。
不要把长期规则只写在聊天里。重要规则写进 AGENTS.md。
不要让自动化一开始就自动发布、自动发消息、自动改线上内容。先产出草稿。
不要让它处理大文件时全量硬扫。先抽样、建索引、分批。
不要把"计划"当成果。最终要看文件、链接、测试、截图、报告。
不要忽略验证。代码跑测试，网页看预览，文档查结构，数据看样本。
不要在一个跑偏线程里死磕。用 Fork 回到好节点。
不要过度依赖自动 Memory。稳定规则写 AGENTS.md，可追溯事实写知识库。
不要让 Codex 替你做不可逆决定。删除、覆盖、发布、付款、发消息都要人工确认。

19. 从零开始的 7 天练习路线

第一天：完成 15 分钟安全任务。

text 复制代码

请先读取当前测试项目，不要修改文件。然后按我的要求创建一份 README.md，创建前说明会新增什么，创建后告诉我如何验收。

第二天：整理一个文件夹。

text 复制代码

请整理这个文件夹里的所有 Markdown，生成索引、主题分类和待办清单。保留原文件不动。

第三天：检查一个工具。

text 复制代码

请检查我是否安装了 GitHub CLI。先只报告版本和安装状态，不要安装。

第四天：做一个静态网页。

text 复制代码

请从零做一个个人主页，先问我必要问题，再生成计划，确认后实施。完成后在侧边栏预览并修布局。

第五天：写项目 AGENTS.md。

text 复制代码

请根据当前项目生成 AGENTS.md 草稿，包含项目说明、命令、风格、禁区、验证要求。先不要写入，等我确认。

第六天：安装或创建一个 Skill。

text 复制代码

请把我整理资料的流程沉淀为一个 Skill。要求以后输入一个资料文件夹，就能输出正式稿和整理报告。先给 Skill 草稿，不要写入。

第七天：创建一个低风险自动化。

text 复制代码

请创建一个每周一上午 9 点运行的自动化任务：整理本项目过去一周新增 Markdown，生成周报草稿，保存到 reports/drafts，不自动发布。

按这个路线练一周，你会掌握 Codex 的主要工作方式：给上下文、给目标、授权工具、检查计划、验收产物、沉淀流程。

20. 最后记住一句话

Codex 的能力上限很高，但新手的第一目标不是"让它全自动"，而是"让每一步都可解释、可验证、可撤回"。

你只要坚持这条规则，Codex 就会从一个看起来很复杂的 AI 工具，变成一个可以长期协作的工作台。