Codex 从零开始保姆级使用指南

这篇指南的目标很简单:让一个没用过 Codex 的人,在 15 分钟内安全完成第一件小事,然后知道下一步怎么继续学。

Codex 不是普通聊天窗口。它更像一个能进入你项目文件夹工作的 Agent:可以读文件、写文件、运行命令、打开预览、调用插件、沉淀规则,也会在高风险动作前请求授权。新手最重要的不是一次学完所有功能,而是先学会一个闭环:

text 复制代码
给项目 -> 给目标 -> 让 Codex 先读 -> 看计划 -> 授权低风险操作 -> 验收结果 -> 沉淀规则

1. 先完成一个 15 分钟安全任务

先别急着装插件、跑自动化、改代码。第一次用 Codex,建议只做一个低风险任务:让它在一个空文件夹里生成一份简单说明文档。

这个任务的好处是:不会碰你的重要文件,不需要开发环境,也能完整体验 Codex 的核心流程。

1.1 准备一个空文件夹

在电脑上新建一个文件夹,比如:

text 复制代码
codex-first-test

里面先不要放重要文件。你可以只放一个空白文本文件,也可以完全空着。

截图占位 01:新建空项目文件夹

截图内容:文件管理器里显示 codex-first-test 文件夹,里面为空或只有一个简单测试文件。

建议尺寸:16:9 横图,宽度 1200px 以上。

命名建议:images/01-empty-test-folder.png

1.2 在 Codex 里打开这个文件夹

选择刚才的新建的文件夹作为项目或工作目录。不同版本入口名字可能不同,常见叫法包括"Open folder""选择项目""打开工作区"等。

打开后,先输入:

text 复制代码
请先读取当前项目目录,不要修改任何文件。告诉我这里有哪些文件、你认为这是一个什么项目、下一步可以做什么。

你要看到的结果是:Codex 只读目录,不写文件,并说明当前文件夹很空。

如果它准备修改文件,先停下来,让它解释要改什么。

1.3 让 Codex 创建第一份 README

继续输入:

text 复制代码
请在当前项目里创建一份 README.md。内容只写三部分:

1. 这个文件夹是我的 Codex 新手测试项目。
2. 我今天要练习让 Codex 安全读写文件。
3. 下一步我会让 Codex 修改这份 README。

创建前先说明会新增哪个文件。创建后告诉我如何验收。

这一步你要关注三件事:

  • Codex 是否说明了会创建 README.md
  • 是否只在当前测试文件夹里写文件。
  • 创建后你能否在侧边栏、文件列表或编辑器里看到这个文件。

1.4 验收结果

打开 README.md,检查内容是否符合要求。然后让 Codex 做一次小修改:

text 复制代码
请把 README.md 里的"下一步我会让 Codex 修改这份 README"改成"我已经完成了第一次 Codex 文件修改练习"。只改这一句,改完告诉我改了哪里。

这一步是为了练习"明确修改范围"。你不要只说"优化一下"。第一次练习越小越好。

1.5 第一次练习的成功标准

完成后,你应该能回答这 5 个问题:

  1. Codex 当前在哪个文件夹里工作?
  2. 它新增了哪个文件?
  3. 它修改了哪一句?
  4. 这次操作有没有碰到测试文件夹外面的文件?
  5. 如果下次要改重要文件,你会先让它做什么?

推荐答案是:先让它读目录、列计划、说明影响范围,不要直接大改。

2. 你需要准备什么

你需要:

  • 一个可用的 ChatGPT / OpenAI 账号。
  • 一台电脑。
  • 稳定网络。部分地区访问、下载和登录需要代理。
  • 一个可以安全测试的文件夹。

下载入口可以从官方页面开始:

text 复制代码
https://chatgpt.com/zh-Hans-CN/codex/get-started/

登录方式以你当前界面为准。常见方式是用 ChatGPT 账号登录;如果界面提供 API Key 或其他登录方式,再按官方提示操作。

3. Codex 到底是什么

你可以把 Codex 理解成"带工具的 AI 工作台"。它的强项是:

  • 读懂本地项目文件和上下文。
  • 写代码、改文档、生成网页、表格、PPT、PDF 等产物。
  • 在你的授权范围内执行终端命令。
  • 通过 Browser、Chrome、Computer Use、MCP、插件等能力连接外部世界。
  • AGENTS.md、Memory、持久线程保存长期规则和工作上下文。
  • 用自动化和 Goals 处理长期、重复、可验证的任务。

普通 ChatGPT 更像"你发材料,它在对话里回答"。Codex 更像"你给它一个工作空间,它能在里面动手"。这个差异很重要,因为一旦能动手,就必须学会权限、边界和验收。

4. 文件、项目和权限

4.1 什么是项目

Codex 里的"项目"基本对应你电脑上的一个文件夹。你选中一个文件夹后,Codex 会把这个文件夹当成主要工作范围。

项目不一定是代码仓库。它可以是:

  • 写作草稿文件夹。
  • 会议记录文件夹。
  • 视频素材文件夹。
  • 个人知识库。
  • 网站或软件项目。

好用的第一句话是:

text 复制代码
请先读取当前项目结构,不要修改文件。告诉我这个项目大概是做什么的、核心文件在哪里、下一步应该看什么。

4.2 权限模式怎么理解

不同版本的权限名称会变化,但你可以按风险理解:

权限类型 你可以怎么理解 新手建议
只读或低权限 Codex 主要读取项目,不随便写文件或执行敏感命令 适合第一次探索项目
需要审批 Codex 想写文件、运行命令、访问外部路径时会请求你批准 最适合新手
高权限或完全访问 Codex 能做更大范围的操作 不建议新手长期打开

审批弹窗出现时,不要只看"允许"按钮。你要看三件事:

  1. 它要执行什么命令或修改什么文件。
  2. 影响范围是不是当前项目。
  3. 操作能不能撤回。

4.3 高风险动作判断表

遇到这些动作,先拒绝或让 Codex 解释清楚:

动作 风险 正确问法
删除文件 可能不可恢复 "先列出要删除的文件和原因,不要执行。"
批量重命名 可能把素材顺序打乱 "先输出重命名方案,等我确认。"
安装系统工具 可能改环境 "先检查现状,说明安装方式和影响路径。"
修改 shell 配置 可能影响终端 "先说明会改哪个配置文件,给回滚方式。"
发布、发送、付款 不可逆或有外部影响 "只生成草稿,不要直接发送/发布/付款。"
使用真实登录态 涉及隐私和账号 "只读取必要信息,操作前逐步确认。"

5. 文件操作能做什么

文件操作是 Codex 和普通聊天工具最大的区别之一。

典型用法:

text 复制代码
请扫描这个文件夹里的所有 Markdown,按主题分组,生成一个索引文件。保留原文件不动。
text 复制代码
请整理这些会议记录,输出一份按项目、负责人、待办事项分类的汇总。先不要改原始记录。
text 复制代码
请检查这个项目的 README 是否过期,先列出问题和证据,不要直接改。
text 复制代码
请把这个文件夹里的视频素材按实际内容重命名。先统计数量,抽取关键帧判断内容,再给出重命名方案,等我确认后再执行。

新手要记住一个规则:第一次让 Codex 处理重要文件时,先让它"读"和"列方案",不要直接"改"。

6. 命令行和环境安装

Codex 在授权后可以执行终端命令。对新手最有价值的地方是:它能帮你检查和配置开发环境。

好的命令行任务应该包含三步:

  1. 先检查现状。
  2. 缺什么再安装。
  3. 安装后验证结果。

可以这样说:

text 复制代码
请检查我的电脑是否已安装 Node.js、Git 和 pnpm。先只检查并报告版本,不要安装。确认缺什么后,再给出安装计划。

确认计划后再说:

text 复制代码
请按刚才的计划安装缺失工具。涉及系统级修改、删除文件、修改 shell 配置、申请管理员权限前,必须先问我。安装后验证版本。

不要只说:

text 复制代码
帮我装一下 Node。

这句话太短,Codex 不知道你能接受哪种安装方式,也不知道能不能修改系统环境。

6.1 安装新 CLI 或工具

如果工具很知名,可以直接说名字:

text 复制代码
请检查我是否安装了 GitHub CLI。若未安装,先说明官方安装方式和影响路径,等我确认后再安装。安装完成后验证 gh 是否可用,并告诉我下一步如何登录。

如果工具不够知名,给官方链接:

text 复制代码
请根据这个 GitHub 仓库的 README 安装这个 CLI:<链接>。只使用官方文档里的安装方式,安装后运行最小示例验证。

同名项目很多。你不给官方链接,Codex 有概率找到不相关项目。

6.2 Agent IDE 为什么有用

Codex 能查看和修改文件,但精细编辑时,专业编辑器仍然有用。你可以安装 Cursor、VS Code 等编辑器,把它们作为人工检查和精修工具。

提示词:

text 复制代码
请检查我是否已安装 Cursor 或 VS Code。不要安装新软件,先告诉我当前可用的编辑器,以及 Codex 能否从当前项目打开它。

7. 上下文、额度和压缩

上下文就是当前线程里 Codex 能参考的信息,包括你的对话、文件片段、工具结果、计划、错误信息等。

上下文越满,Codex 越容易变慢、变贵、变钝。你会看到它开始忘记前面约定、重复问问题,或者抓不住重点。

任务告一段落时,可以让它先整理:

text 复制代码
请把当前任务的关键决策、文件路径、已完成事项、未完成事项、验证结果整理成一段 compact summary。

然后再压缩上下文。不同版本的压缩入口不同,有的支持输入:

text 复制代码
/compact

以你当前界面为准。

8. 让 Codex 下次还懂你:AGENTS.md 和 Memory

Codex 的长期规则不要只放在聊天里。聊天会变长、会压缩、会丢细节。稳定规则应该写进文件。

8.1 全局 AGENTS.md

全局规则适合写你的长期偏好,比如:

markdown 复制代码
# 我的 Codex 使用偏好

- 默认用中文回答。
- 先给结论,再给依据。
- 修改文件前先读相关上下文。
- 不要删除文件,除非我明确要求。
- 生成长文时保留原始信息点,不要为了流畅删掉细节。
- 代码任务完成后说明验证方式和未验证项。

入口以当前界面为准,常见位置在设置、个性化、自定义指令或类似入口。

8.2 项目级 AGENTS.md

项目级规则只对当前项目生效,文件名通常是:

text 复制代码
AGENTS.md

注意大写。

项目有了一定内容后,可以让 Codex 生成草稿:

text 复制代码
请阅读当前项目结构和 README,生成一份项目级 AGENTS.md 草稿。内容包括项目目标、目录说明、运行命令、测试命令、代码风格、禁止修改的路径、交付前验证要求。先给草稿,不要写入文件,等我确认。

项目级 AGENTS.md 的价值是:你清空对话或开新线程后,Codex 仍然能快速理解项目规则。

8.3 自动 Memory

自动 Memory 用来保存一些可复用偏好。它适合辅助召回,不适合承载严肃规则。

建议:

  • 稳定规则写进 AGENTS.md
  • 可追溯事实写进知识库或项目文档。
  • 临时偏好可以留在当前线程。
  • 错误记忆要及时删除或更正。

9. 大型任务怎么交给 Codex

复杂任务不要一上来就让 Codex 直接做。先让它计划。

适合先计划的任务:

  • 从零做网站。
  • 重构一个项目。
  • 整理几十份资料。
  • 做一套 PPT。
  • 写一个自动化工作流。
  • 安装一套复杂环境。

推荐流程:

  1. 选项目文件夹。
  2. 描述目标。
  3. 让 Codex 提问或生成计划。
  4. 你检查计划,补充约束。
  5. 执行。
  6. 中途干预。
  7. 验收结果。

提示词:

text 复制代码
我想从零做一个个人主页。目标是展示我的简介、作品、联系方式和最近文章。请先问我必要问题,生成实施计划,不要直接写代码。计划里要列出会创建哪些文件、如何预览、如何验收。

中途发现方向不对,可以直接补充:

text 复制代码
刚才的视觉方向太商务了。请改成更像独立创作者主页,减少营销感。先说明会改哪些文件,再执行。

很多时候 Codex 不会立刻打断当前工具调用,而是在下一个合适节点吸收你的新指令。所以你越早干预,返工越少。

9.1 Fork 怎么用

如果一个线程前面聊得很好,后面跑偏了,可以从合适节点 Fork。Fork 适合:

  • 想试另一个方案。
  • 想回到没跑偏的历史节点。
  • 不想污染主线对话。

不要在一个跑偏线程里无限纠缠。方向岔开就分支。

10. 侧边栏、浏览器预览和批注

Codex 的侧边栏可以展示 Markdown、表格、PPT、PDF、网页、代码 diff 等产物。网页项目尤其适合直接预览。

提示词:

text 复制代码
请启动本地开发服务器,在 Codex 侧边栏打开预览。检查桌面端和手机端布局,发现明显问题直接修。修完告诉我改了哪些文件。

内置浏览器常用于:

  • 预览本地网页。
  • 测试按钮、表单、跳转。
  • 检查移动端布局。
  • 对页面元素做批注。

轻量项目可以只做一个 index.html,直接预览。静态展示、交互小工具、浏览器幻灯片、数据分析小页面都很适合。

11. 插件:连接外部服务

插件的作用是把 Codex 接到外部平台和工具上。新手先知道用途,不要一口气全装。

常见插件或外部能力:

能力 用途 适合场景 新手建议
Browser 应用内浏览器自动化 测试本地页面、公开网页 可以早学
Chrome 使用真实 Chrome 登录态 Gmail、公司后台、已登录网站 谨慎授权
Computer Use 操作桌面图形界面 只能点界面完成的流程 后学
GitHub 仓库、PR、Issue、CI 代码协作 有代码项目再学
OpenAI Developers 查官方开发资料 API、Agents、Codex、模型文档 很有用
Vercel / Netlify 部署网站 前端上线、预览环境 做完网页再学
Sentry 查线上错误 bug 定位、影响评估 团队项目再学

选择规则:

  • 本地网页测试:优先 Browser。
  • 需要真实网页登录态:考虑 Chrome,但每一步都要确认。
  • 浏览器解决不了、必须操作桌面 App:再考虑 Computer Use。

11.1 部署网站

如果你做了个人主页,可以用 Netlify 或 Vercel 相关能力部署。

提示词:

text 复制代码
请检查当前项目是否适合部署到 Netlify 或 Vercel。先说明构建命令、输出目录、会创建什么站点、是否会公开访问。不要部署,等我确认。

确认后再让它部署。绑定自定义域名、修改 DNS、公开发布都属于高风险外部动作,必须人工确认。

12. Skills:把好流程沉淀成可复用能力

Skill 是给 Codex 的"行动指南 + 工具包"。它适合沉淀重复工作流,比如:

  • 每周 GitHub 热门项目推荐。
  • 中文技术文章审稿。
  • 小红书图片卡片生成。
  • 网页转 Markdown。
  • PPT 生成。
  • 文档合并。

新手不要一上来闭门造 Skill。正确方法是:先跑通一次真实流程,再沉淀。

例子:自动写《本周 GitHub 热门项目推荐》。

第一步,找项目:

text 复制代码
请整理本周 GitHub 热门 AI 编程、研究、学习项目,列出项目名、链接、star 数、核心作用和适合人群。

第二步,筛选并写文章:

text 复制代码
从上面项目里选出 5 个最值得推荐的,写一篇《本周 GitHub 热门项目推荐》。每个项目必须包含:一句话价值、适合谁、亮点、使用门槛、推荐理由。

第三步,打磨格式:

text 复制代码
请加一个固定开头和结尾,生成适合公众号发布的 Markdown,并为每个项目设计一张配图提示词。

第四步,沉淀 Skill:

text 复制代码
请把以上流程整理成一个可复用 Skill。要求包括触发场景、输入要求、执行步骤、质量标准、输出格式、失败处理和示例提示词。

13. MCP:连接更多工具和知识源

MCP 可以理解为一种让 Codex 连接外部工具、数据库、知识库、服务的协议。小白不用手写配置,直接把目标 MCP 的官方链接给 Codex。

安装 MCP 的正确姿势:

  1. 给官方链接。
  2. 让 Codex 阅读 README。
  3. 让它说明权限和风险。
  4. 确认后安装。
  5. 重启或授权。
  6. 在设置里确认 MCP 服务器状态。
  7. 做一个最小调用测试。

提示词:

text 复制代码
请帮我安装这个 MCP:<官方链接>。先阅读 README,说明它能访问什么、需要哪些权限、会修改哪些配置文件、如何卸载。不要安装,等我确认。

推荐优先级:

  • 先学:Chrome DevTools MCP、GitHub MCP、OpenAI Developers / 文档类 MCP。
  • 做产品再学:Supabase、Neon、Vercel、Cloudflare。
  • 做设计再学:Figma、ShadCN。
  • 做内容再学:Replicate、图片或视频生成类 MCP。
  • 企业或付费相关谨慎学:Stripe、内部数据库、公司后台类 MCP。

14. 自动化:让 Codex 定时工作

自动化不是普通提醒。普通提醒只是叫你,Codex 自动化可以按计划执行一套工作流。

有两类常见自动化:

  • 独立自动化:按计划启动一个新任务,适合日报、周报、例行检查、定时生成内容。
  • 线程自动化:定时回到同一个持久线程继续推进,适合监控反馈、跟进长期任务、等待外部状态变化。

新手第一条自动化只做低风险草稿:

text 复制代码
请帮我创建一个自动化任务:每周一上午 9 点,整理本项目过去一周新增 Markdown,生成周报草稿,保存到 reports/drafts,不自动发布、不发送消息、不删除或覆盖原文件。

自动化任务要写清:

  • 什么时候运行。
  • 在哪个项目或文件夹运行。
  • 使用什么输入源。
  • 产出什么格式。
  • 是否允许发布、发消息、改线上内容。
  • 失败时怎么报告。

15. Goals:给长期任务一条终点线

Goal 适合长时间、可验证、有明确完成标准的任务。它会让 Codex 持续工作,直到达到目标或需要你介入。

差的 Goal:

text 复制代码
按这个计划实现一下。

好的 Goal:

text 复制代码
把这个 Python 工具迁移到 Rust。完成标准:

1. 所有现有单元测试通过。
2. CLI 参数兼容旧版本。
3. README 更新迁移说明。
4. 性能基准不低于旧版本。
5. 每完成一个阶段报告一次。
6. 不要删除旧实现,直到我确认。

Goal 的核心是验证器。可用验证器包括:

  • 单元测试。
  • 端到端测试。
  • 性能基准。
  • 可复现 bug。
  • 验证矩阵。
  • 明确的人工验收清单。

没有验证器的长期任务容易变成许愿。Codex 会很努力,但你很难判断它是否真的完成。

16. 手机控制和 Appshots

如果你的版本支持手机控制,可以用手机端 ChatGPT 查看任务进度、批准权限、补充说明。任务实际运行在电脑环境里,手机只是控制入口。

使用前确认:

  • 手机和电脑登录的是你自己的账号。
  • 电脑端 Codex 处于你信任的项目里。
  • 不要在手机上随手批准看不懂的高风险操作。

Appshots 是把当前窗口截图和文字上下文发送给 Codex 的能力。Mac 上常见触发方式是两边 command 按键一起按。

适合:

  • 看到网页 bug,直接发给 Codex 修。
  • 看到设计稿,让 Codex 还原成页面。
  • 看到报错弹窗,让 Codex 判断原因。
  • 看到复杂界面,让 Codex 解释当前状态。

涉及隐私窗口、聊天记录、后台系统、客户数据时,不要随便 Appshot。先确认画面里没有敏感信息。

17. 常见卡点和处理方式

17.1 登录失败

先检查网络和账号。不要把密码、验证码、API Key 直接发给 Codex。需要登录网页时,优先自己操作。

可以问:

text 复制代码
我现在卡在 Codex 登录。请只根据屏幕提示解释可能原因,不要让我提供密码、验证码或 API Key。

17.2 Codex 找不到文件

常见原因是项目文件夹选错了。

问:

text 复制代码
请告诉我你当前能看到的工作目录路径,并列出第一层文件。不要修改文件。

17.3 命令执行失败

不要急着让它重试。先让它解释错误:

text 复制代码
刚才命令失败了。请解释错误原因,区分是网络问题、权限问题、命令不存在、依赖缺失还是项目配置问题。先不要继续执行。

17.4 文件被改坏了

先停,不要连续追加修改。让 Codex 列出刚才改过的文件:

text 复制代码
请列出你刚才修改过的文件、每个文件改了什么、如何恢复到修改前。先不要执行恢复。

如果项目有 Git,再让它查看 diff:

text 复制代码
请查看当前 git diff,按文件说明变更。不要提交,不要回滚。

17.5 上下文满了

先整理,再压缩:

text 复制代码
请整理当前任务的 compact summary,包括目标、已改文件、关键决策、未完成事项、验证结果和下一步建议。

18. 新手避坑清单

  • 不要让 Codex 一上来大改。先读项目、列计划、确认影响范围。
  • 不要批准看不懂的高风险命令。让它解释命令用途、影响路径、回滚方案。
  • 不要把长期规则只写在聊天里。重要规则写进 AGENTS.md
  • 不要让自动化一开始就自动发布、自动发消息、自动改线上内容。先产出草稿。
  • 不要让它处理大文件时全量硬扫。先抽样、建索引、分批。
  • 不要把"计划"当成果。最终要看文件、链接、测试、截图、报告。
  • 不要忽略验证。代码跑测试,网页看预览,文档查结构,数据看样本。
  • 不要在一个跑偏线程里死磕。用 Fork 回到好节点。
  • 不要过度依赖自动 Memory。稳定规则写 AGENTS.md,可追溯事实写知识库。
  • 不要让 Codex 替你做不可逆决定。删除、覆盖、发布、付款、发消息都要人工确认。

19. 从零开始的 7 天练习路线

第一天:完成 15 分钟安全任务。

text 复制代码
请先读取当前测试项目,不要修改文件。然后按我的要求创建一份 README.md,创建前说明会新增什么,创建后告诉我如何验收。

第二天:整理一个文件夹。

text 复制代码
请整理这个文件夹里的所有 Markdown,生成索引、主题分类和待办清单。保留原文件不动。

第三天:检查一个工具。

text 复制代码
请检查我是否安装了 GitHub CLI。先只报告版本和安装状态,不要安装。

第四天:做一个静态网页。

text 复制代码
请从零做一个个人主页,先问我必要问题,再生成计划,确认后实施。完成后在侧边栏预览并修布局。

第五天:写项目 AGENTS.md

text 复制代码
请根据当前项目生成 AGENTS.md 草稿,包含项目说明、命令、风格、禁区、验证要求。先不要写入,等我确认。

第六天:安装或创建一个 Skill。

text 复制代码
请把我整理资料的流程沉淀为一个 Skill。要求以后输入一个资料文件夹,就能输出正式稿和整理报告。先给 Skill 草稿,不要写入。

第七天:创建一个低风险自动化。

text 复制代码
请创建一个每周一上午 9 点运行的自动化任务:整理本项目过去一周新增 Markdown,生成周报草稿,保存到 reports/drafts,不自动发布。

按这个路线练一周,你会掌握 Codex 的主要工作方式:给上下文、给目标、授权工具、检查计划、验收产物、沉淀流程。

20. 最后记住一句话

Codex 的能力上限很高,但新手的第一目标不是"让它全自动",而是"让每一步都可解释、可验证、可撤回"。

你只要坚持这条规则,Codex 就会从一个看起来很复杂的 AI 工具,变成一个可以长期协作的工作台。

相关推荐
Sopaco19 小时前
Hermes Agent 代码仓库打包工具使用指南(repomix-rs 高性能版)
ai编程
IT 行者20 小时前
GitHub Spec Kit 实战(五):/speckit.tasks 怎么拆——Spec Kit 五部曲收官
java·ai编程·claude
沈麽鬼20 小时前
别瞎用AI写代码!90%开发者都搞错了AI编程的底层逻辑
人工智能·ai编程·trae
林三的日常20 小时前
AI编程工具后端选型指南
ai编程
不爱洗脚的小滕20 小时前
【Agent】如何为 AI Agent 设计高可用的 Tools
人工智能·aigc·ai编程·rag
阿里云云原生20 小时前
Agent = Model + Harness 是伪命题?企业级 Agent 落地必须补齐的“约束基建”
agent
Code_Artist21 小时前
🦜用 GoAI 从零打造一个 AI Agent 脚手架工程:重新定义智能体开发范式!
go·agent·ai编程
SelectDB21 小时前
2026 SelectDB AI 产品发布会:Agent Native 数据基础设施能力全景发布
数据分析·aigc·agent
ZzT21 小时前
费时费力做的 Spec 和知识库,Agent 真的受到约束了么?
openai·ai编程·claude
阿里云云原生21 小时前
Stripe、Ramp、Coinbase 都在用的 Coding Agent 架构,究竟有何奥秘?
agent