2026 年 4 月实测:OpenAI Codex 保姆级教程,从安装到 MCP、Skills 与多智能体协作

文章目录

    • 前言
    • [一、Codex 是什么,适合谁用](#一、Codex 是什么,适合谁用)
    • 二、开始前需要准备什么
    • [三、先理解 Codex 的工作方式](#三、先理解 Codex 的工作方式)
    • 四、常用命令:先记住这几个就够了
    • [五、Codex 的四种常见入口](#五、Codex 的四种常见入口)
    • [六、MCP 是什么,为什么它能把 Codex 从"会写代码"变成"会做事情"](#六、MCP 是什么,为什么它能把 Codex 从“会写代码”变成“会做事情”)
    • [七、Skills:让 Codex 具备可复用的专长](#七、Skills:让 Codex 具备可复用的专长)
    • 八、从"会用"到"用好":几个很有价值的进阶工作流
    • [九、生态扩展:OpenSpec 与社区 Superpowers](#九、生态扩展:OpenSpec 与社区 Superpowers)
      • [1. OpenSpec:适合把 AI 开发流程做得更规范](#1. OpenSpec:适合把 AI 开发流程做得更规范)
      • [2. Superpowers:适合强化工作流纪律](#2. Superpowers:适合强化工作流纪律)
    • [十、使用 Codex 时最容易踩的坑](#十、使用 Codex 时最容易踩的坑)
    • 十一、总结
    • 参考链接

前言

这两年 AI 编程工具很多,但真正能进入开发流程、而不是只停留在聊天窗口里的并不多,Codex 算是其中一个。它不只是补全代码,也不只是回答问题,而是可以在项目上下文里读文件、改代码、执行命令、做审查,并通过外部工具把任务继续往前推进。

第一次上手 Codex,通常会卡在两个地方:不知道从哪里开始,以及不知道哪些能力值得优先学。更实际的学习顺序其实很简单,先跑通 安装启动,再熟悉 常用命令AGENTS.md 和审批机制,最后再去理解 MCPSkillsCodex App 和多智能体协作。文中涉及的时效性信息,已经结合截至 2026 年 4 月 12 日 的公开资料做了校验;模型列表、权限策略和部分入口后续仍可能继续更新,实际使用时请以官方页面为准。

一、Codex 是什么,适合谁用

OpenAI 对 Codex 的定位,已经不只是"能写代码的模型",而是一个覆盖 CLIIDEAppCloud 的编码代理。它更适合下面这些场景:

  • 你要快速理解一个陌生项目,想让 AI 先帮你读结构、找入口、梳理依赖。
  • 你要做小到中等规模的开发任务,希望 AI 不只是给建议,而是真的去修改文件、执行命令、补测试。
  • 你要做代码审查、排查问题、整理工作流,希望 AI 能参与工程化步骤,而不是只停留在聊天窗口里。
  • 你希望把 GitHubFigmaVercelSupabase 等外部系统接进同一套开发流程。

如果你只是偶尔问几个语法问题,那么普通聊天模型已经够用;但如果你想让 AI 更像一个"会干活的开发搭子",Codex 才更值得花时间了解。

二、开始前需要准备什么

对新手来说,先把下面 4 件事准备好:

  • 一个可用的 OpenAI/ChatGPT 账号。
  • 本地 Node.js 环境。
  • 基本的 Git 使用能力。
  • 一个准备让 Codex 操作的项目目录。
  1. 安装 Node.js

Codex CLI 依赖 Node.js 运行,所以第一步是安装 Node.js。

bash 复制代码
node -v

如果能够正常返回版本号,例如 v18.x 或更高版本,说明运行环境已经就绪。

  1. 安装 Codex CLI

Codex 的官方开源仓库地址如下:

OpenAI Codex GitHub 仓库

CLI 安装命令非常直接:

bash 复制代码
npm install -g @openai/codex

安装完成后,执行下面的命令验证:

bash 复制代码
codex --version

如果能看到版本号,就说明 CLI 已经安装成功。

  1. 首次启动 Codex

进入任意一个项目目录,在终端执行:

bash 复制代码
codex

首次启动时,通常会引导你登录 ChatGPT 账号或按当前配置完成鉴权。登录成功后,Codex 就能在当前目录中工作。

这里有一个很重要的认知:Codex 默认不是"无脑全权限"运行。它会根据当前会话模式、沙箱规则和审批策略来决定哪些操作可以直接执行,哪些操作需要你确认。这一点在后面讲权限和 MCP 时尤其关键。

三、先理解 Codex 的工作方式

很多人第一次用 Codex,会把它当成"更强一点的聊天窗口"。这是最容易低估它的地方。

Codex 的核心不是单轮回答,而是 基于上下文持续执行任务。它会结合下面几类信息来工作:

  • 当前项目目录下的文件和代码。
  • 你的对话指令。
  • 项目约束文件,例如 AGENTS.md
  • 当前审批模式、沙箱权限和规则配置。
  • 已接入的 MCP 工具、skills、插件或自动化工作流。

换句话说,Codex 不是只回答"怎么写",而是会进入"怎么做"。

权限与审批为什么重要

截至 2026 年 4 月 12 日,官方对 Codex 的一个强调点就是"默认安全、可配置扩展"。默认情况下,Codex 会受限于当前项目目录和权限策略;像联网、安装依赖、访问系统敏感目录之类的动作,通常需要审批。

这套机制的意义非常实际:

  • 你可以放心让它先读项目、分析问题,而不是一上来就给完全权限。
  • 当它需要执行高风险命令时,你能明确看到它想做什么。
  • 团队协作时,你可以通过规则和约束统一代理行为。

对于初学者,一个稳妥建议是:先用保守权限模式熟悉,再逐步放开。不要一开始就追求"全自动",否则容易把试用阶段变成踩坑阶段。

为什么建议尽早使用 AGENTS.md

AGENTS.md 可以理解为"项目级使用说明书"。你可以通过 /init 让 Codex 先通读当前目录,再把关键约束写入这个文件,后续会话都会把它当作上下文的一部分。

它特别适合写这些内容:

  • 项目结构和关键目录说明。
  • 代码风格约束。
  • 测试、构建、发布命令。
  • 哪些文件不要乱改。
  • 团队协作习惯和命名约定。

如果你用 Codex 处理的是一个持续维护的项目,而不是一次性试验项目,那么 AGENTS.md 基本属于越早建越划算。

四、常用命令:先记住这几个就够了

Codex 的斜杠命令会随着版本演进而调整,但对日常使用来说,下面这几个最值得优先掌握。部分版本里会看到 /approvals,也有版本会把相关概念进一步归并到更明确的权限配置中,所以以你当前客户端实际显示为准。

命令 作用 典型用法
/model 切换模型与推理强度 在速度优先和质量优先之间切换
/approvals 调整审批和权限模式 控制只读、自动编辑、完全访问等模式
/review 审查当前代码改动 提交前做一次 AI 自查
/new 开新对话 切换任务、避免旧上下文干扰
/resume 恢复历史会话 接着之前未完成的任务继续做
/init 生成或更新 AGENTS.md 让 Codex 更懂你的项目
/compact 压缩上下文 长会话里减少上下文膨胀
/mcp 查看或管理 MCP 工具 检查当前可用外部能力

如果你只打算先掌握最实用的三项,我建议从这三个开始:

  • /init:把项目规则讲清楚。
  • /review:让 Codex 参与代码自查。
  • /compact:避免长对话越聊越"跑偏"。

和模型相关的界面也会随着版本更新不断变化,所以这里更建议你记住"会切换、会查看、会根据任务选推理强度"这个使用思路,而不是死记某个时刻的模型列表。

五、Codex 的四种常见入口

截至 2026 年 4 月 12 日,Codex 已经不只是一个命令行工具,而是逐步形成了多入口协同的使用方式。

CLI:最适合开发者的核心入口

CLI 仍然是最推荐的入口,因为它最接近真实开发流程:

  • 能直接操作本地项目。
  • 能结合终端命令、Git、测试和构建流程。
  • 对权限、规则、MCP、skills 的控制更细。

如果你习惯在终端里工作,CLI 基本就是最自然的选择。

IDE:更适合减少上下文切换

如果你更喜欢在编辑器中完成大部分工作,那么 IDE 集成会更舒服。官方资料已经明确覆盖 VS CodeCursorWindsurf 等入口,相关资源里也持续扩展到更多 IDE 场景。

它的价值在于:

  • 边看代码边与 Codex 协作。
  • 减少"终端 + 编辑器 + 浏览器"来回切换。
  • 更适合逐文件、逐模块的小步迭代。

Codex App:适合管理更长、更复杂的任务

OpenAI 在 2026 年 2 月 2 日 正式发布了 Codex App,并在 2026 年 3 月 4 日 更新中宣布 Windows 版本可用。这个入口的重点不是"把 CLI 套个壳",而是更偏向一个 agent command center

  • 可以同时管理多个代理。
  • 可以并行运行任务。
  • 能配合隔离 worktree 和可审阅 diff 工作。
  • 更适合长周期、多步骤、多人协作的开发任务。

如果你只是写一点小功能,CLI 足够;但如果你开始进入多任务并行、长期上下文维护、批量代码审查,App 的价值会明显放大。

下面这些界面截图,能更直观看到 Codex App 在设置、任务规划和运行视图上的风格:

Codex App 的价值不只是把命令行做成图形界面,而是让它成为任务规划和执行协同的入口。下面这张图是一次实际项目流程的拼接示意:顶部是 Codex App 中的需求拆解与任务推进,中间是 Navicat 里的 MySQL 商品表,底部是本地浏览器中的页面结果。它更适合用来说明一次小项目从需求生成、数据落库到页面联调的完整链路,而不是展示 Codex App 的单一界面能力。

Cloud / Web:适合跨设备和轻量协作

Codex 也可以通过云端入口使用:

Codex 云端入口

云端入口的好处是:

  • 不依赖固定设备。
  • 适合快速发起任务或查看历史任务。
  • 和 App、CLI、IDE 形成联动。

如果你想看使用量或额度信息,也可以在相关设置页面查看:

Codex 使用情况查看

六、MCP 是什么,为什么它能把 Codex 从"会写代码"变成"会做事情"

MCP,全称 Model Context Protocol,可以把它理解成一套让 AI 安全调用外部工具和服务的标准接口。对 Codex 来说,MCP 的价值非常直接:它不再只依赖本地文件,而是可以连接外部系统,把"分析"推进到"操作"。

典型例子包括:

  • GitHub:查看仓库、PR、Issue、提交记录。
  • Figma:获取设计稿和视觉参考。
  • Vercel:连接部署流程。
  • Supabase:接入数据库、后端服务和开发环境。

这也是为什么很多人会感觉 Codex 在"工程化场景"里明显强于普通聊天机器人。它不只是会解释,而是开始能串联工作流。

不过这里一定要强调一个原则:MCP 接得越多,越要重视权限边界。新手最容易犯的错误,就是一看到能接很多系统,就把权限一次性全开。更稳妥的做法是:

  • 先接最刚需的 1 到 2 个系统。
  • 优先只开只读或低风险操作。
  • 确认工作流稳定后,再逐步放开写操作。

七、Skills:让 Codex 具备可复用的专长

如果说 AGENTS.md 是项目级规则,那么 skills 更像"可复用的专业工作流模块"。

OpenAI 已经开源了官方技能目录:

openai/skills

截至当前版本,官方的几个要点值得记住:

  • .system 目录下的 skills 会随新版 Codex 自动安装。
  • 你可以在 Codex 中通过 $skill-installer 安装 curated 或 experimental skills。
  • skills 不只是提示词,还可以包含脚本、资源文件和工作流程说明。

这类能力对下面几种任务尤其有帮助:

  • 前端页面生成与视觉对齐。
  • 文档生成与规划拆解。
  • 图像处理。
  • 项目管理、部署、测试等固定流程。

如果你需要额外能力,也可以安装社区 skills。例如你笔记里提到的 pptx 类技能,就很适合处理演示文稿、模板和自动化生成任务。

bash 复制代码
$skill-installer https://github.com/anthropics/skills/tree/main/skills/pptx

需要注意的是:官方 skills社区 skills 是两件事。官方技能更强调兼容性和持续维护;社区技能往往更灵活,但最好先确认适配情况,再放进长期工作流。

如果你主要用 Codex 做前端、文档和专项任务,skills 的使用体验会非常明显,因为它本质上是在给代理增加"现成的方法论"。下面两张图,分别对应技能搜索安装和显式调用的典型界面:

八、从"会用"到"用好":几个很有价值的进阶工作流

/review 让 Codex 参与代码审查

这是最容易马上提升效率的用法。很多人把 AI 主要用在"写代码",但在实际开发中,发现问题 往往比 生成代码 更值钱。你可以在修改完成后,让 Codex 先做一轮检查:

  • 有没有明显的语法问题。
  • 有没有逻辑缺陷或边界条件遗漏。
  • 有没有测试缺口。
  • 有没有潜在的权限、安全、并发风险。

先让 AI 做第一轮筛查,再进入人工 Review,会明显更高效。

用 Worktree 和多代理并行处理任务

Codex App 的一个重要方向,就是让多个代理在隔离工作区中并行推进任务。这个思路很适合下面这些场景:

  • 一个代理负责实现功能。
  • 一个代理负责代码审查。
  • 一个代理负责测试或回归检查。
  • 一个代理负责文档整理。

本质上,它把"一个人同时切很多上下文"的痛苦,改造成"多个代理各做各的,再统一收口"。对复杂项目来说,这会比单线程聊天高效得多。

把设计、开发、部署串成一条链路

当你把 Figma skillMCP部署平台项目规则 接起来之后,Codex 的价值会进一步放大。一个完整工作流通常会变成:

设计输入 -> 生成实现方案 -> 修改代码 -> 运行验证 -> 代码审查 -> 部署或提交 PR

这也是为什么现在很多团队不再把 Codex 当"辅助答题工具",而是把它看作开发流程中的一个协作者。

九、生态扩展:OpenSpec 与社区 Superpowers

这一部分不是 Codex 的"必装项",但如果你已经不满足于基础使用,它们会很值得关注。

1. OpenSpec:适合把 AI 开发流程做得更规范

OpenSpec GitHub 仓库

OpenSpec 更像一个 spec-driven development 工作流工具。它把一次改动拆成更清晰的几个工件:

  • proposal.md:为什么要做这次改动。
  • specs/:需求增量说明。
  • design.md:技术设计。
  • tasks.md:执行清单。

它的价值不在于"替代 Codex",而在于给 Codex 这样的代理提供更清晰的结构化输入。尤其是在多人协作、需求频繁变化、老项目维护场景里,这种结构化方法会比"想到哪改到哪"稳很多。

2. Superpowers:适合强化工作流纪律

superpowers本质上是一套强调流程纪律的社区技能体系,例如:

  • brainstorming
  • writing-plans
  • systematic-debugging
  • using-git-worktrees
  • verification-before-completion

这类工具的优势是:它不只是让 AI 更能干,而是让 AI 更"守流程"。比如先做需求澄清、再写计划、再实施、最后验证,这种方式对复杂任务尤其有帮助。

但同样要注意:Superpowers 属于社区扩展,不是 Codex 官方默认能力。如果你打算长期使用,建议先挑最符合自己习惯的几个,再逐步纳入工作流。

bash 复制代码
Fetch and follow instructions from https://raw.githubusercontent.com/obra/superpowers/refs/heads/main/.codex/INSTALL.md

十、使用 Codex 时最容易踩的坑

一上来就开完全权限

很多人为了"省一次确认",直接把权限开到很高,最后反而因为误操作、错误安装或无关改动把项目搞乱。更好的方式是先从保守模式开始,等你摸清自己的使用节奏后再逐步放开。

指令太泛,目标太虚

像"帮我优化一下这个项目""帮我重构一下"这种指令,对人都不够清楚,对代理更不清楚。更有效的说法应该包含:

  • 目标是什么。
  • 不要动什么。
  • 验收标准是什么。
  • 是否允许运行命令、联网或安装依赖。

把官方功能和社区扩展混为一谈

这里最容易混淆的是边界。Codex CLICodex AppMCPopenai/skills 这些属于官方能力;而 Superpowers、部分第三方 skills、OpenSpec 等更适合作为生态扩展来看。把这层关系理清后,很多配置和使用决策都会简单很多。

盯着模型列表不放,忽略工作流

模型当然重要,但对多数开发者来说,真正决定体验上限的,通常不是"今天又多了哪个模型",而是:

  • 你的项目规则是否清楚。
  • 你的审批策略是否合理。
  • 你的技能和工具链是否接好了。
  • 你的任务是不是拆得足够清晰。

换句话说,工作流往往比模型名字更重要

十一、总结

Codex 值得投入时间,不是因为它会写代码,而是因为它开始具备"进入工程流程"的能力。它可以理解项目上下文,接受规则约束,连接外部工具,并在审批边界内持续推进任务。这和传统的代码补全工具已经不是一个层级的问题。

如果是第一次系统使用 Codex,比较稳的路径是:

  1. 先用 CLI 跑通安装、登录和基础项目操作。
  2. /init/review/compact 这几个高频命令用熟。
  3. AGENTS.md、审批模式和权限边界理顺。
  4. 再逐步接入 MCPskills、Codex App 和多代理协作。

真正拉开差距的,通常不是模型名称本身,而是你有没有把规则、权限、工具链和任务拆解配合起来。把这几件事做好之后,Codex 才会从一个"能回答问题的 AI",变成一个真正能参与开发的工程代理。

参考链接

相关推荐
wgzrmlrm742 小时前
Django怎么优雅发送邮件_Python配置SMTP后端实现异步通知
jvm·数据库·python
014-code2 小时前
Redis 删除缓存失败怎么办?重试、死信、补偿的工程化方案
数据库·redis·缓存
d1z8882 小时前
(二十)32天GPU测试从入门到精通-llama.cpp CPU/GPU 混合推理day18
人工智能·llama·显卡·llama.cpp
I love studying!!!2 小时前
Web应用程序:用户账户
前端·数据库·sqlite
whuhewei2 小时前
React性能优化
前端·react.js·性能优化
m0_738120722 小时前
渗透知识ctfshow——Web应用安全与防护(三)
android·前端·安全
帐篷Li2 小时前
MiniMax Music 2.6 博客素材分析文档
人工智能
sp_fyf_20242 小时前
【大语言模型】 AVGen-Bench:一个用于文本到音频-视频生成的多粒度、任务驱动型评估基准
人工智能·深度学习·神经网络·机器学习·语言模型·数据挖掘·音视频
窝子面2 小时前
NestJs+MongoDB+Deepseek+Langchain实现ai聊天助手
javascript·数据库·人工智能·mongodb