
近期,Codex 在 AI 圈热度一路飙升,几乎刷屏。打开某号、某音、某站等平台随处可见相关讨论,到处都在聊 Codex,俨然成为 AI 圈的「现象级工具」。
但我相信更多的朋友和我之前一样,第一次听到 Codex,第一反应不是 "哇,好强",而是:
这玩意到底从哪开始用?一会儿说 Claude Code,一会儿说 Codex,彻底晕了😷
功能很像、宣传都很猛,很容易把新手绕进去。
所以,这篇教程不讲跑分、不讲复杂原理,只讲新手第一次真正上手时,最需要搞懂、最需要掌握的东西。
废话不多说,我们直接开始。
Codex介绍
Codex 是 OpenAI 于 2025 年推出的 AI 编程智能体,到 2026 年已成为开发者圈子里最热门的生产力工具之一。
它和我们日常使用的聊天机器人有着本质区别,不只是简单问答对话,还能直接读取本地项目文件、编辑文档与代码、执行系统命令、操控各类软件,同时支持联网检索信息、网上查资料这些工作,它都能包揽,还能持续跟进长期复杂任务、自动完成一系列操作。
不少人会把它和 Claude Code 作对比,两者能力上相近,但 Codex 搭配了完整的可视化界面,操作一目了然,更适合新手小白用户使用。
1. 安装Codex
一切的前提,是先要把CodeX安装到你的本地电脑。
当然还有一个提前:就是需要有魔法和ChatGPT账号,这个大家只能自己去想办法解决了,如果是AI进化社的成员,之前有教程专门讲过。
基本流程是:
- 打开官方入口。
- 下载 Windows 或Mac版 Codex 桌面App。
- 按提示安装。
- 打开 Codex。
- 用 ChatGPT / OpenAI 账号登录。
具体操作:
1、我们可以直接去OpenAI的Codex官网下载安装,访问:https://openai.com/zh-Hans-CN/codex/,Mac和Windows都有,我就用Mac做个演示,点击下载安装。

2、下载好dmp安装包后,双击打开,把Codex拖到应用程序中。

首次启动时,macOS 可能提示「无法验证开发者」,进入「系统设置 → 隐私与安全性」,点击「仍要打开」
安装这件事本身不复杂,最重要的是别乱下载。建议只从 OpenAI 官方入口下载。
3、打开Codex,用ChatpGPT帐号登录,也可以使用其他方式使用Codex,比如API key。

如果你只是体验,优先用账号登录,不要一上来研究 API Key。
免费账号能不能用,要看当时官方开放策略和额度。长期使用,通常还是建议至少准备 Plus 或更高套餐。因为 Codex 一旦进入项目、读文件、改文件、跑长任务,消耗还是比较大。
2. 先别急着提问、干活
如果你只把 Codex 当成 ChatGPT 的另一个入口,那它确实就是一个聊天框。
但 Codex 真正厉害的地方,不是"回答问题",而是"能直接进入项目文件,扮演你的工作助手帮你做事"。
比如,它可以做这些事:
- 读取你指定的本地文件。
- 修改项目里的文档和代码。
- 运行终端命令。
- 打开网页查资料。
- 通过插件处理文档、表格、PPT。
- 用 Skills 按固定流程完成任务。
- 通过 MCP 连接外部工具。
- 在 IDE 或云端继续处理项目。
对于新手来讲,要先建立一个重要的意识:
不要一上来就用"Codex 直接开发项目",而是要先学会了解它。
2.1 Codex 不同使用方式
Codex 可以在多个入口使用,比如 桌面App、CLI、Web/Cloud、IDE extension 等。具体口和按钮名称会实时更新,以自己当前看到的界面为准。
小白先看这张表就够了:
| 使用方式 | 解释 | 适合谁 | 小白建议 |
|---|---|---|---|
| Codex 桌面App | 装在电脑上的 Codex 工作台 | 想管理本地项目的人 | 主推,从这里开始 |
| Codex Web / Cloud | 在网页或云端委托任务 | 想让任务离开本地持续跑的人 | 后面再学 |
| Codex CLI | 命令行里的 Codex | 会终端的人 | 小白先不用 |
| IDE / VS Code 扩展 | 在代码编辑器里用 Codex | 写代码、改网页、改项目的人 | 有项目后再用 |
| GitHub 里的 Codex | 在代码仓库里委托任务 | 管 GitHub 仓库的人 | 后期再学 |
建议先把桌面 App 这条路跑通,后面去 VS Code、Cloud、GitHub 都会顺很多。
2.1 了解 Codex 基本组成
打开 Codex 桌面 App,进来后,界面长这样,我们先带大家快速认识一下各个区域。

中间这一大块,就是我们平时的工作区,左侧栏包含两个主要入口:Chat(对话) 和 Project(项目)。
-
对话:对话适合不需要绑定到特定文件夹的任务,与 ChatGPT 网页端对话体验基本一致,适合处理日常的、一次性的问答和简单任务。每个对话相互独立,不共享工作目录。
-
项目:项目才是Codex真正的主战场,适合需要操作本地文件的任务,例如生成代码、编写文档、制作 PPT、完成报告。选一个本地文件夹作为项目目录,Codex就会以这个文件夹为工作区间,所有生成的文件都会自动存进去。一个项目里可以开多个对话,每个对话是一条独立的任务线,它们共享同一个文件夹里的文件,但记录互相隔离。通过项目方便统一管理多个子任务。
我们可以在左侧项目这边点击这个加号新建文件夹,或者使用一个现有的。

Codex 桌面 App 的对话框与 ChatGPT 网页端类似,但额外提供了以下功能:
- 添加上下文:可以附加文件、截图或其他参考内容
- 选择模型:在不同模型之间切换
- 选择工作目录:指定 Codex 在哪个本地文件夹下执行任务
- 计模模式:计划模式就是只规划不动手,先帮你把方案理清楚,你确认了再开始做。每个稍微复杂一点的项目,我都推荐你先用这个模式过一遍。
- 本地模式:分为本地 / 工作树 / 云端,决定文件改在哪里。

然后在对话框左下角有三档权限选择。

-
默认权限(最安全、最保守) :一般主要是能读取 工作区内所有文件,但是修改文件、执行终端命令、联网 全部需要你手动点击确认。简单来说,就是动个啥都需要你审批。适合新手刚上手、不熟悉 Codex时,或者对于一些陌生/重要/线上代码修改时。
-
自动审查 (日常开发首选 ):在默认权限基础上,内置自动风险判断 ,低风险操作自动放行,比如改普通代码、加注释、安装依赖、跑测试 / 构建。高风险操作仍会弹框确认 ,比如删除文件、
rm -rf、提权等。适合日常开发,碰到有风险的操作会拦一下。小事自动过,大事问你,新手最推荐。 -
完全访问权限(最高权限、风险最大) :简单来说, 可创建 / 修改 / 删除 任何项目文件,无确认、无拦截、直接执行 所有操作,AI 全权代理,全程不打扰,风险自担。几乎无安全限制 ,误操作可能导致文件丢失 / 项目损坏,一般适合那些高度信任的个人练习项目。
当然,用着用着,你可能会好奇自己还剩多少额度。
点左下角的设置,找到剩余额度,就能看到你5小时内还剩多少、这周还剩多少、啥时候刷新。

2.3 先做几个基础设置
到这里,先别急着让它改文件,先做设置。
Codex 的设置会随着版本变化,但小白可以先关注 这几类设置。
你不需要把每个按钮都研究透。先把最影响使用体验和安全边界的地方搞清楚。
1、常规设置,将跟进行为,改为引导
跟进行为改成引导,这样在中途你想修改的时候就可以直接插入,而不是必须等着当前任务做完才能进行新一轮的对话。

2、常规设置,发送方式改为组合键发送
开启按组合键发送的开关选项,默认为Enter发送。

因为你后面写项目需求时,经常会写很长:
- 项目目标。
- 输出格式。
- 不要做什么。
- 目录结构。
- 验证方式。
如果写一半按回车就发出去了,Codex 可能会拿着半截需求开始干活。(别问我是怎么知道的,我吃了很多次亏才想起来要设置一下😂)
3、先建项目目录
如果你是小白,很容易犯一个错误:什么都没配置好,就直接让它干活。
结果就是文件到处飞。先建项目,再开始。
先说结论:新手第一次用 Codex,最该先配置的不是模型,而是项目文件夹。
这一步是全文最重要的地方。
新手用 Codex,第一件事不是装插件,而是建立项目根目录。
你可以建一个这样的文件夹:
~/codex-projects
这个目录以后专门放 Codex 项目。
不要把项目直接放在:
- 桌面
- 下载目录
- 个人知识库目录
- 乱七八糟的位置
为什么?因为 Codex 会读文件、写文件、生成中间数据、跑脚本。
例如,如果你把项目塞进日常知识库,它可能把一堆日志、配置、代码、缓存都放进去。知识库就被污染了。
所以先建一个干净的项目根目录。
有了项目根目录,每个新项目再建一个独立文件夹。比如:
~/codex-projects/project1
~/codex-projects/project2
~/codex-projects/project3
4、设置Agent.md
接下来,设置AGENTS.md,也就是你给codex设置的家法规矩。
对于 Codex 而言,我们每开启一个新的对话窗口,它都会进入一个全新的上下文。它不记得之前发生了什么,对于整个项目的记忆都是空白的。
所以 Codex 提供了记忆系统来解决这样的问题:AGENTS.md 就是给 Codex 这类编码Agent看的项目说明文件,它可以描述项目结构、开发命令、测试要求、代码风格和协作边界。
AGENTS.md 的配置分为两个层级:全局级 (影响所有项目)和项目级(仅影响当前文件夹)。建议先配置全局规则作为底线,再为特定项目补充专属要求。
如果想要全局生效,有以下两种方式:
- 在系统的全局 Codex 文件夹里面找到 agents.md,它是你为codex提供的全局通用的规则。
- 在 Codex 桌面 App 里面打开设置,找到"个性化",在其中填写"自定义指令"。这里面设置的就是全局的 agents.md 文件。
设置全局文件后,对于所有的项目都会生效。这个设好了,不管你以后开多少个新对话,他都会记得。
比如,你可以自定义指令。
请默认用中文回答。
如果涉及代码或命令,请先用大白话解释目的,再给具体操作。
如果要修改文件、运行命令、访问外部账号,请先告诉我风险。
如果我的需求信息不完整,请先问我缺什么,不要直接编。

AGENTS.md编写的模板格式推荐(或者直接让AI帮你生成):
markdown
# AGENTS.md
## 项目概览
- 项目类型:
- 主要语言:
- 关键目录:
## 常用命令
- 安装依赖:`...`
- 本地开发:`...`
- 运行测试:`...`
- 类型检查:`...`
- 格式化:`...`
## 代码规范
- 遵循现有代码风格。
- 不做无关重构。
- 新增功能必须补充或更新测试。
## 安全边界
- 不读取或提交 `.env`、密钥和私有凭据。
- 不执行删除生产数据的命令。
- 修改数据库迁移前先说明影响。
## 交付要求
- 说明改动文件。
- 说明验证命令和结果。
- 说明未验证项和剩余风险。

然后记忆的两个功能,我推荐都可以在设置下的个性化中打开。

针对于我们打开的项目,我们可以在项目根目录下创建一个 agents.md 的文件,它是 Codex 的记忆文件,Codex 在开始工作之前会先读取 agents.md 的内容。
1、在 agents.md 文件里面写入一些内容。

2、回到 Codex 对话窗口问它:"这是一个什么样的项目?"

从这里可以看出,Codex 会读取 agents.md 文件,把里面的内容自动带入到新的对话,作为它们的上下文。
当然,在当前目录根目录下创建 agents.md 只对当前文件夹生效,并不是全局生效的。
5、权限:不要一上来ALL IN
Codex 会请求权限,比如读文件、改文件、运行命令、访问网页、连接账号。
新手最容易犯的错误是:看到确认按钮就点。
不要这样。
第一次使用,建议只给当前项目文件夹权限。
如果看不懂权限请求,就直接问 Codex:
请用小白能懂的话解释:你现在请求的权限会访问什么?为什么这个任务需要它?有没有更低风险的做法?
看到权限确认就点,这是最危险的习惯。
不懂就问它解释。
另外,很多新手一上来,就给了 Codex 完全访问权限,结果它误删了重要文件或把代码改得面目全非。建议始终从"默认权限"开始,熟悉它的行为模式后再逐步放开。
6、模型和推理强度:先默认,复杂任务再提高
小白不需要一上来研究每个模型。
建议:
- 普通问答:默认即可。
- 复杂项目:用更强模型或更高推理。
一句话:
小任务别浪费额度,大任务别省过头。
7、自动化先别急
Codex有一个听起来很诱人的功能:自动化,比如你可以用它:
- 每天自动总结。
- 每周自动检查。
- 定时抓资料。
- 到点继续写文章。
- 自动化测试。
- ...
但新手别急,先把手动流程跑通,再自动化。
如果你手动都没说清楚"输入是什么、输出到哪里、失败怎么办",自动化只会把混乱定时重复一遍。

只有当一个工作流已经足够稳定、而且会重复发生时,才需要考虑把它交给 自动化来处理。
3. Codex进阶功能:插件、技能、MCP
小白最容易把 Plugin、Skill、MCP 混在一起,先别纠结技术定义,看这张表:
| 名词 | 小白理解 | 什么时候用 |
|---|---|---|
| Plugin 插件 | 给 Codex 装能力包 | 做表格、PPT、文档、浏览器操作 |
| Skill 技能 | 工作流说明书 | 固定写作流程、项目规范、测评流程 |
| MCP | 外部工具通道 | 连接更专业的本地或远程工具 |
你刚开始不需要全懂,记住一个顺序:
bash
先用 Codex桌面App自带能力
→ 不够再装插件
→ 重复任务沉淀成 Skill
→ 特殊工具再考虑 MCP
不要一上来装一堆插件、技能。
接下来,我们重点介绍一下 Codex 里的 Skills 和 Plugins,在codex里,都是从插件这个tab点进去,然后顶部就有tab可以切换插件和技能。

3.1 Skill 是什么、怎么用?
Skill 技能这个东西,字面意思,给Agent用的技能。
可以理解为一份让 Codex 稳定执行重复任务的操作手册或者说是工作流说明书。

Skill 很容易被说玄,其实它最适合小白理解成:一套固定工作流说明书。
比如你经常让 Codex 整理工具资料,每次都要说:
- 先问我缺什么信息。
- 再判断哪些资料已经够用。
- 再整理资料。
- 再生成对比表。
- 再写 Markdown 报告。
- 最后检查哪些信息还需要核实。
你每次都打一遍,很麻烦。
那就可以把它写成一个 Skill 或项目内流程文件。
当某个工作流已经很固定,就可以把它沉淀成一个 Skill,减少每次重复描述的成本。
一个 Skill 通常会包含:
- 一个
SKILL.md文件
这里会写清触发场景、执行步骤、输出格式和注意事项。 - 必要时配套脚本、模板或参考文件
用来帮助 Codex 更稳定地完成任务。
Skill 常见使用方式是:
- 先准备或安装可用的 Skill。
- 在发起任务时明确说明你希望使用哪个 Skill。
- 让 Codex 按这个 Skill 的流程执行,再根据结果继续追问或迭代。

3.2 插件是什么,怎么用?
Plugin 更像一种打包和分发机制,用来把可复用工作流、应用集成、MCP 服务配置等能力组合起来,方便在项目或团队中统一安装和使用。
你可以把两者简单理解:
Skill是工作说明书,关注"这件事应该怎么做"。Plugin是"装着说明书、工具和连接配置的工具箱",关注"把哪些能力打包起来,方便安装和复用"。
所以 Skill 往往是具体流程本身,而 Plugin 更像承载这些流程和集成能力的安装单元。
有些插件里会包含一个或多个 Skills,也可能附带应用集成或 MCP 配置。这样团队在迁移环境时,不用手动一个个配置。
一句话概括:插件就是把一组技能、工具、配置打包起来的安装包,插件是比技能更牛逼更成熟的东西。
直接点击右上角的插件tab菜单,进入插件管理界面,批量管理你的插件和skills。(可按需安装对应的插件)
比如:
- 你要做 PPT,再考虑 Presentations。
- 你要处理 Excel,再考虑 Spreadsheets。
- 你要操作浏览器,再考虑 Browser 或 Chrome 相关能力。
- 你要控制电脑,再考虑Computer User,这个插件是Codex上最棒的能力之一,能通过视觉化的方式操控你电脑的。

每次只为一个明确任务装一个插件。比如你希望Codex能控制Chrome浏览器,则可以安装Chrome插件。

在Codex对话框中,可以直接从插件列表中选择已安装的插件

还可以使用@命令调出我们已安装的插件列表。

但需要注意,插件不是越多越好,而是越明确越好,先明确任务,再装插件。
3.3 MCP :先知道,但不必急着装
MCP 是 Model Context Protocol。
这名字听起来很吓人。
小白可以先这样理解:MCP 是让 Codex 连接外部工具或外部资料的一种通道。
但对大多数小白来说,前期不用急着配 MCP。
为什么?因为你一开始最需要的是:
- 建好项目文件夹。
- 写好 AGENTS。
- 学会控权限。
- 学会让 Codex 解释它做了什么。
这些都不需要 MCP,所以小白顺序还是那句:
bash
插件优先,Skill 其次,MCP 最后。
什么时候再研究 MCP?
- 你明确知道要接哪个工具。
- 官方插件满足不了。
- 你需要在 VS Code / CLI 里接入某个资料源。
4. 跑通第一个小项目
现在,终于可以开发任务了。
由于额度关系(plus帐号到期了没续,现在用的是免费额度),接下来先带大家,直接开发一个小网页,走一遍流程。
当你建好一个项目文件夹之后。按一下左边的加号,打开计划模式的开关。计划模式就是只规划不动手,先帮你把方案理清楚,你确认了再开始做。
每个稍微复杂一点的项目,我都推荐你先用这个模式过一遍。
计划模式最大的价值不是"省时间",而是强迫你把模糊需求转化为清晰指令。很多新手抱怨"Codex 不听话",其实根源是自己的需求描述不够具体。计划模式相当于一个"需求预审"环节,帮你发现遗漏和矛盾。
打开以后对话框左边会出现一个小图标,说明你现在在计划模式下。

接下来,咱们跟Codex说:
bash
帮我做一个「狂师.AI进化社」介绍的网页,要好看,要有设计感,把功能、定位按层级分类展示出来。
把提示词发送给 Codex 后,它会先扫描你建好的项目文件夹,接着自动调用「brainstorming(头脑风暴)」和「frontend-design(前端设计)」两个内置技能:先拆解你的需求(比如 "狂师.AI 进化社" 的定位),再输出视觉风格选项(比如科技风、简约风、成长路线图风格),并主动询问你是否需要先生成视觉预览 ------ 这一步建议新手一定要做,避免 AI 直接开发出的风格和你预期偏差太大。

打开方式,选择用Chrome浏览器打开

我选择C(成长路线图),接着它会先问你几个问题(问题我就不一个个放截图了)。

你直接点选回答就行,回答完以后,它会给你一份比较完整的方案计划。

当你确认没毛病之后,就可以开始实施。中间的开发过程我就不截图了,反正全自动的。
这种小网页,基本就是一遍成,做完之后,他就会给你提示,你可以直接用Codex的内置浏览器打开看看效果。


怎么样,效果还算不错吧。
如果你用的是Codex内置浏览器打开,还可以提供了一个非常实用的功能:批注。点开批注之后,你可以直接在页面上圈选任何元素,写上你的修改意见。
比如说我想让他改成官方的logo,直接在页面上选中它,手动输入文字说明就行了,不用再截图或者用嘴去描述一大堆。(这里就不再演示了,感兴趣的同学,自行尝试吧)
写在最后
如果你能坚持读到这里,相信应该已经掌握了Codex的常用功能使用方法了。
概括起来,如果你是第一次用codex,按这四步检查
- 先选工作模式:做代码、网站、脚本、仓库任务时选「适用于编程」;写文案、整理资料、做非代码任务时可以选「适用于日常工作」。
- 先别急着开最大权限:刚开始建议让 Codex 只在当前工作区内读写文件,遇到联网、系统文件、危险命令时再单独审批。
- 先配置工作目录:第一个任务尽量使用一个空文件夹或测试项目,不要直接把重要项目交给新手阶段的 Codex。
- 先观察使用情况:如果任务经常中断、额度告急或模型响应变慢,再回到「使用情况」和套餐页面确认限制。
最后送给你一张清单。如果你是第一次用 Codex,照着勾就行。
bash
## Codex 新手自检清单
- [ ] 从OpenAI官方入口安装 Codex(拒绝第三方安装包);
- [ ] 清楚 Codex 桌面App/网页版/CLI/VS Code扩展的核心区别(新手先吃透桌面App);
- [ ] 建立独立的项目根目录(如~/codex-projects),每个项目单独建文件夹;
- [ ] 创建AGENT.md文件
- [ ] 能分清插件/Skill/MCP的核心用途,不盲目安装;
- [ ] 仅授权Codex访问当前项目文件夹(不开放整个硬盘权限);
- [ ] 明确要求Codex:"需求不全时先追问,不擅自编造内容";
- [ ] 每次AI修改文件后,先让它解释"改了什么、为什么改",再确认生效。
如果这张清单你都能勾上,恭喜你,你已经不是"打开 Codex 只会聊天"的小白了。
最后送一句话:
工具本身不产生价值,使用工具的方式才产生价值。
Codex 再强,也只是你手中的锤子。能不能盖出好房子,取决于你愿不愿意先学会画图纸。
现在,打开 Codex,开始你的第一个项目吧。🎯