桌面端、CLI、Skills、AGENTS.md、Record & Replay------从日常高频技巧到进阶配置,让你的 Codex 从"能用"进化到"懂你"。
目录
- 一、开篇:桌面端才是大多数人的主战场
- [二、桌面端 Codex:开箱即用的图形化工作台](#二、桌面端 Codex:开箱即用的图形化工作台)
- [三、CLI 版 Codex:终端极客的进阶武器](#三、CLI 版 Codex:终端极客的进阶武器)
- [四、AGENTS.md 撰写指南:让 Codex 真正懂你](#四、AGENTS.md 撰写指南:让 Codex 真正懂你)
- [五、Skills 生态系统:去哪里找、怎么选、如何取舍](#五、Skills 生态系统:去哪里找、怎么选、如何取舍)
- [六、Record & Replay:Mac 用户的"录一次,用一生"](#六、Record & Replay:Mac 用户的"录一次,用一生")
- 七、日常使用技巧与快捷键
- 八、小结
一、开篇:桌面端才是大多数人的主战场
OpenAI Codex 目前有三个形态:桌面 App (macOS + Windows)、CLI (终端命令行)、IDE 扩展(VS Code 等)。2026 年 2 月桌面端正式发布,3 月登陆 Windows------自此,图形化的桌面 App 就成了绝大多数开发者的主力入口。
本文以桌面端为默认视角来组织内容,同时为 CLI 用户单列一章。无论你用哪种形态,核心能力(Skills、AGENTS.md、MCP、Automations)是打通的。
当前最新模型:GPT-5.5(2026 年 4 月 23 日发布),桌面端和 CLI 均可使用。Codex 也支持 GPT-5.3-Codex 和 GPT-5.3-Codex-Spark(后者速度可达 1000+ token/s)。
二、桌面端 Codex:开箱即用的图形化工作台
桌面端的哲学是"一切皆可点 "------你很少需要手动编辑配置文件。点击左下角头像/齿轮 → Settings,所有设置都在 GUI 里。
2.1 桌面端 Settings 速览
| 设置分类 | 关键选项 | 建议 |
|---|---|---|
| General | Prevent sleep while running | ✅ 开启------长任务时电脑休眠会导致 Codex 中断 |
| General | Detail level | 选 Coding mode------可以看到 Codex 具体执行了哪些命令 |
| General | Follow-up behavior | 开启------Codex 完成任务后主动问"还需要我做什么?" |
| Configuration | Approval policy | On request------涉及文件修改和命令执行时征求同意 |
| Configuration | Sandbox mode | Workspace write------Codex 可在工作区内自由读写,但出不去 |
| Configuration | Model | 选 GPT-5.5(Pro/Max 用户),日常用 High 推理强度 |
| Personalization | Personality | Pragmatic(简洁直接)或 Friendly(更亲和) |
| Personalization | Custom instructions | 最重要的一项------见下文 2.2 |
| Appearance | Theme | Light / Dark / System,还有色盲友好主题 |
| Appearance | Avatar | 可设置一个浮动头像,Codex 在后台跑任务时你能在桌面上看到它 |

2.2 个性化------自定义指令如何写得精简高效
桌面端入口:Settings → Personalization → Custom instructions。

这里写的内容会被写入 ~/.codex/AGENTS.md(全局级别),影响你在这台机器上所有项目的所有会话。所以只放真正通用的规则。
精简高效的核心原则:
| ❌ 不要写 | ✅ 要写 |
|---|---|
| "请你尽量写出高质量的、符合最佳实践的代码" | "TypeScript 严格模式,禁止 any;React 函数组件 + Hooks" |
| "认真对待每一个细节" | "改完代码后自动运行 pnpm typecheck && pnpm lint" |
| "使用合适的错误处理方式" | "API 层统一用 Result<T, AppError> 模式,不抛裸异常" |
| 长篇架构文档 | 放在项目 docs/ 下,需要时用 @docs/arch.md 引用 |
一份实用的全局自定义指令示例:
## 沟通
- 用中文回答,代码注释用英文
- 先给方案概述(2-3 句),再写代码
- 涉及架构决策时,列出选项和 trade-off,让我选
## 编码习惯
- TypeScript 严格模式,禁止 any
- 不写 TODO 注释------要么实现完整,要么在 PR 描述中说明
- 安装新依赖前先问我
- 绝不在代码中硬编码密钥和 Token
## 安全
- 不修改 .env 和 production 配置文件
- 涉及数据库 migration 必须先确认
一句话口诀 :自定义指令不是写给 AI 的情书,是你给它列的操作清单。每一条都应该是可验证的------"我能在做完后跑一条命令来确认它遵守了吗?"
2.3 桌面端独有功能:Plugins、Automations、多 Agent
桌面端有一些 CLI 不具备或体验差异很大的功能:
| 功能 | 干什么用 | 入口 |
|---|---|---|
| Plugins | 一键安装 Skills、MCP 服务器、App 集成(GitHub、Slack、Notion 等 90+ 插件) | 左侧栏 Plugins 图标 |
| Automations | 定时任务------比如每天 9:00 让 Codex 检查 PR、生成日报 | 左侧栏 Automations 图标 |
| 多 Agent 并行 | 同时跑多个 Agent 处理不同任务 | 新建 Chat 即可自动分配 |
| Projects | 按项目组织会话,各自的上下文和配置独立 | 左侧栏 Projects |
| 内置 Terminal | 每个线程有独立终端,跑测试、启 dev server 不用切换窗口 | 线程内 Terminal Tab |
三、CLI 版 Codex:终端极客的进阶武器
如果你更喜欢终端操作(或者需要在 CI/脚本中使用 Codex),CLI 版本提供了更细粒度的控制。
3.1 基本启动方式
bash
codex # 启动交互式 TUI
codex "解释这个项目" # 带初始 prompt 启动
codex exec "检查类型" # 非交互模式,执行一次后退出
codex update # 更新到最新版
3.2 CLI 常用参数
| 参数 | 简写 | 作用 | 示例 |
|---|---|---|---|
--model |
-m |
指定模型 | codex -m gpt-5.5 |
--sandbox |
-s |
沙箱策略 | codex -s workspace-write |
--ask-for-approval |
-a |
审批时机 | codex -a on-request |
--full-auto |
workspace-write + on-request 一键组合 |
codex --full-auto |
|
--image |
-i |
附图片 | codex -i error.png "修这个" |
--search |
启用实时联网搜索 | codex --search "查最新 API" |
|
--profile |
-p |
加载预设配置 Profile | codex -p review |
--cd |
-C |
指定工作目录 | codex -C ./packages/api |
--add-dir |
添加额外工作目录 | codex --add-dir ../shared-lib |
3.3 CLI 用户什么时候需要碰 config.toml?
桌面端用户基本不需要手动编辑 ~/.codex/config.toml,因为 Settings GUI 已经覆盖了 90% 的常见配置。但 CLI 用户在以下场景可能需要直接编辑:
- 使用非 OpenAI 模型(如通过 LiteLLM 代理接入其他模型)
- 配置 MCP 服务器(虽然桌面端有 GUI,但 CLI 用户只能写文件)
- 精细化 Hooks (
PreToolUse/PostToolUse/SessionStart等生命周期钩子) - 企业管控 :管理员通过
requirements.toml强制安全策略 - 创建多个 Profile (如
dev/review/ci),用--profile切换
一个简洁的 ~/.codex/config.toml 示例:
toml
model = "gpt-5.5"
model_reasoning_effort = "high"
approval_policy = "on-request"
sandbox_mode = "workspace-write"
web_search = "cached"
personality = "pragmatic"
[profiles.review]
model_reasoning_effort = "medium"
[profiles.quick]
model_reasoning_effort = "low"
注意 :
config.toml的优先级低于 CLI 参数,高于桌面端 GUI 设置。如果你同时使用桌面端和 CLI,建议以桌面端 GUI 为主,config.toml只放 GUI 覆盖不到的项。
3.4 CLI 典型工作流
bash
# 日常开发
codex --full-auto
# 代码审查(只读 + 每次确认)
codex -s workspace-write -a on-request "审查 src/ 代码"
# 脚本自动化
codex exec "检查 TypeScript 类型错误" --json
# 多仓库协作
codex --cd apps/frontend --add-dir ../backend --add-dir ../shared
# 贴截图 Debug
codex -i error.png "这个报错怎么修?"
四、AGENTS.md 撰写指南:让 Codex 真正懂你
AGENTS.md 是 Codex 的持久化上下文------每次会话启动时自动加载。桌面端和 CLI 共用同一套机制。
4.1 加载链与优先级
Codex 按以下顺序查找 AGENTS.md:
~/.codex/AGENTS.md ← 全局个人偏好(桌面端 Settings → Personalization 写入的)
└── 项目根/AGENTS.md ← 项目级规则(建议提交到 Git 给团队共享)
└── 子目录/AGENTS.md ← 模块/目录级细化
- 离当前工作目录越近的文件,优先级越高
- 同目录存在
AGENTS.override.md时,完全替代 同目录的AGENTS.md(适合临时实验) - 桌面端 Settings → Personalization → Custom instructions 编辑的就是
~/.codex/AGENTS.md
4.2 该写什么、不该写什么
✅ 推荐写
markdown
# AGENTS.md
## 技术栈
- 前端:React 18 + TypeScript 5 + Tailwind CSS 3
- 后端:Node.js + Express 4 + Prisma + PostgreSQL
- 测试:Vitest(单元)+ Playwright(E2E)
- 包管理:pnpm
## 启动与验证
- 安装依赖:pnpm install
- 启动 dev server:pnpm dev(端口 3000)
- 类型检查:pnpm typecheck
- 运行测试:pnpm test
- Lint:pnpm lint
## 编码规范
- TypeScript 严格模式,禁止 any
- React 函数组件 + Hooks,不用 class
- API 路由放在 src/app/api/,遵循 App Router 约定
- 每个组件对应一个 .test.tsx
## 安全
- 绝不硬编码密钥
- 修改 DB Schema 前必须确认
- 涉及认证/权限的改动,先出方案再看代码
❌ 不该写
| 不该写的内容 | 原因 | 正确做法 |
|---|---|---|
| 长文档、API 参考 | 占上下文窗口,大部分时候用不到 | 放 docs/,需要时 @docs/api.md 引用 |
| 密钥和 Token | 安全隐患,可能被提交到 Git | 放 .env,权限中禁止 Codex 读取 |
| 格式化规则(缩进/引号等) | 应让工具自动执行,不靠 AI 遵守 | Prettier/ESLint + Hooks 自动格式化 |
| "认真对待每个细节"等空话 | 占 token 无实际约束 | 换成可验证命令:"改完后跑 pnpm typecheck" |
4.3 进阶:让 AGENTS.md 持续进化
"两次犯同一个错就加规则" ------Codex 犯一次错,会话中指正它;同一个错犯第二次,写入
AGENTS.md。
但要定期清理------每月回顾一次,删掉过时或不再需要的条目。一个 40 行的 AGENTS.md 比一个 200 行的更有效。
五、Skills 生态系统:去哪里找、怎么选、如何取舍
Skills 是 Codex 的"插件"------Markdown 格式的可复用指令包,Codex 启动时自动发现元数据,需要时才加载完整内容。桌面端和 CLI 共用同一套 Skills 目录 (~/.codex/skills/)。
5.1 Skills 核心概念
~/.codex/skills/ ← 个人 Skills(全局可用)
└── my-skill/
└── SKILL.md ← 必需:name、description、触发条件、执行步骤
└── scripts/ ← 可选:辅助脚本
└── references/ ← 可选:参考资料
.codex/skills/ ← 项目 Skills(随仓库共享给团队)
Skills 使用渐进式披露:启动时只加载 name + description(元数据),只有任务匹配时才拉取完整指令。即使装 50 个 Skill,真正占上下文的也只有被激活的那一两个。
5.2 去哪里搜寻 Skills?(已逐一验证)
| 平台 | 地址 | 说明 |
|---|---|---|
| CocoLoop(中文) | hub.cocoloop.cn | 中文友好,含 CLS 安全评级,第三方 Skill 商店 |
| Firecrawl 精选 | firecrawl.dev/blog/best-codex-skills | 含详细评测 + 安装命令 + 使用示例,2026 年持续更新 |
| Composio Top 10 | composio.dev/content/top-codex-skills | 真实使用案例测试过的 10 个 Skills |
| LobeHub | lobehub.com/skills | 500+ Skills,分类清晰,跨 Agent 通用 |
| FAOS Marketplace | faosx.ai/open-source | 526 个免费 Skills,Apache 2.0,覆盖工程/产品/增长/数据 |
| OpenAI 官方渠道 | 桌面端 Plugins 面板搜索安装 | 最安全,官方审核 |
| 安装器方式 | 会话中 $skill-installer <名称> |
官方推荐:$skill-installer gh-fix-ci |
| npx 方式 | npx skills add <repo> --skill <name> |
CLI 通用:npx skills add mattpocock/skills --skill handoff |
5.3 经过验证、值得长期使用的 Skills
以下 Skills 已在多个独立来源(Composio、Firecrawl、社区评测、YouTube 实测)中得到验证:
| Skill | 干什么用 | 安装方式 | 推荐理由 |
|---|---|---|---|
| grill-me | 以苏格拉底式提问对你的方案进行 60 连问 | npx skills add mattpocock/skills --skill grill-me |
在写代码之前先锁定需求,避免"做完了才发现理解错了" |
| handoff | 把当前会话压缩成交接文档 | npx skills add mattpocock/skills --skill handoff |
上下文满了?一键生成文档,新会话无缝继续 |
| frontend-design | 生成不像"AI 批量生产"的前端 UI | npx skills add vercel-labs/agent-skills --skill frontend-design |
避免千篇一律的 AI-slop 风格,110k+ 周安装量 |
| Firecrawl | 联网搜索 + 抓取 + 爬取 + 浏览器操作 | npx -y firecrawl-cli@latest init --all --browser |
做调研时查最新文档,不靠训练数据瞎猜 |
| gh-fix-ci | 诊断并修复 GitHub Actions CI 失败 | $skill-installer gh-fix-ci |
CI 红了不用自己翻日志 |
| yeet | 一键 stage → commit → push → 开 PR | $skill-installer yeet |
省掉四次手动操作 |
| gh-address-comments | 读取 PR Review 评论并批量修改 | $skill-installer gh-address-comments |
逐个处理 Review 意见太累,批量解决 |
| excalidraw | 文字描述转流程图/架构图 | npx skills add excalidraw/claude-code --skill excalidraw |
"把刚才讨论的微服务架构画成图" |
| superpowers | 子 Agent 驱动的完整开发工作流 | 桌面端 Plugins 面板搜索安装 | TDD + Agent 审查 + 迭代,给 Codex 装上工程骨架 |
| skill-creator | Codex 内置:帮你创建新 Skill | 无需安装,直接 $skill-creator |
跟它描述需求,帮你生成完整 SKILL.md |
小剧场 :花 30 分钟跟 Codex 讨论支付模块架构,聊得热火朝天。第二天打开想继续------上下文满了。装了 handoff 之后,一句
handoff自动生成包含所有决策、待办、技术选型理由的交接文档,新会话打开直接续上,仿佛从未中断。
5.4 Skills 装太多了怎么办?
Skills 不是越多越好。保持在 15-20 个真正高频使用的,体验最佳。
保留 / 删除四标准:
| 标准 | 判断逻辑 |
|---|---|
| 使用频率 | 一周用不到一次的,删 |
| 触发重合 | 两个 Skill 干差不多的事,留更准的那个 |
| 可被内置替代 | Codex 新版可能已原生支持(如 2025 年的 web-search Skill,2026 年已内置) |
| 维护活跃度 | 6 个月没更新的,API 可能已变 |
实战 :每月在会话中输入
/skills列出所有已安装的 Skills,逐个过------名字都看着陌生的直接删。
六、Record & Replay:Mac 用户的"录一次,用一生"
6.1 这是什么?
2026 年 6 月 18 日 发布的 Codex macOS 桌面端独占功能。一句话:你在 Mac 上做一遍操作,Codex 边看边学,然后把它变成可复用的自动化 Skill。
- 📅 发布时间:2026 年 6 月 18 日
- 💻 平台:macOS 桌面端独占(Windows / CLI 暂不支持)
- 🌍 地区限制:欧洲经济区、英国、瑞士暂不可用
- 💰 订阅:ChatGPT Plus($20/月)起
- 🔧 前置条件:需启用 Computer Use + Google Chrome 插件

6.2 什么场景最适用?
| ✅ 适合 | ❌ 不适合 |
|---|---|
| 每月重复的报销流程 | 步骤每次都不同的探索性任务 |
| 定期下载固定报表 | 涉及金融敏感操作的流程 |
| 按模板发布视频/文章 | 需要大量人工判断的决策 |
| 标准化创建 GitHub Issue | 一次性操作 |
6.3 操作步骤
- 打开 Codex macOS App
- 进入左侧栏 Plugins → 点 + → 选 Record a skill
- 审阅建议 prompt,补充上下文,提交
- Codex 请求录屏权限 → 批准
- 开始演示工作流(像平常一样操作就行)
- 完成后点菜单栏停止按钮,或直接说"我完成了"
- Codex 分析录屏 → 自动生成 SKILL.md(可编辑!)

关键认知 :Record & Replay 生成的不是"像素级宏录制",而是语义级意图描述------它理解你想完成什么,而不是记录你点了哪些坐标。这意味着下次界面布局变了,它仍然能适应。
6.4 录制后可编辑
生成的 SKILL.md 完全可以手动修改------调整步骤、添加验证条件、修改输入参数。本质上就是一个文本文件,跟手写的 Skill 没有任何区别,只是"作者"换成了你的录屏。

七、日常使用技巧与快捷键
7.1 桌面端 / CLI 通用的斜杠命令
在会话中输入 / 触发命令面板:
| 命令 | 作用 | 场景 |
|---|---|---|
/model |
切换模型 | 简单任务切轻量模型,省 token |
/new |
开启全新会话 | 换个不相关的任务 |
/resume |
恢复历史会话 | 继续昨天的重构 |
/fork |
从当前点分叉新会话 | "这个方案不确定,分叉出去试试" |
/compact |
压缩对话历史 | 上下文快满了 |
/side |
快速旁路提问 | 查个 API 用法,不污染主对话 |
/status |
查看当前模型、策略、Token 用量 | 心里有数 |
/copy |
复制 Codex 最近一次完整输出 | |
/clear |
清屏(不新建会话) | |
/skills |
列出所有已安装 Skills | |
/theme |
切换配色 | 支持色盲友好主题 |
7.2 三种前缀
| 前缀 | 作用 | 示例 |
|---|---|---|
/ |
斜杠命令或调用自定义 Prompt | /model gpt-5.5 |
! |
绕过对话直接执行 Shell 命令 | ! npm test |
@ |
引用文件/目录(支持 Glob) | @src/services/UserService.ts |
技巧 :多用
!前缀跑命令,而不是在 prompt 里描述"请帮我运行 npm test 并分析结果"。前者 Codex 直接读到输出,后者要在对话中转一圈,多烧 token。
7.3 通用快捷键
| 快捷键 | 作用 |
|---|---|
Esc Esc |
空输入框双击 Esc:编辑上条消息。继续按可回溯更早的消息,按 Enter 从该点分叉 |
Ctrl+O |
复制 Codex 最新完整输出 |
Ctrl+L |
清屏(保留对话历史) |
Tab |
Codex 运行期间按 Tab:排队输入下一条消息 |
Ctrl+C |
中断当前生成 |
Ctrl+D |
退出会话(CLI) |
Cmd+, |
打开桌面端 Settings |
Alt+, / Alt+. |
降低/提高推理强度 |
7.4 提示词三技巧
① 让 Codex 先采访你
我想给项目加用户权限系统,但还没想清楚细节。先采访我,把需求搞清楚了再动手。
② 复杂任务先出计划
我需要重构 UserService。先出 RFC 风格计划:拆分策略、文件结构、每步风险点。我确认后再执行。
③ 定义"完成"标准
优化 UserProfile 组件:减少不必要的 re-render,首屏加载 < 1 秒,现有 12 个测试全部通过。
八、小结
Codex 的威力不在于模型,而在于你花了多少心思去"养"它。一个花 30 分钟写好 AGENTS.md、选好 Skills、调好 Settings 的开发者,效率可能比"开箱即用"的高 3 倍以上。
优先级清单(按投入回报排序):
| 优先级 | 投入 | 时长 | 回报 |
|---|---|---|---|
| 🥇 | 桌面端 Settings → Personalization → Custom instructions | 15 分钟 | 每次对话都受益 |
| 🥈 | 创建项目 AGENTS.md(技术栈 + 验证命令 + 编码规范) |
20 分钟 | 团队共享,一次写好一直用 |
| 🥉 | Settings → Configuration:调好审批策略和沙箱模式 | 5 分钟 | 不再踩权限坑 |
| 4 | 安装 5-8 个核心 Skills(handoff, grill-me, firecrawl 等) | 15 分钟 | 关键场景效率翻倍 |
| 5 | (Mac 用户)用 Record & Replay 录 2 个重复任务 | 10 分钟/个 | 每周省机械操作时间 |
| 6 | (CLI 用户)创建 2-3 个 Profile + 精简 config.toml | 10 分钟 | 切换场景不手忙脚乱 |
| 7 | 每月清理 Skills + 回顾 AGENTS.md | 15 分钟/月 | 防止配置腐烂 |
你在养一个虚拟同事,不是买了一个工具。对它投入的每一分钟,都会在未来的会话中加倍奉还。
本文基于 Codex 2026 年 7 月最新版本(桌面端 App + CLI),当前默认模型为 GPT-5.5。部分功能(如 Record & Replay)有地区和平台限制。第三方 Skills 由社区开发者提供,安装前请查看安全评级。更多内容请参阅 OpenAI Codex 官方文档。