OpenAI Codex 使用教程

什么是 Codex

Codex 是 OpenAI 推出的 AI 编程助手,基于 GPT-5.x Codex 模型构建。2026 年 4 月的重大更新后,Codex 已从单纯的代码助手进化为全能型桌面 AI Agent,能够像真人一样操控你的电脑、完成各种任务。

核心能力:

  • 读写代码、执行命令
  • 通过 Computer Use 控制计算机
  • 内置浏览器预览网页和前端开发
  • 生成图片
  • 连接 90+ 第三方插件
  • 记忆用户偏好、自动执行定时任务

安装与使用方式

四种使用方式

|-----------------|-----------------|-------|
| 方式 | 说明 | 推荐度 |
| Desktop App | 桌面应用程序(推荐) | ⭐⭐⭐⭐⭐ |
| VS Code 扩展 | 在 VS Code 中直接使用 | ⭐⭐⭐⭐ |
| CLI 命令行 | 通过终端使用 | ⭐⭐⭐ |

下载安装

  1. 访问 openai.com/codex 下载应用
  2. 安装后使用 ChatGPT 账号登录
  3. 开始使用

会员等级说明:

  • Plus/Pro 会员

界面与核心概念

文件夹与线程(Threads)

Codex 的核心组织方式:

|----------------|------------------|
| 层级 | 作用 |
| 文件夹(工作区) | 存放代码和资料,类似项目目录 |
| 线程(Thread) | 存放对话和任务过程,类似具体话题 |

最佳实践: 同一文件夹内处理同一方向的任务,同一线程内只推进一件具体的事。

模型选择(已更新 GPT 5.5 )

|------------------|--------------|-----------|
| 模型 | 说明 | 适用场景 |
| GPT 5.4 | 主推模型,平衡能力与速度 | 日常任务 |
| GPT 5.4-mini | 轻量版,更快更便宜 | 简单任务 |
| Spark | 极速模式 | 需要 Max 订阅 |

推理深度

|------------|--------------|
| 档位 | 说明 |
| 低 | 快速响应,适合简单任务 |
| 中 | 平衡模式(推荐日常使用) |
| 高 | 深度思考,适合复杂任务 |
| Extra High | 适合大活硬活 |


主要功能详解

1. Computer Use(计算机使用能力)

Codex 可以控制你的光标,像真人一样操作电脑上的所有应用程序。

可以完成:

  • 打开应用程序
  • 点击按钮、输入文字
  • 浏览网页并填写表单
  • 操作没有开放 API 的软件

适用场景:

  • 前端效果调试和应用测试
  • 自动发布内容到社交媒体
  • 定时执行服务器巡检
  • 操作未开放 API 的应用

注意:Computer Use 功能目前仅在 macOS 上推出

2. 内置浏览器

直接在 Codex 内渲染和预览网页,支持在页面上直接添加评论进行迭代。

优势:

  • 无需切换窗口即可测试网页开发
  • 可以直接在页面上标注要修改的位置
  • 支持 HTML 游戏预览

3. 图片生成

集成 GPT Image 2.5 模型,可直接在 Codex 内生成图片。

使用场景:

  • 产品概念图和 UI 设计
  • 前端视觉素材
  • 游戏开发素材

4. 插件生态(90+ 插件)

|------|----------------------------------------|
| 类别 | 插件示例 |
| 开发工具 | Jira、CircleCI、CodeRabbit、GitLab Issues |
| 办公套件 | Microsoft Suite |
| 数据库 | Neon by Databricks |
| 其他 | Raycast、Superpowers 等 |

安装方式:在设置中点击添加即可。

5. 记忆功能

Codex 可以跨对话记住:

  • 用户偏好设置
  • 过往的修正
  • 费时获取的上下文

让 Codex 越用越懂你,产出质量更稳定。

6. 自动化任务

支持定时任务(类似 cron jobs):

  • 每天早上自动检查代码质量
  • 定时推送更新到 GitHub
  • 定期备份重要文件
  • 跨平台监控(Slack、Gmail、Notion)

7. 主动建议

Codex 会根据项目上下文、已连接的插件和记忆,主动建议下一步工作:

  • 识别需要关注的待处理事项
  • 提供按优先级排序的行动清单
  • 从多个来源提取相关背景

提示词技巧

四要素法(4 Pillars)

编写有效提示词的四个关键要素:

|-----------------|---------|---------------------|
| 要素 | 说明 | 示例 |
| Goal | 目标是什么 | 创建一个用户登录页面 |
| Context | 相关文件和文档 | 参考现有的 design-system |
| Constraints | 架构和框架限制 | 使用 React + Tailwind |
| Done When | 完成后验证条件 | 所有测试通过,无 console 错误 |

Plan Mode(计划模式)

对于大型项目,建议先使用 Plan Mode:

  1. 描述你的需求
  2. Codex 生成详细的实现计划
  3. 确认计划后开始开发

使用方式:在对话框中输入 /计划模式 启用。


AGENTS.md 使用指南

AGENTS.md 是定义项目规范和行为准则的文件,Codex 会自动加载并遵循这些指令。

加载层级

|----------------------|------|
| 路径 | 说明 |
| ~/.codex/AGENTS.md | 全局配置 |
| 项目根目录/AGENTS.md | 项目规则 |
| 子目录/AGENTS.md | 局部规则 |

良好 AGENTS.md 的要素

|------|-----------------|
| 要素 | 说明 |
| 仓库布局 | 重要的目录和文件组织结构 |
| 运行方式 | 如何构建、运行和测试项目 |
| 命令说明 | 构建、测试、lint 等命令 |
| 工程约定 | 代码风格、命名规范、PR 期望 |
| 约束规则 | 禁止事项和必须遵守的规则 |
| 完成标准 | Done 的定义和验证方法 |

示例模板

复制代码
# 项目规范

## 代码风格
- 使用 Python 3.11+
- 所有函数必须写类型注解

## 执行流程
- 写代码后必须运行 pytest
- 失败必须自动修复

## 工具使用
- 搜索文件用 rg,不用 grep
- 不要修改 .env 文件

## 完成标准
- 所有测试通过
- 无 lint 错误

Skills 与 MCP

Skills(技能)

可重用的工作流模板,支持:

  • 创建自己的 Skills
  • 分享给团队使用
  • 从社区获取现成的 Skills

Codex 提供可视化的 Skill Creator,可通过对话方式创建。

MCP(Model Context Protocol)

第三方集成协议,让 Codex 能够连接外部服务和工具,扩展能力边界。


高级功能

子代理(Sub-agents)

并行处理复杂任务,保护主线程上下文不被污染。

使用场景:

  • 同时处理多个功能模块
  • 需要并行运行测试
  • 复杂的多步骤任务

Worktrees

分支隔离机制,支持并行开发:

  • 不同分支之间互不干扰
  • 可以同时运行多个实例
  • 轻松切换工作上下文

对话管理命令(cli 命令)

|------------|---------------|
| 命令 | 用途 |
| /compact | 压缩过长对话,节省上下文 |
| /fork | 创建分支对话,尝试不同方案 |
| /plan | 启用计划模式,先规划再执行 |


最佳实践总结

工作流优化

  1. 单实例单任务原则:每个实例专注于一个任务,避免上下文污染
  2. 合理分类:先规划好文件夹和线程的结构
  3. 使用 Plan Mode:大型项目先规划再执行
  4. 自动化前验证:确保流程稳定后再创建自动化任务

提示词优化

  1. 使用四要素法(Goal/Context/Constraints/Done When)
  2. 将重复规则放入 AGENTS.md
  3. 保持规则简洁明了
  4. 定期更新以适应项目变化

记忆管理

  1. 利用 AGENTS.md 建立长期记忆
  2. 及时使用 /compact 压缩长对话(cli 版本)
  3. 使用 /fork 创建分支尝试不同方案(cli 版本)
相关推荐
Irissgwe4 小时前
LangChain快速上手
ai·langchain·llm·ai编程
Trisyp5 小时前
sudo npm uninstall -g @openai/codex报错问题解决办法
codex
多年小白5 小时前
谷歌第八代 TPU 来了:性能提升 124%
网络·人工智能·科技·深度学习·ai
Captain_Data6 小时前
AI 12小时设计CPU完整解析:从219字到RISC-V内核的技术突破
人工智能·python·ai·大模型·芯片设计·risc-v
前端摸鱼匠6 小时前
【AI大模型春招面试题27】字节对编码(BPE)的分词过程?如何处理未登录词(OOV)?
人工智能·ai·面试·大模型·求职招聘
多年小白8 小时前
AI 日报 - 2026年4月25日(周六)
网络·人工智能·科技·深度学习·ai
壮Sir不壮8 小时前
Multi-Agent 协作案例
ai·agent·ai编程·multi-agent
笨蛋©8 小时前
[技术指南] 2026年制造业数字化实战:图片PDF怎么转DXF及图纸特征自动识别
ai·数字化·cad·质量管理·制造业
qq_411262429 小时前
四博 AI 智能音箱三模联网技术方案
物联网·ai