Codex (APP) 保姆级全攻略,海量实战教程, 一期精通Codex_哔哩哔哩_bilibili

Codex APP 保姆级全攻略视频总结
视频文件:260428-Codex (APP) 保姆级全攻略,海量实战教程, 一期精通Codex.mp4
字幕文件:260428-Codex (APP) 保姆级全攻略,海量实战教程, 一期精通Codex.docx
视频时长:约 38 分 12 秒
分辨率:1280 x 720
一、核心内容概览
本视频是一套面向 Codex APP 的完整入门到进阶教程。作者认为 Codex APP 已经成为 Codex 四种产品形态中能力最全面、上手最快、综合体验最好的形态之一:额度相对更高,免费账户也能使用,并且相比一些命令行或云端工具,集成了更完整的权限控制、插件、技能、浏览器测试、云端运行、自动化和电脑操作能力。
视频以一个"宠物洗护店网站"和"网页版待办事项工具"为主线案例,系统演示了 Codex APP 的安装、项目管理、并行任务、沙箱权限、AI 绘图、Plan 模式、Git/GitHub 工作流、Git Worktree 并行开发、云端 Codex、项目记忆系统、插件、Skills、MCP、Netlify 部署以及 Computer Use 电脑自动化。
整期内容的主旨是:Codex APP 不只是一个聊天式代码助手,而是一个具备项目上下文、权限边界、工具扩展、自动化运行和跨应用操作能力的 AI Agent 工作台。
二、视频结构与章节要点
1. 安装与初始化
视频开头先说明使用 Codex APP 前需要准备三个基础工具:
- Git
- Node.js
- VS Code
Codex APP 支持 Windows 和 macOS。视频主要使用 Windows 演示,但说明两端功能基本一致;唯一明显差异是 Computer Use 目前只支持 macOS。
首次启动 Codex APP 后,需要使用 ChatGPT 账户登录。免费账户也可以使用 Codex,但额度较低。首次进入时,Codex 会询问用户希望它处理什么类型的工作,并据此预装一些插件和 Skills。用户还可以选择主要使用场景,例如编程或日常工作,这些设置后续都可以在设置中修改。
初始化阶段还需要完成沙盒设置。沙盒是 Codex 权限体系的核心,后面会详细解释。
2. 三栏布局与项目/对话管理
Codex APP 是经典三栏布局:
- 左侧:任务列表和项目列表
- 中间:对话窗口
- 右侧:多功能区域,例如浏览器、文件树、终端等
作者创建了两个项目文件夹进行演示:
- 项目一:让 Codex 制作一个 HTML 单页面宠物洗护店网页
- 项目二:让 Codex 用 React 框架做一个网页版待办事项提醒工具
视频强调 Codex 支持多个项目、多个对话并行执行。左侧任务列表会显示不同状态:
- 转圈图标:任务正在运行
- 绿色标签:等待用户批准
- 蓝色小点:任务已完成
在等待批准的案例中,Codex 需要联网下载 React 项目模板,因此向用户申请权限。用户批准后,任务继续执行。
左侧栏还支持:
- 新建对话,Windows 快捷键是
Ctrl + N,macOS 是Command + N - 搜索近期对话,Windows 快捷键是
Ctrl + G,macOS 是Command + G - 自动生成和手动重命名对话标题
- 归档和取消归档对话
- 进入插件与自动化页面
作者补充说,搜索功能目前只能搜索对话标题,不能搜索对话正文内容。
3. 沙箱、权限控制与上下文
视频花了较大篇幅讲 Codex 的沙箱机制。作者认为这是 Codex APP 与 Claude Code 等工具的重要差异。
Codex 的权限控制围绕沙箱展开。默认情况下,Codex 可以读取和修改当前项目文件夹,也就是沙箱内的所有文件。这样日常开发不需要每次修改文件都询问用户,体验更顺畅。
沙箱有两个默认硬限制:
- Codex 不能修改沙箱外的文件
- Codex 默认不能联网
这些限制不是靠模型自觉遵守,而是由操作系统底层机制实现。例如 macOS 使用系统内置的 Seatbelt Sandbox 机制。作者把这类设计解释为 harness engineering 的工程实现:用权限、沙箱和审批机制把强大的 AI 能力约束在可控范围内。
如果 Codex 需要访问沙箱外文件或联网,就会发起提权操作。权限模式主要有三档:
- 默认人工审核:提权操作都需要用户同意
- 自动审查:由小模型先判断操作风险,低风险自动放行,高风险再人工审核
- 完全访问:Codex 无视沙箱限制,可以执行电脑上的一切操作
作者推荐使用"自动审查"模式,因为它兼顾安全性与便利性。
对话窗口右上还会显示上下文使用量。上下文满了以后,Codex 会自动压缩历史,也可以通过斜杠菜单手动压缩。作者提醒,AI Agent 使用中常见经验是"清空好于压缩":完成一个任务后开启新对话,往往更有利于 AI 聚焦新任务。
4. 模型、额度与语音输入
Codex 中可以选择模型和思考强度。视频里提到,通常可以选择最新模型,并根据任务复杂度调整推理强度。
速度选项包括:
- 标准
- 快速
快速模式会提升推理速度,但会消耗更多套餐额度。额度页面会显示:
- 5 小时限额
- 周限额
任意一个额度达到上限,Codex 都无法继续使用,直到对应时间重置。
Codex 还支持语音输入,作者称它可以把与 AI 的交互从打字变成"口喷",适合快速表达需求。
5. AI 绘图、图片输入与 Steer 引导
Codex 内置 AI 绘图能力。视频中作者使用宠物洗护店网页作为案例,发现初始生成网页中的配图不合适:
- 店内环境图实际上是宠物图片,不是真正的洗护店环境
- 门店地图粗糙简陋
作者让 Codex 调用 AI 绘图能力生成三张店内环境轮播图,分别展示不同区域,并保持装修风格一致。随后又通过截图和文字说明,让 Codex 根据陕西北路 1620 号的位置生成可爱清新的宠物风格地图,并替换网页中的门店位置信息。
在这个过程中,Codex 一开始用 SVG 生成地图,效果不理想。作者借此介绍了 Steer,也就是"引导"功能。当用户发现 AI 执行方向错了,可以中途接管方向盘,直接干预当前执行,而不是等任务完全跑完。
默认情况下,执行中追加的新指令会排队等待上一轮任务完成。用户可以点击"引导"按钮,或使用 Ctrl + Enter,让新指令立即进入当前执行过程。作者推荐常规设置保持"排队",需要中途纠偏时再主动使用引导。
6. Plan 模式与内置浏览器
对话输入框的加号中包括添加照片和文件、插件以及计划模式。Plan 模式开启后,Codex 不会立刻执行,而是先生成工作计划,与用户确认后再动手。
作者建议复杂任务先使用 Plan 模式,这样可以先和 AI 对齐意图与颗粒度。
演示案例是把宠物洗护店项目改造成 Next.js 框架。Codex 在 Plan 模式中通过问题卡片询问:
- 使用哪种项目形态
- 是否使用 App Router 和 TypeScript
- 样式如何迁移
- 是否构建并启动本地开发服务器验证
计划确认后,Codex 执行架构迁移,并启动内置浏览器自动化测试。右侧浏览器显示迁移后的页面,页面元素完整保留。用户还可以在浏览器中通过批注按钮选中页面元素,提出问题或修改意见,例如"为什么这个星星是空心的",Codex 随后修改成实心星星。
视频强调 Codex APP 不是传统 IDE。它可以查看文件树和代码,也可以对某行代码写批注,但不提供完整代码编辑功能。实际编辑仍可借助 VS Code 或其他 IDE。
7. Git、GitHub、回滚与 Fork
视频接着演示如何把项目初始化为 Git 仓库。Codex 会创建 .gitignore,排除不需要提交的文件,并完成 Git 初始化。项目成为 Git 仓库后,右上角会出现更多按钮,例如用 VS Code 打开项目。
作者还演示了让 Codex 把代码推送到 GitHub:
- 用户先在 GitHub 上创建仓库
- 复制仓库地址
- 交给 Codex
- Codex 完成远程绑定和推送
随后重点介绍两个进阶技巧。
第一个是回滚。作者先让 Codex 添加"期望到店时间"字段,并提交一次 Git 保存。随后又让 Codex 调整字段位置,但觉得效果不好,希望把这次对话和代码都回退到之前状态。
完整回滚方式包括两步:
- 用 Codex 的 Fork 功能把对话历史回滚到某个节点
- 用 Git 提交哈希把代码回退到对应提交
作者说明,Fork 只能回退对话,不能自动回退代码;代码层面的回退仍然需要 Git。
8. Git Worktree 并行开发
第二个进阶技巧是 Git Worktree。作者解释说,Worktree 本质是用 Git 创建一个新分支,并把这个分支的代码完整复制到另一个文件夹中。
主文件夹和分支文件夹可以并行工作,互不干扰。视频中作者创建了两个工作树:
customer_rating:优化客户评价部分,增加更多评价和动画轮播- 另一个工作树:优化门店信息和地图布局,让门店信息与地图上下排列,地图展示更完整
两个分支各自开发完成后,作者让 Codex 将它们合并回主干。最后主干同时获得两个分支的改动。使用完毕后,可以右键移除临时工作树。
这一部分展示了 Codex 适合并行处理多个互不干扰的开发任务。
9. Codex 云端运行环境
Codex 的任务可以在本地运行,也可以在云端运行。使用云端环境的前提是代码已经同步到 GitHub。
视频中,作者先把本地代码推送到 GitHub,然后选择关联 Codex Web,把项目初始化为网页版可用的项目。随后在 Codex Web 中提出需求:把首页的"期望到店日期"默认设置为明天早晨 9:30。
Codex Web 会:
- 初始化云端运行环境
- 从 GitHub 下载代码
- 分析项目
- 完成修改
- 创建 Pull Request
用户可以在 GitHub 上审核 PR,确认无误后合并到主干。之后回到本地,用 VS Code 的同步功能把 GitHub 最新代码拉回本地。
作者认为云端环境最适合外出时用手机处理任务:没有电脑也能让 Codex 在云端执行,只需要在手机上审批。
10. 项目记忆与 Agents.md
每个新对话都是新的上下文,AI 不记得之前发生过什么。复杂项目中,每次都重新解释项目背景会很低效。
视频介绍了两种给 Codex 增加记忆的方法。
第一种是在项目根目录创建 AGENTS.md。这是多个 AI Agent 工具通用的项目指南文件,Codex 每次对话都会自动读取它,把它作为上下文。
作者演示在 AGENTS.md 中写入个人偏好和项目背景,例如:
- 用户叫技术爬爬虾
- 擅长 Python 和 Java
- 对 CSS 不熟
- 遇到样式问题需要用大白话解释
之后新开对话询问 Codex 用户叫什么、擅长什么技术,Codex 能从 AGENTS.md 中回答出来。
作者还演示让 Codex 通读当前项目,把项目知识自动总结到 AGENTS.md 中。对于复杂项目,作者认为 AGENTS.md 是必须写的。
第二种是全局自定义指令,也就是全局 AGENTS.md。它对这台电脑上的所有项目生效。作者在全局指令里加入安全约束:禁止使用脚本批量删除文件或目录,只能一个个删除;如果必须批量删除,应该停止并让用户手动处理。
视频还提到 Codex 的实验性记忆功能,可以从聊天中生成新记忆并带入新聊天,但作者没有展开。
11. 插件、GitHub/Gmail 与自动化
Codex 插件市场分为插件和技能。插件通常是第三方服务把自己的能力接入 Codex。
作者安装了 GitHub 插件和 Gmail 插件,并演示:
- 调用 GitHub 插件查看自己 Star 数量前十的开源项目
- 让 Codex 生成摘要
- 调用 Gmail 插件把摘要邮件发给自己
任务完成后,Gmail 中能看到自己发给自己的摘要邮件。
随后作者把这套流程做成自动化任务:每周五下午 4 点运行一次,观察仓库 Star 数量是否上涨,并发送邮件。自动化页面可以编辑:
- 执行频率
- 使用模型
- 是否立即运行测试
作者建议这类简单自动化任务使用 mini 模型即可。
Codex 的自动化执行过程中,如果积累了经验,还会写入 memory.md,帮助下一次自动化执行。
12. Skills:官方、第三方与自定义
Skills 是给 AI Agent 的专业技能包,也可以理解成带目录结构的说明书。它可以封装工作流、专业能力或规范,让 Agent 在执行特定任务时更稳定、更高效。
视频介绍三种安装和使用 Skills 的方法。
第一种是官方 Skills。作者安装了 Remotion 相关 Skill,让 Codex 创建一个 3D 圆锥摆动画视频,要求包含受力分析,并且角速度随时间缓慢增大。Codex 调用 Remotion Skill 后生成了完整视频和网页版剪辑工具。
第二种是第三方 Skills。作者从 GitHub 下载了一个用于生成电子杂志风格网页 PPT 的 Skill,并手动放入项目的 .codex/skills 目录。随后让 Codex 根据视频开头文案生成 PPT,结果详略得当、重点突出,并带有高级动效。
第三种是自定义 Skills。作者作为视频博主,经常需要把视频和字幕转换成图文笔记,于是使用内置的 skill-creator 创建了一个"视频字幕转 Markdown"的 Skill。需求包括:
- 读取字幕文件
- 转换成 Markdown 笔记
- 自动添加标点
- 划分段落
- 在适合截图的位置插入截图占位符
- 调用 FFmpeg 在对应时间点截图
- 用本地图片替换 Markdown 中的截图占位符
Codex 最终生成了 SKILL.md 和一个用于批量替换截图的 Python 脚本。作者随后测试该 Skill,成功把视频与字幕转换成图文并茂的 Markdown 教程。
13. MCP 与 Supabase 后端数据库
MCP 全称是 Model Context Protocol,即模型上下文协议。作者把它解释为 AI 大模型的标准化工具箱,让模型可以通过工具与外界互动并完成任务。
视频以 Supabase MCP 为例,演示给宠物洗护项目添加后端数据库能力。
配置流程包括:
- 在 Supabase 创建新项目
- 在 Connect 页面找到 MCP 客户端配置
- 选择 Codex
- 复制 MCP URL
- 在 Codex 设置中添加 MCP 服务器,传输方式选择流式 HTTP
- 在 Codex 终端中运行登录命令
- 浏览器授权
- 重启 Codex
随后作者让 Codex 使用 Supabase MCP 创建一个预约业务表,并把用户表单数据存入数据库。要求数据库写入操作从后端使用 Session Pooler 完成。
Codex 完成了:
- 创建预约表
- 添加后端端点
- 使用 Postgres 连接池写入数据
- 修改前端表单提交逻辑
用户只需要在 .env.local 中填入 Supabase 连接池地址和密码,然后重启项目。测试提交表单后,Supabase 表中可以看到用户预约数据。
14. Netlify 部署
作者还演示了 Netlify 插件。Netlify 是免费提供静态网页、Node.js 或 Next.js 项目部署的网络服务平台。
安装 Netlify 插件并用 GitHub 登录授权后,作者让 Codex 把宠物洗护网站部署到 Netlify。Codex 成功完成部署,并提供了公网可访问域名。作者补充说,Netlify 的域名在国内可以直连,这是一个实用优点。
15. Computer Use 电脑自动化
最后一章介绍 Computer Use,也就是让 Codex 操作电脑完成任务。该功能目前只有 macOS 可以使用,因此作者切换到 Mac mini 演示。
第一个简单案例是:
- 安装 Computer Use 插件
- 新开对话并
@computer use - 指示 Codex 打开聊天软件
- 找到老板
- 发送"你好"
Codex 完成操作后会询问是否确认发送,用户确认后消息才真正发出。
第二个复杂案例是:
- 给 Codex 一个 GitHub 项目进度看板
- 让它打开浏览器查看工单进度
- 汇总项目进展
- 生成英文简报
- 发送给老板
Codex 会申请授权调用 Chrome 浏览器,查阅看板内容,整理项目进展,并在发送前再次请求用户确认。
作者强调 Computer Use 的体验很好,因为它使用后台虚拟鼠标运行,不占用当前窗口。最后,作者把该流程做成自动化任务:每天下午 5 点临下班时自动打开 GitHub 看板,总结进度,并通过聊天软件发送给老板。
作者提醒,如果使用 Codex 自动化每天定时完成任务,macOS 上最好开启"运行时防止系统休眠"的设置;Windows 不需要额外处理。
三、关键功能总结
Codex APP 的核心能力
- 多项目、多对话并行执行
- 基于项目文件夹的沙箱权限体系
- 人工审核、自动审查、完全访问三档权限模式
- 内置上下文压缩与上下文使用量显示
- 支持模型选择、思考强度和快速模式
- 支持语音输入、图片输入和文件输入
- 内置 AI 绘图能力
- 支持 Steer 中途引导
- 支持 Plan 模式,适合复杂任务先规划再执行
- 内置浏览器,可用于页面测试和可视化批注
- 支持 Git、GitHub、提交、回滚、PR 和 Worktree
- 支持本地与云端两种运行环境
- 支持项目级和全局级记忆
- 支持插件、Skills、MCP、自动化和 Computer Use
作者推荐的使用习惯
- 普通开发建议开启"自动审查"权限模式
- 复杂任务先使用 Plan 模式
- 发现 AI 方向错了,及时用 Steer 引导
- 一个任务完成后尽量开新对话,避免历史上下文干扰
- 复杂项目必须写
AGENTS.md - 重要开发节点及时用 Git 提交
- 不满意的结果要同时回滚对话历史和代码状态
- 互不干扰的任务适合用 Git Worktree 并行开发
- 外出没有电脑时适合使用 Codex Web 云端运行
- 简单自动化任务可以使用 mini 模型节省额度
- 涉及真实发送、真实操作的自动化应保留人工确认
四、视频中的实战案例清单
- 创建 HTML 单页面宠物洗护店网站
- 创建 React 版待办事项提醒工具
- 多项目、多任务并行执行
- 用 AI 绘图替换宠物店店内环境图
- 根据截图和地址生成宠物风格门店地图
- 用 Steer 功能中途纠正 AI 执行方向
- 用 Plan 模式把项目迁移到 Next.js
- 用内置浏览器检查页面并通过批注修复星星图标问题
- 初始化 Git 仓库并推送到 GitHub
- 用 Fork 和 Git 提交哈希回滚错误改动
- 用 Git Worktree 并行优化客户评价和门店地图
- 用 Codex Web 云端修改默认预约时间并创建 PR
- 用
AGENTS.md为项目添加长期记忆 - 用全局自定义指令限制危险删除操作
- 安装 GitHub/Gmail 插件并生成邮件摘要
- 创建每周自动发送仓库 Star 摘要的自动化任务
- 使用 Remotion Skill 生成 3D 圆锥摆动画
- 安装第三方 PPT Skill 并生成演示稿
- 使用 Skill Creator 创建"视频字幕转 Markdown"技能
- 配置 Supabase MCP 并添加预约数据库
- 使用 Netlify 插件部署网站
- 使用 Computer Use 操作聊天软件发送消息
- 自动读取 GitHub 看板并每天生成项目进展简报
五、重要概念解释
沙箱
沙箱是 Codex 权限系统的基础。Codex 默认只能在项目文件夹内读写文件,不能随意访问外部文件,也不能默认联网。需要越界操作时,必须申请提权。
提权
提权指 Codex 请求执行超出默认沙箱权限的操作,例如联网、访问沙箱外文件或调用外部服务。用户可以手动批准,也可以开启自动审查。
上下文压缩
上下文压缩是把历史对话总结成更短内容,以释放模型上下文空间。但作者认为,对新任务来说,直接开启新对话通常比压缩旧对话效果更好。
Steer
Steer 是中途引导功能。当 AI 正在执行任务时,如果用户发现方向不对,可以立即插入新指令纠正执行方向。
Plan 模式
Plan 模式让 Codex 先输出执行计划,等用户确认后再动手。它适合框架迁移、大规模重构、复杂功能开发等高风险任务。
AGENTS.md
AGENTS.md 是给 AI Agent 阅读的项目说明书。它可以记录项目结构、技术栈、用户偏好、命令规范和注意事项,让 Codex 每次进入项目时更快理解上下文。
Git Worktree
Git Worktree 可以把不同分支检出到不同文件夹,使多个开发方向并行推进而互不干扰。完成后可以把分支合并回主干。
Skills
Skills 是可复用的能力包,可以封装专业流程、工具使用方法和输出规范。它能让 Codex 在特定任务上表现更稳定。
MCP
MCP 是一种标准化工具协议,让 Codex 可以连接数据库、云服务和其他外部工具。视频中使用 Supabase MCP 给项目添加数据库能力。
Computer Use
Computer Use 允许 Codex 操作电脑上的真实应用,例如浏览器、聊天软件等。它适合跨应用、非纯代码的自动化流程,但涉及发送消息或执行真实操作时需要用户确认。
六、总体评价
这期视频把 Codex APP 定位为一个完整的 AI Agent 工作台,而不是单纯的代码聊天助手。它展示了 Codex 如何围绕真实项目完成从需求提出、代码生成、图片生成、浏览器测试、版本管理、云端协作、插件扩展、后端接入、网站部署到电脑自动化的一整套流程。
视频最有价值的部分在于,它不是孤立介绍功能,而是通过一个宠物洗护店网站贯穿多个场景,让用户看到 Codex 在真实项目中的连续工作方式。尤其是沙箱权限、Plan 模式、Steer、AGENTS.md、Git Worktree、Skills 和 MCP 这些概念,构成了高效使用 Codex APP 的核心方法论。
一句话总结:Codex APP 的优势不只是"会写代码",而是把 AI、项目文件、权限控制、浏览器验证、Git 工作流、外部服务和自动化任务组织成了一个可控、可扩展、可持续协作的工作环境。