折腾 Codex 有大半个月了,踩了不少坑,也总结出一套比较顺手的配置方案。这篇文章不打算重复官方文档,而是把我自己从"装不上"到"跑起来"再到"真正用起来"的完整路径写出来,顺便聊聊怎么把 Codex 的能力延伸到日常重复性工作里------比如自动填表、定时跑脚本、批量处理数据这些。
如果你也在找Codex 配置教程 、Codex 国内 API 接入方案 ,或者想搞清楚Codex 和 RPA 怎么配合,这篇应该能帮到你。
一、环境准备:Windows / Mac / Linux 全平台
1.1 系统要求
| 项目 | 最低要求 |
|---|---|
| 操作系统 | Windows 10/11、macOS 12+、主流 Linux 发行版 |
| Node.js | 22+ |
| npm | 10+ |
| 网络 | 能访问中转 API 站点 |
1.2 Windows 安装步骤
前置:装 Git Bash
去 Git 官网下载对应版本,一路下一步就行。后续很多命令在 CMD 里跑不顺,Git Bash 更稳。
Step 1:装 Node.js
官网下 LTS 版本,装完验证:
node -v
npm -v
Step 2:全局安装 Codex
npm install -g @openai/codex
装完验证:
codex --version
Step 3:配置 API 密钥
这里不展开说具体站点,核心逻辑是:Codex 官方需要 OpenAI Plus 订阅,成本太高。国内开发者普遍用中转 API 方案,选一个稳定的中转站,创建专属分组(选 Codex 专属分组,否则模型可能不匹配),生成 API Key。
拿到 Key 之后,进入用户目录下的 .codex 文件夹:
C:\Users\你的用户名\.codex
如果看不到这个文件夹,先在文件资源管理器 → 查看 → 勾选"隐藏的项目"。
创建两个文件:
auth.json:
{"OPENAI_API_KEY": "sk-你的实际密钥"}
config.toml:
model_provider = "中转站名"
model = "gpt-5.4"
model_reasoning_effort = "high"
disable_response_storage = true
preferred_auth_method = "apikey"
[model_providers.中转站名]
name = "中转站名"
base_url = "https://中转站域名/v1"
wire_api = "responses"
Step 4:重启终端,进入项目目录启动
cd 你的项目文件夹
codex
看到 Codex 交互界面就说明成了。
1.3 Mac 安装
# 装 Homebrew(如果没装)
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
# 装 Node.js
brew install node
# 装 Codex
npm install -g @openai/codex
# 创建配置目录
mkdir -p ~/.codex
touch ~/.codex/auth.json
touch ~/.codex/config.toml
然后用 vi 编辑两个配置文件,内容和 Windows 一样。
1.4 Linux 安装
以 Ubuntu 为例:
sudo apt update
curl -fsSL https://deb.nodesource.com/setup_lts.x | sudo -E bash -
sudo apt-get install -y nodejs
sudo npm install -g @openai/codex
mkdir -p ~/.codex
touch ~/.codex/auth.json
touch ~/.codex/config.toml
二、VSCode 插件:让 Codex 进 IDE
装完 CLI 之后,强烈建议把 VSCode 插件也装上。
在扩展商店搜 "Codex",装 OpenAI 官方那个。装完侧边栏会多一个 Codex 图标,点进去就能直接在 IDE 里对话,比终端方便太多。
插件和 CLI 共用同一套配置文件,所以前面 auth.json 和 config.toml 配好就行,插件不用额外设置。
三、Codex 核心命令速查
| 命令 | 作用 |
|---|---|
/model |
切换模型和推理等级(Low/Medium/High) |
/approvals |
设置授权模式(Read Only / Auto / Full Access) |
/new |
开新会话 |
/init |
自动生成 AGENTS.md 项目指导文件 |
/compact |
压缩上下文,防止 Token 超限 |
/diff |
显示 git 差异 |
/mention |
引用文件(用 @文件名) |
/status |
查看当前配置和 Token 用量 |
3.1 AGENTS.md:让 Codex 懂你的项目
在项目根目录放一个叫 AGENTS.md 的文件,里面写项目架构、技术栈、编码规范。Codex 每次启动会先读这个文件,相当于给 AI 一份"入职手册"。
用 /init 命令可以自动生成初版,然后自己再改。
3.2 授权模式怎么选
| 权限 | Auto(默认) | Read Only | Full Access |
|---|---|---|---|
| 读文件 | ✅ | ✅ | ✅ |
| 编辑文件 | ✅ | ❌ | ✅ |
| 运行命令 | ✅ | ❌ | ✅ |
| 访问目录外文件 | 需确认 | ❌ | ✅ |
| 访问网络 | 需确认 | ❌ | ✅ |
建议: 日常开发用 Auto,需要 Codex 自主跑测试或部署脚本时切 Full Access。
3.3 引用文件与图片
-
引用文件:
@文件名,会弹出候选列表 -
粘贴图片:直接复制图片到终端,Codex 能识别(比 Claude Code 的拖拽方式顺手)
四、MCP 扩展:让 Codex 连外部工具
Codex 支持 MCP(Model Context Protocol),可以接各种外部服务。
在 config.toml 里加 mcp_servers 段:
[mcp_servers]
[mcp_servers.context7-mcp]
command = "cmd"
args = ["/c", "npx", "-y", "@smithery/cli@latest", "run", "@upstash/context7-mcp", "--key", "你的密钥"]
然后在 Codex 终端输入 /mcp,能看到已启用的服务列表。
五、从写代码到跑自动化:Codex 的落地场景
Codex 很强,但它本质还是个代码生成工具。真正要把能力落地到日常重复工作里,比如:
-
每天定时抓取网页数据
-
自动填表、提交表单
-
批量处理 Excel 报表
-
定时给钉钉/飞书发通知
-
把脚本打包成可执行文件发给同事
这些场景 Codex 能帮你写脚本,但执行、调度、分发、授权这些环节,需要另一个工具来补全。
我自己目前的做法是让 Codex 写 Python/JS 脚本,然后用一个国产 RPA 工具 来承接后续环节。这个工具叫蓝印RPA,免费,个人开发者和小团队够用了。
5.1 为什么需要 RPA 来补 Codex 的短板
Codex 擅长的是生成代码,但它不解决这些问题:
-
怎么定时跑? ------ 需要任务调度
-
怎么打包给非技术人员用? ------ 需要 EXE 导出
-
怎么控制权限? ------ 需要授权机制
-
数据安全怎么办? ------ 需要本地离线运行
-
怎么触发? ------ 需要 API 接口或消息推送
这款工具刚好补了这些缺口。我自己实际在用的几个点:
① 脚本打包成 EXE
Codex 写好的 Python 脚本,在它里面可以直接封装成独立 EXE,发给同事双击就能跑,不用装 Python 环境。还能设置授权码,防止脚本被随便复制走。
② API 触发 + 定时执行
写好的自动化流程,可以通过 API 接口被外部系统调用,也能设置定时任务。比如每天凌晨 2 点自动跑数据抓取,抓完自动推送到钉钉群。
③ 内网离线运行
数据敏感的项目,流程和数据全部存在本地,不上传云端。这点对金融、政务、医疗类项目特别重要。
④ 自定义界面
可以把脚本包装成带 UI 的小工具,非技术人员也能用。比如做一个"一键导出报表"的按钮,点一下自动跑完整个流程。
⑤ 对接大模型 + 浏览器自动化
它本身也接入了文心一言、豆包、DeepSeek、Kimi 这些模型,支持图片 OCR 识别。还能对接紫鸟、比特、HubStudio、AdsPower 等指纹浏览器,做电商自动化、批量账号管理这些场景很顺手。
⑥ Agent 智能指令 + 消息推送
最新版本加了 Agent 功能,用 DeepSeek V4 模型做智能指令解析。还能在钉钉、飞书、企微、个人微信里直接控制流程执行,执行完回调通知结果。
⑦ 在线推送更新
打包好的 EXE 应用,后续更新不用重新发文件,打开应用自动检测新版本,点一下就能升级。
5.2 一个实际的工作流示例
我现在的典型工作流是这样的:
1. 用 Codex 写核心逻辑脚本(数据抓取/处理/分析)
↓
2. 用这款工具搭建流程框架(定时触发、异常处理、日志记录)
↓
3. 封装成 EXE,设置授权码
↓
4. 发给业务同事,或者部署到服务器定时跑
↓
5. 执行结果通过钉钉/飞书推送通知
这个组合用下来,Codex 负责"聪明的部分",它负责"靠谱的部分",各干各擅长的。
六、常见问题排查
6.1 Codex 启动报错
按这个顺序排查:
-
Node.js 版本 ------ 必须 22+,用
node -v确认 -
API Key 分组 ------ 必须选 Codex 专属分组,别选通用分组
-
额度设置 ------ 建议设无限额度,有限额可能中途断掉
-
配置文件路径 ------ Windows 是
C:\Users\用户名\.codex,别放错 -
终端重启 ------ 配置改完必须重启终端,环境变量才生效
6.2 Token 消耗过快
-
用
/compact压缩上下文 -
推理等级从 High 降到 Medium
-
复杂任务拆成多个小任务,别一次塞太多
6.3 上下文窗口不够
Codex 的上下文有上限,长项目容易触发。我的做法是:
-
用 AGENTS.md 精简项目描述
-
长对话用
/new开新会话 -
把大任务拆成模块,逐个处理
Codex 是个很强的编码助手,但从"能写代码"到"能跑自动化"中间还有一段距离。这段距离需要用 RPA 工具来填补。
如果你也在折腾 Codex,建议试试这个组合:Codex 写核心逻辑 + 蓝印RPA做封装调度。免费、本地运行、能打包 EXE、能定时触发、能推送通知------对个人开发者和小团队来说,这套方案性价比很高。