Codex 配置到落地：从 API 接入到自动化RPA工作流实战

折腾 Codex 有大半个月了，踩了不少坑，也总结出一套比较顺手的配置方案。这篇文章不打算重复官方文档，而是把我自己从"装不上"到"跑起来"再到"真正用起来"的完整路径写出来，顺便聊聊怎么把 Codex 的能力延伸到日常重复性工作里------比如自动填表、定时跑脚本、批量处理数据这些。

如果你也在找Codex 配置教程 、Codex 国内 API 接入方案 ，或者想搞清楚Codex 和 RPA 怎么配合，这篇应该能帮到你。

一、环境准备：Windows / Mac / Linux 全平台

1.1 系统要求

项目	最低要求
操作系统	Windows 10/11、macOS 12+、主流 Linux 发行版
Node.js	22+
npm	10+
网络	能访问中转 API 站点

1.2 Windows 安装步骤

前置：装 Git Bash

去 Git 官网下载对应版本，一路下一步就行。后续很多命令在 CMD 里跑不顺，Git Bash 更稳。

Step 1：装 Node.js

官网下 LTS 版本，装完验证：

复制代码

node -v
npm -v

Step 2：全局安装 Codex

复制代码

npm install -g @openai/codex

装完验证：

复制代码

codex --version

Step 3：配置 API 密钥

这里不展开说具体站点，核心逻辑是：Codex 官方需要 OpenAI Plus 订阅，成本太高。国内开发者普遍用中转 API 方案，选一个稳定的中转站，创建专属分组（选 Codex 专属分组，否则模型可能不匹配），生成 API Key。

拿到 Key 之后，进入用户目录下的 .codex 文件夹：

复制代码

C:\Users\你的用户名\.codex

如果看不到这个文件夹，先在文件资源管理器 → 查看 → 勾选"隐藏的项目"。

创建两个文件：

auth.json：

复制代码

{"OPENAI_API_KEY": "sk-你的实际密钥"}

config.toml：

复制代码

model_provider = "中转站名"
model = "gpt-5.4"
model_reasoning_effort = "high"
disable_response_storage = true
preferred_auth_method = "apikey"

[model_providers.中转站名]
name = "中转站名"
base_url = "https://中转站域名/v1"
wire_api = "responses"

Step 4：重启终端，进入项目目录启动

复制代码

cd 你的项目文件夹
codex

看到 Codex 交互界面就说明成了。

1.3 Mac 安装

复制代码

# 装 Homebrew（如果没装）
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

# 装 Node.js
brew install node

# 装 Codex
npm install -g @openai/codex

# 创建配置目录
mkdir -p ~/.codex
touch ~/.codex/auth.json
touch ~/.codex/config.toml

然后用 vi 编辑两个配置文件，内容和 Windows 一样。

1.4 Linux 安装

以 Ubuntu 为例：

复制代码

sudo apt update
curl -fsSL https://deb.nodesource.com/setup_lts.x | sudo -E bash -
sudo apt-get install -y nodejs

sudo npm install -g @openai/codex

mkdir -p ~/.codex
touch ~/.codex/auth.json
touch ~/.codex/config.toml

二、VSCode 插件：让 Codex 进 IDE

装完 CLI 之后，强烈建议把 VSCode 插件也装上。

在扩展商店搜 "Codex"，装 OpenAI 官方那个。装完侧边栏会多一个 Codex 图标，点进去就能直接在 IDE 里对话，比终端方便太多。

插件和 CLI 共用同一套配置文件，所以前面 auth.json 和 config.toml 配好就行，插件不用额外设置。

三、Codex 核心命令速查

命令	作用
`/model`	切换模型和推理等级（Low/Medium/High）
`/approvals`	设置授权模式（Read Only / Auto / Full Access）
`/new`	开新会话
`/init`	自动生成 AGENTS.md 项目指导文件
`/compact`	压缩上下文，防止 Token 超限
`/diff`	显示 git 差异
`/mention`	引用文件（用 `@文件名`）
`/status`	查看当前配置和 Token 用量

3.1 AGENTS.md：让 Codex 懂你的项目

在项目根目录放一个叫 AGENTS.md 的文件，里面写项目架构、技术栈、编码规范。Codex 每次启动会先读这个文件，相当于给 AI 一份"入职手册"。

用 /init 命令可以自动生成初版，然后自己再改。

3.2 授权模式怎么选

权限	Auto（默认）	Read Only	Full Access
读文件	✅	✅	✅
编辑文件	✅	❌	✅
运行命令	✅	❌	✅
访问目录外文件	需确认	❌	✅
访问网络	需确认	❌	✅

建议： 日常开发用 Auto，需要 Codex 自主跑测试或部署脚本时切 Full Access。

3.3 引用文件与图片

引用文件：@文件名，会弹出候选列表
粘贴图片：直接复制图片到终端，Codex 能识别（比 Claude Code 的拖拽方式顺手）

四、MCP 扩展：让 Codex 连外部工具

Codex 支持 MCP（Model Context Protocol），可以接各种外部服务。

在 config.toml 里加 mcp_servers 段：

复制代码

[mcp_servers]
[mcp_servers.context7-mcp]
command = "cmd"
args = ["/c", "npx", "-y", "@smithery/cli@latest", "run", "@upstash/context7-mcp", "--key", "你的密钥"]

然后在 Codex 终端输入 /mcp，能看到已启用的服务列表。

五、从写代码到跑自动化：Codex 的落地场景

Codex 很强，但它本质还是个代码生成工具。真正要把能力落地到日常重复工作里，比如：

每天定时抓取网页数据
自动填表、提交表单
批量处理 Excel 报表
定时给钉钉/飞书发通知
把脚本打包成可执行文件发给同事

这些场景 Codex 能帮你写脚本，但执行、调度、分发、授权这些环节，需要另一个工具来补全。

我自己目前的做法是让 Codex 写 Python/JS 脚本，然后用一个国产 RPA 工具 来承接后续环节。这个工具叫蓝印RPA，免费，个人开发者和小团队够用了。

5.1 为什么需要 RPA 来补 Codex 的短板

Codex 擅长的是生成代码，但它不解决这些问题：

怎么定时跑？ ------ 需要任务调度
怎么打包给非技术人员用？ ------ 需要 EXE 导出
怎么控制权限？ ------ 需要授权机制
数据安全怎么办？ ------ 需要本地离线运行
怎么触发？ ------ 需要 API 接口或消息推送

这款工具刚好补了这些缺口。我自己实际在用的几个点：

① 脚本打包成 EXE

Codex 写好的 Python 脚本，在它里面可以直接封装成独立 EXE，发给同事双击就能跑，不用装 Python 环境。还能设置授权码，防止脚本被随便复制走。

② API 触发 + 定时执行

写好的自动化流程，可以通过 API 接口被外部系统调用，也能设置定时任务。比如每天凌晨 2 点自动跑数据抓取，抓完自动推送到钉钉群。

③ 内网离线运行

数据敏感的项目，流程和数据全部存在本地，不上传云端。这点对金融、政务、医疗类项目特别重要。

④ 自定义界面

可以把脚本包装成带 UI 的小工具，非技术人员也能用。比如做一个"一键导出报表"的按钮，点一下自动跑完整个流程。

⑤ 对接大模型 + 浏览器自动化

它本身也接入了文心一言、豆包、DeepSeek、Kimi 这些模型，支持图片 OCR 识别。还能对接紫鸟、比特、HubStudio、AdsPower 等指纹浏览器，做电商自动化、批量账号管理这些场景很顺手。

⑥ Agent 智能指令 + 消息推送

最新版本加了 Agent 功能，用 DeepSeek V4 模型做智能指令解析。还能在钉钉、飞书、企微、个人微信里直接控制流程执行，执行完回调通知结果。

⑦ 在线推送更新

打包好的 EXE 应用，后续更新不用重新发文件，打开应用自动检测新版本，点一下就能升级。

5.2 一个实际的工作流示例

我现在的典型工作流是这样的：

复制代码

1. 用 Codex 写核心逻辑脚本（数据抓取/处理/分析）
   ↓
2. 用这款工具搭建流程框架（定时触发、异常处理、日志记录）
   ↓
3. 封装成 EXE，设置授权码
   ↓
4. 发给业务同事，或者部署到服务器定时跑
   ↓
5. 执行结果通过钉钉/飞书推送通知

这个组合用下来，Codex 负责"聪明的部分"，它负责"靠谱的部分"，各干各擅长的。

六、常见问题排查

6.1 Codex 启动报错

按这个顺序排查：

Node.js 版本 ------ 必须 22+，用 node -v 确认
API Key 分组 ------ 必须选 Codex 专属分组，别选通用分组
额度设置 ------ 建议设无限额度，有限额可能中途断掉
配置文件路径 ------ Windows 是 C:\Users\用户名\.codex，别放错
终端重启 ------ 配置改完必须重启终端，环境变量才生效

6.2 Token 消耗过快

用 /compact 压缩上下文
推理等级从 High 降到 Medium
复杂任务拆成多个小任务，别一次塞太多

6.3 上下文窗口不够

Codex 的上下文有上限，长项目容易触发。我的做法是：

用 AGENTS.md 精简项目描述
长对话用 /new 开新会话
把大任务拆成模块，逐个处理

Codex 是个很强的编码助手，但从"能写代码"到"能跑自动化"中间还有一段距离。这段距离需要用 RPA 工具来填补。

如果你也在折腾 Codex，建议试试这个组合：Codex 写核心逻辑 + 蓝印RPA做封装调度。免费、本地运行、能打包 EXE、能定时触发、能推送通知------对个人开发者和小团队来说，这套方案性价比很高。