Codex 配置到落地:从 API 接入到自动化RPA工作流实战

折腾 Codex 有大半个月了,踩了不少坑,也总结出一套比较顺手的配置方案。这篇文章不打算重复官方文档,而是把我自己从"装不上"到"跑起来"再到"真正用起来"的完整路径写出来,顺便聊聊怎么把 Codex 的能力延伸到日常重复性工作里------比如自动填表、定时跑脚本、批量处理数据这些。

如果你也在找Codex 配置教程Codex 国内 API 接入方案 ,或者想搞清楚Codex 和 RPA 怎么配合,这篇应该能帮到你。


一、环境准备:Windows / Mac / Linux 全平台

1.1 系统要求

项目 最低要求
操作系统 Windows 10/11、macOS 12+、主流 Linux 发行版
Node.js 22+
npm 10+
网络 能访问中转 API 站点

1.2 Windows 安装步骤

前置:装 Git Bash

去 Git 官网下载对应版本,一路下一步就行。后续很多命令在 CMD 里跑不顺,Git Bash 更稳。

Step 1:装 Node.js

官网下 LTS 版本,装完验证:

复制代码
node -v
npm -v

Step 2:全局安装 Codex

复制代码
npm install -g @openai/codex

装完验证:

复制代码
codex --version

Step 3:配置 API 密钥

这里不展开说具体站点,核心逻辑是:Codex 官方需要 OpenAI Plus 订阅,成本太高。国内开发者普遍用中转 API 方案,选一个稳定的中转站,创建专属分组(选 Codex 专属分组,否则模型可能不匹配),生成 API Key。

拿到 Key 之后,进入用户目录下的 .codex 文件夹:

复制代码
C:\Users\你的用户名\.codex

如果看不到这个文件夹,先在文件资源管理器 → 查看 → 勾选"隐藏的项目"。

创建两个文件:

auth.json:

复制代码
{"OPENAI_API_KEY": "sk-你的实际密钥"}

config.toml:

复制代码
model_provider = "中转站名"
model = "gpt-5.4"
model_reasoning_effort = "high"
disable_response_storage = true
preferred_auth_method = "apikey"

[model_providers.中转站名]
name = "中转站名"
base_url = "https://中转站域名/v1"
wire_api = "responses"

Step 4:重启终端,进入项目目录启动

复制代码
cd 你的项目文件夹
codex

看到 Codex 交互界面就说明成了。

1.3 Mac 安装

复制代码
# 装 Homebrew(如果没装)
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

# 装 Node.js
brew install node

# 装 Codex
npm install -g @openai/codex

# 创建配置目录
mkdir -p ~/.codex
touch ~/.codex/auth.json
touch ~/.codex/config.toml

然后用 vi 编辑两个配置文件,内容和 Windows 一样。

1.4 Linux 安装

以 Ubuntu 为例:

复制代码
sudo apt update
curl -fsSL https://deb.nodesource.com/setup_lts.x | sudo -E bash -
sudo apt-get install -y nodejs

sudo npm install -g @openai/codex

mkdir -p ~/.codex
touch ~/.codex/auth.json
touch ~/.codex/config.toml

二、VSCode 插件:让 Codex 进 IDE

装完 CLI 之后,强烈建议把 VSCode 插件也装上。

在扩展商店搜 "Codex",装 OpenAI 官方那个。装完侧边栏会多一个 Codex 图标,点进去就能直接在 IDE 里对话,比终端方便太多。

插件和 CLI 共用同一套配置文件,所以前面 auth.json 和 config.toml 配好就行,插件不用额外设置。


三、Codex 核心命令速查

命令 作用
/model 切换模型和推理等级(Low/Medium/High)
/approvals 设置授权模式(Read Only / Auto / Full Access)
/new 开新会话
/init 自动生成 AGENTS.md 项目指导文件
/compact 压缩上下文,防止 Token 超限
/diff 显示 git 差异
/mention 引用文件(用 @文件名
/status 查看当前配置和 Token 用量

3.1 AGENTS.md:让 Codex 懂你的项目

在项目根目录放一个叫 AGENTS.md 的文件,里面写项目架构、技术栈、编码规范。Codex 每次启动会先读这个文件,相当于给 AI 一份"入职手册"。

/init 命令可以自动生成初版,然后自己再改。

3.2 授权模式怎么选

权限 Auto(默认) Read Only Full Access
读文件
编辑文件
运行命令
访问目录外文件 需确认
访问网络 需确认

建议: 日常开发用 Auto,需要 Codex 自主跑测试或部署脚本时切 Full Access。

3.3 引用文件与图片

  • 引用文件:@文件名,会弹出候选列表

  • 粘贴图片:直接复制图片到终端,Codex 能识别(比 Claude Code 的拖拽方式顺手)


四、MCP 扩展:让 Codex 连外部工具

Codex 支持 MCP(Model Context Protocol),可以接各种外部服务。

config.toml 里加 mcp_servers 段:

复制代码
[mcp_servers]
[mcp_servers.context7-mcp]
command = "cmd"
args = ["/c", "npx", "-y", "@smithery/cli@latest", "run", "@upstash/context7-mcp", "--key", "你的密钥"]

然后在 Codex 终端输入 /mcp,能看到已启用的服务列表。


五、从写代码到跑自动化:Codex 的落地场景

Codex 很强,但它本质还是个代码生成工具。真正要把能力落地到日常重复工作里,比如:

  • 每天定时抓取网页数据

  • 自动填表、提交表单

  • 批量处理 Excel 报表

  • 定时给钉钉/飞书发通知

  • 把脚本打包成可执行文件发给同事

这些场景 Codex 能帮你写脚本,但执行、调度、分发、授权这些环节,需要另一个工具来补全。

我自己目前的做法是让 Codex 写 Python/JS 脚本,然后用一个国产 RPA 工具 来承接后续环节。这个工具叫蓝印RPA,免费,个人开发者和小团队够用了。

5.1 为什么需要 RPA 来补 Codex 的短板

Codex 擅长的是生成代码,但它不解决这些问题:

  1. 怎么定时跑? ------ 需要任务调度

  2. 怎么打包给非技术人员用? ------ 需要 EXE 导出

  3. 怎么控制权限? ------ 需要授权机制

  4. 数据安全怎么办? ------ 需要本地离线运行

  5. 怎么触发? ------ 需要 API 接口或消息推送

这款工具刚好补了这些缺口。我自己实际在用的几个点:

① 脚本打包成 EXE

Codex 写好的 Python 脚本,在它里面可以直接封装成独立 EXE,发给同事双击就能跑,不用装 Python 环境。还能设置授权码,防止脚本被随便复制走。

② API 触发 + 定时执行

写好的自动化流程,可以通过 API 接口被外部系统调用,也能设置定时任务。比如每天凌晨 2 点自动跑数据抓取,抓完自动推送到钉钉群。

③ 内网离线运行

数据敏感的项目,流程和数据全部存在本地,不上传云端。这点对金融、政务、医疗类项目特别重要。

④ 自定义界面

可以把脚本包装成带 UI 的小工具,非技术人员也能用。比如做一个"一键导出报表"的按钮,点一下自动跑完整个流程。

⑤ 对接大模型 + 浏览器自动化

它本身也接入了文心一言、豆包、DeepSeek、Kimi 这些模型,支持图片 OCR 识别。还能对接紫鸟、比特、HubStudio、AdsPower 等指纹浏览器,做电商自动化、批量账号管理这些场景很顺手。

⑥ Agent 智能指令 + 消息推送

最新版本加了 Agent 功能,用 DeepSeek V4 模型做智能指令解析。还能在钉钉、飞书、企微、个人微信里直接控制流程执行,执行完回调通知结果。

⑦ 在线推送更新

打包好的 EXE 应用,后续更新不用重新发文件,打开应用自动检测新版本,点一下就能升级。

5.2 一个实际的工作流示例

我现在的典型工作流是这样的:

复制代码
1. 用 Codex 写核心逻辑脚本(数据抓取/处理/分析)
   ↓
2. 用这款工具搭建流程框架(定时触发、异常处理、日志记录)
   ↓
3. 封装成 EXE,设置授权码
   ↓
4. 发给业务同事,或者部署到服务器定时跑
   ↓
5. 执行结果通过钉钉/飞书推送通知

这个组合用下来,Codex 负责"聪明的部分",它负责"靠谱的部分",各干各擅长的。


六、常见问题排查

6.1 Codex 启动报错

按这个顺序排查:

  1. Node.js 版本 ------ 必须 22+,用 node -v 确认

  2. API Key 分组 ------ 必须选 Codex 专属分组,别选通用分组

  3. 额度设置 ------ 建议设无限额度,有限额可能中途断掉

  4. 配置文件路径 ------ Windows 是 C:\Users\用户名\.codex,别放错

  5. 终端重启 ------ 配置改完必须重启终端,环境变量才生效

6.2 Token 消耗过快

  • /compact 压缩上下文

  • 推理等级从 High 降到 Medium

  • 复杂任务拆成多个小任务,别一次塞太多

6.3 上下文窗口不够

Codex 的上下文有上限,长项目容易触发。我的做法是:

  • AGENTS.md 精简项目描述

  • 长对话用 /new 开新会话

  • 把大任务拆成模块,逐个处理

Codex 是个很强的编码助手,但从"能写代码"到"能跑自动化"中间还有一段距离。这段距离需要用 RPA 工具来填补。

如果你也在折腾 Codex,建议试试这个组合:Codex 写核心逻辑 + 蓝印RPA做封装调度。免费、本地运行、能打包 EXE、能定时触发、能推送通知------对个人开发者和小团队来说,这套方案性价比很高。

相关推荐
namexingyun1 小时前
拆解Fable 5三重安全护栏:模型路由、蒸馏防护与生物安全分类器的技术原理 - 微元算力(weytoken)
java·人工智能·python·安全·架构·ai编程
不大姐姐AI智能体1 小时前
实测教程:用 Codex 配合 HyperFrames,把公众号文章做成可渲染的讲解型视频
人工智能·经验分享·gpt·自动化·aigc
2601_956414142 小时前
迈向智慧实验室:金现代的全链路质量管控与自动化解决方案
运维·自动化
天朝八阿哥2 小时前
使用Lazarus解压gzip
ai编程
曲辕RPA2 小时前
曲辕RPA-点击手机元素
智能手机·rpa
ZzT4 小时前
瑞幸 Skill 实测,看看点一杯咖啡到底耗了多少 token
ai编程·claude
ShGamu4 小时前
自动化输送设备公司选型参考与核心维度梳理
运维·自动化·自动化输送设备
一个大苹果4 小时前
一文讲清 CLI、MCP、A2A、A2UI 和 AG-UI
ai编程
一晌小贪欢4 小时前
第26节:自动化办公——利用 Python 自动生成动态分析报告 (PPT/PDF)
开发语言·python·数据分析·自动化·powerpoint·pandas·数据可视化