Codex + Claude Desktop + DeepSeek V4:AI 编程双核驱动配置指南
规划 Agent 负责想,执行 Agent 负责做,这是当前 AI 编程效率最高的打开方式。
一、为什么是双核架构
现在市面上的 AI 编程工具很多,但大多数是单 Agent 模式:你说一句,它做一步。
这套方案不一样。它是两个 Agent 分工协作:
| 角色 | 组件 | 职责 |
|---|---|---|
| 规划者 | Codex + DeepSeek V4 | 理解项目、设计方案、拆任务、审代码 |
| 执行者 | Claude Desktop + MCP 工具 | 读写文件、跑测试、操作浏览器、调 API |
Codex 负责想,Claude 负责做。 这才是真正能用起来的协作模式。
二、三个组件分别是什么
Codex ------ 架构规划中枢
Codex 是一个终端里的 AI 编程代理。它最大的优势是能理解整个项目------目录结构、模块依赖、代码风格、测试覆盖,它都会自己去读。
搭配 DeepSeek V4 后端之后,推理深度非常强:能跨模块 trace 调用链,能在重构时保持接口兼容,能一次性完成"分析→设计→编码→测试→修复"的全链路。
定位:当大脑,不做具体执行。
Claude Desktop ------ MCP 执行引擎
Claude Desktop 在这套架构里不是用来对话的,而是作为 MCP 协议服务器,向外暴露各种工具接口:
- 读写本地文件
- 启动和控制浏览器
- 连接数据库
- 运行 Shell 命令
- 操作 Git
- 生成设计图
Codex 通过 MCP 协议调用这些工具,让 Claude 完成实际的落地操作。
定位:当手脚,不做复杂规划。
DeepSeek V4 ------ 推理后端
通过 Moon Bridge 路由接入 Codex,作为深度推理引擎。代码理解和生成能力一流,成本远低于 GPT-4 级别模型。
三、协作流程
你的指令(自然语言)
↓
Codex 接单
├── 读取项目,理解上下文
├── 设计方案,拆解任务
├── 生成代码 / 漏洞分析 / 修复方案
└── 通过 MCP ↓
Claude Desktop
├── 创建 / 修改文件
├── 编译并跑测试
├── 操作浏览器做验证
├── 提交 Git 和创建 PR
└── 返回执行结果给 Codex
↓
Codex 审查结果 → 迭代优化 → 最终输出
这套流程下,你说一句话,两个 Agent 自动分工走完全程。
四、配置步骤
4.1 准备 DeepSeek V4 API
去 DeepSeek 开发者平台申请 API Key,这是整个系统的推理底座。
4.2 安装 Codex 并配置后端
- 下载安装 Codex 桌面版
- 在设置中添加 DeepSeek V4 模型端点
- 选择
deepseek-v4-flash(快速)或deepseek-v4(深度推理) - 推荐设置 reasoning effort 为
high或xhigh
验证:
帮我分析一下这个项目的模块结构和依赖关系
如果输出有条理,说明 Codex 和 DeepSeek V4 正常工作。
4.3 安装并配置 Claude Desktop
- 从 Anthropic 官网下载安装 Claude Desktop
- 在设置中开启 MCP 协议支持
- 添加所需 MCP 工具
推荐安装的 MCP 工具:
| MCP 工具 | 用途 |
|---|---|
| Filesystem | 读写本地文件(必备) |
| Browser | 浏览器自动化,前端测试和渗透验证 |
| GitHub | PR 管理、代码审查、CI 调试 |
| Playwright | E2E 测试框架 |
| Database | 数据库连接与查询 |
| Node REPL | 执行 JavaScript 代码片段 |
| Shell | 运行命令行脚本 |
4.4 验证联动
一句话让两个 Agent 配合干活:
帮我在这个项目里加一个用户登录模块,先用Codex分析现有架构并设计方案,
然后让Claude Desktop去创建文件、跑测试,最后把结果给我。
如果 Codex 先出方案,再调用 Claude 落地执行,说明整条链路通了。
五、对开发效率的提升
5.1 开发新功能
传统流程:
读代码了解风格 → 设计接口 → 手写 CRUD → 补测试 → 编译调试
一个模块下来,少说 60-90 分钟。
双 Agent 流程:
一句话下需求:
- Codex 1 分钟读完项目,理解架构和约定
- 2 分钟设计模块结构
- 调用 Claude 的 Filesystem MCP 创建文件和写入代码
- 调用 Shell MCP 编译和跑测试
- Codex 审查结果、修复失败用例
总计 5-8 分钟,质量不低于人工。
5.2 调试复杂 Bug
经典场景:ConcurrentHashMap.get() 报 NPE,堆栈只指向工具类,看不出谁传了 null。
人工逐层打断点加日志,两小时起步。
双 Agent 模式:
- Codex trace 6 层调用链,2 分钟定位问题(异步回调竞态,初始化未完成就调用)
- 调用 Claude 的 Filesystem MCP 修改对应源码
- 调用 Shell MCP 重新编译验证
2 分钟 vs 2 小时,差距是数量级的。
5.3 安全审计与漏洞挖掘
这是 DeepSeek V4 推理能力的强项。
给 Codex 一段代码:
扫描这个登录接口,标记所有 SQL 注入和 XSS 风险点
Codex 会:
- 追踪用户输入流向,发现未过滤的参数拼接
- 发现权限校验的逻辑遗漏
- 标记不安全的序列化和反序列化路径
- 识别配置不当导致的信息泄露
然后调用 Claude 的 Browser MCP 自动发送测试 payload、捕获响应,把验证结果返回给 Codex。Codex 分析确认后生成完整的漏洞报告(含 PoC 和修复建议)。
在多个 CTF 题目和真实 Web 应用的审计测试中,这套组合能独自挖出中高危漏洞,人工只需要最终验证和收尾。效率提升 3-5 倍。
六、高效使用技巧
6.1 写好 Prompt
- 给足上下文:不说"优化这段代码",而说"这个接口日调用 10w+,延迟要压到 200ms 内,优先减少对象分配"
- 要求自验证:加一句"改完后跑一遍测试,告诉我哪些没过"
- 复杂任务分步走:先分析 → 给方案 → 确认 → 再执行,比一步到位更稳
6.2 什么时候不用 Agent
- 需要深度行业判断的业务决策
- 操作生产数据库和敏感凭据
- Agent 明确说"不确定"时,别硬让它做
6.3 并行子 Agent
Codex 支持 spawn 子 Agent 并行处理不冲突的任务。比如同时:
- 一个子 Agent 写前端组件
- 一个子 Agent 补后端测试
- 一个子 Agent 查 API 文档
七、一句话总结
AI Agent 能把开发中的重复劳动从 80% 压缩到 20%。省下来的时间,用来做架构设计、业务理解、安全分析这些真正需要人的事情。
这套 Codex + Claude Desktop + DeepSeek V4 的双核方案,是当前把这件事做到最流畅的配置之一。
有问题欢迎交流。