大家好,我是志辉,分享 AI 工具、AI 编程前沿咨询,助力通过 AI 编程实现人生第一桶金。
Codex介绍
最新版本 plus 用户也可以使用 Codex 工具了,大家可以都去试一下,还是很多新鲜功能的。
5.16 深夜放炸弹,OpenAI 放出全新的 Codex 工具,这次是基于云的一站式解决编程的智能体。
其实 Codex 早期就有了这个产品,并且经历了三个版本,现在的第三个版本就是 5.16 刚发布的Codex。
Codex 历史
第一时期
可以看到其实早在 2021 年 Codex 就存在了,只不过当时AI 在编程领域还没有掀起什么水花,并且文字领域也在刚开始起步。所以大家听的不太多

第二时期
就来到了 2025 年,Codex CLI
这个是本地的一个交互式命令行的智能体,领配置就可以让智能体帮你写代码,修改代码 bug。
主要他还开源,你有什么问题可以自己解决,也可以开发自己的新特性。

并且在 FAQ 里面可以看到这个就是由原来的 Codex 发展而来的,改变成了 Codex CLI。

第三时期
也就是5.16 刚发布的新的云上的 Codex
可以看到OpenAI 对于 Codex 这个词语还是比较执着,也在一直探索编程和人的交互模式,和机器的共存模式。
Codex 由 codex-1 提供支持,codex-1 是针对软件工程优化的 OpenAI o3 版本。它在各种环境中使用强化学习对实际编码任务进行训练,以生成与人类风格和 PR 偏好密切相关的代码,精确遵守指令,并且可以迭代运行测试,直到收到通过的结果。

性能到底怎么样
并且在 SWE测试中,codex 打败了 o3-high 模型,跑分更是来到了 72.1%,比 Claude3.7 的 70.3% 还要高。

就想奥特曼说的,codex 的横空出世,大家对创意的实现会越来越多,会有更多的软件创造出来。彻底重新塑造编程范式。

Codex 的卖点
我这里先稍微总结下 Codex 的几大卖点,后续通过官方数据,还有我们实际的测试来验证。
-
可以通过设置任务就可以了解你的代码,而不需要很复杂的配置;
-
根据用户的代码习惯,修改出更加贴近符合用户的代码;
-
避免随意发挥,比如恶意删除你的代码这些事情(Cursor 发挥过大的恶魔痛处呀)
-
足够安全,在云上运行,任务执行的时候,是禁止访问互联网,把不可控降至最低。
贴近人类习惯偏好
为了说明这个大的特性,官方特意举例了 4 个例子来验证
astropy
astropy 是一个用于天文计算、数据分析和可视化的 Python 库,提供了丰富的工具和数据结构,帮助天文学家处理和分析天文数据。
下面提到的问题就是:建模 "separability_matrix" 无法正确计算嵌套复合模型的可分离性。

下图可以看见Codex 就修改了核心的错误代码,而 o3 加入了很多注释,这些注释很大极有可能是对当前迷惑的。

matplotlib
matplotlib 是 Python 中最流行的数据可视化库之一,提供了广泛的绘图功能,可创建从简单的图表到复杂的出版物级别的图形。
这次修复的问题是:在"mlab._spectral_helper"的 Windows 校正窗口中不正确。

可以看出来,Codex 修改的代码更简洁,而 o3 又加入了一堆的注释信息

django
Django 是一个高级 Python Web 框架。
这里解决的就是SQLite查询 MySQL 的时候有问题。

可以看到,Codex 解决的时候真实考虑到了问题的所在,而 o3 就在一个地方写了很长的代码。

expensify
expensify是一款功能强大的商业智能应用,主要就是提供全面的费用管理解决方案。
这里的问题就是:LHN删除后,成员聊天室的名字没有及时更新。

那么看一下看 Codex 的解决还是比较简洁的,看 o3 就比较添油加醋,甚至还加了写无效代码。PS:它在想些啥了。

官方介绍
大家如果对后面的案例步骤比较多,先不想看的话,可以先看看官方的4分钟的简单介绍视频,这个视频简单说明了操作步骤,然你对 Codex 有了整体的认识。
特意使用剪映给大家加了双语字幕,还特意纠正了下翻译不正确的地方,如果还有不对的,可以提出来指正。
v.douyin.com/jf6uOw5kAsA... 复制此链接,打开观看(不能直接放视频,只能放链接了,大家有问题可以联系我)
打怪升级
下面我们就手摸手带你从新手村一直打到通关。
== 新手村 ==
想让我们从新手村开始,熟悉整个流程,对 Codex 有个大致的认识。
目标
- 熟悉 Codex 是什么东西
- 整体 Codex 的流程是怎么玩的
第一步:打开 Codex
打开gpt 网站:chatgpt.com/
如果你已经是 pro 、team 或者是 enterprise 用户,打开首页,看左侧就可以看到 Codex 的字样,并且右侧还有蓝色框着重提示。
点击 Codex
加红加粗,毕竟花了大价钱,给足仪式感,那让我们开始吧。

点击下面的「开始使用」,别说,这个背景我还是蛮喜欢的,有个性,并且是动画显示的

第二步:设置 MFA
也就是双重验证,这里点击「设置 MFA 以继续」进行下一步操作
注意这里,界面上也告诉你了 Codex 能做什么?
1、创建 Github PR
2、审查代码、发现错误、解决问题
3、运行测试用例代码
4、对大型代码库友好

调到如下页面,我这里使用了「Google Authenticator」App 来扫描这个二维码。

扫描完后,就可以输入手机 App 上显示的 6 位数字。
第三步:连接 Github 账号
点击「连接到 Github」就会授权 Github 账号登录。

跳转到授权页面

然后就跳转到 Codex 页面,这个时候我发现工程也没有,显示的 Github 组织信息也没有,要不就点击「添加 Github 账号」试试。

原来是要安装个 GPT Connector,可以看到,列举了当前浏览器登录账号的组织列表,还有你个人仓库,我这了就先选择个人仓库了。

点击安装授权

这个时候再回来发现,就看到你的项目了,我这里选择了之前一个前端的项目,先测试下看看

第四步:创建环境
点击上面的「创建环境」,就可以看到"创建环境成功"的提示。
这里有个模型改进的选项,默认勾选,这里我保持默认。

第五步:准备工作
很贴心,到了这一步骤,Codex 给你提供了 3 个开始的任务。
- 就是讲解代码,让 Codex 帮你读懂你项目里的代码。
- 就是找到错误,并修复这个错误
- 这里就是提 PR 流程。
没啥问题,我们就愉快的「Start tasks」吧

第六步:开始任务
就进入到后面应该很频繁使用的一个页面。可以看到我们当前的项目,还有当前的分支。还可以看到现在正在运行的任务。

第七步:查看任务过程
我们点击第一个「查找并修复错误」任务进去,查看详细的任务流程。
任务:查找并修复错误

可以看到,经历了接近 3 分钟后,找到了整个工程的一个错误,不过运行测试用例的时候报错了,这个我们后面看看怎么修复下。

任务:讲解代码库结构及学习建议
经历过 1 分钟后整个代码就阅读完毕,Codex 给了整体的目录结构,还有大致的知识点,最友好的还给了学习建议。
学习建议还是不错的,对于新手接收一个新项目的时候,难免会沉溺于浩瀚的代码中无法自拔,这个会给出项目的整体认知,以及后续需要准备的知识点。

任务:修复拼写错误和改进测试
可以看到也是大概 3 分钟的样子给出了 4 点建议
- 拼写错误
- bug(问题)
- 不匹配的注释
- 确实的测试用例

这里有点惊讶的就是它知识帮你列举出来需要改动的点,然后你需要点击 「验证码」(这个估计翻译的不对),然后就可以看到「查看任务」的按钮,点进去就可以看到实际的任务才启动。
这里的点的好处就是没有随意改动你的代码,而是要让你确认后才会真正的开始任务进行修改代码的操作,足以 Codex 对于 AI 在编程上的体验还有人的参与过程还是有深度参考的。
这里截图我再用第三点:缺失的注释来看。

可以看到 1 分钟就解决了。最重要的就是中文的支持也很强。"当前"也识别出来了。

第八步:提交 PR
还是在上面任务的页面,右上角有「推送」的按钮,鼠标单机就可以看到「创建PR」的选项。

然后就会变成「查看拉取请求」

点击就会跳转到 Github 的页面,如下图,Codex 已经帮我们填写好了 PR 的信息,并且也是重新拉取分支改的代码。和真实的流程是一样的。

第九步:Github 合并 PR
如果你是程序员,参与过开源项目,那一定很熟悉这个流程,否则还是比较陌生的。
我看看后面单独加餐说一下,也可以找一些开源项目看看他们的 contributing 文档。
这里就接入到上面的步骤,点击「Merge pull request」就可以。
因为我这里登录的就是我有权限的账号,我是这个项目有权限的,如果你是参与普通项目,那么就可以等待项目的 PMC 合并。
点击「Merge pull request」。

如果信息不需要改动的话,直接点击「Confirm merge」就可以了。

后面可以看到状态已经改变为 Merged,就证明已经合并到默认的分支了(我这里是 dev)。

新手村总结
到了这里其实对 Codex 有了大概的认识,相对于 Manus 这种高级综合智能体来说,它不能帮你创造一个 app 或者一个系统,并且任务运行的时候,不能联网,那么比如让Codex 综合一些财报、或者 AI 新闻那是不太可能了。
那么相对于Cursor、Windsurf这中编程工具来说,给到的更多,不用自己提示词,直接给你搞定一些,比如你是新手刚入手一个项目,那么就可以用 Codex 的自带的任务开始,对一个新的项目有足够的了解。而这一切不用下代码到本地,不用打开 IDE 工具。
新手村的总结我们就先到这一步了,那么继续下一步高手进阶。
== 高手进阶==
目的
前面我们都是按照 Codex 给的自带的任务来操作的,下面我们主要战场集中在下面的区域。
也是时候请出我们的提示词大法了。

那我们这里分为两类,一类是找出 bug ,帮我们解决掉;一类是看能不能写一些新功能。
环境准备(前端 React 项目)
这里因为设计到实际的 bug 解决,还有功能特性开发,并且这里是前端,也不能实时看到效果,所以还是要回到把代码下载到本地,然后通过代码编辑器打开。
前端工程代码是之前写的一个拖拉拽节点,用在数据创建任务流程的。放个截图大概看下什么样子吧,比较简陋,我们就用这个先测试。

场景:解决 bug
输入如下的提示词,我的目标是先让 Codex 自己找bug,另外就是让 Codex 类似重构代码的操作,讲代码的"可维护性"提高。
吐槽下中文翻译,「询问」「验证码」到底是个啥意思,手动无语。
ask:类似 Cursor 中的 ask 模式,AI 轻度参与整个过程,操作是需要人来确认的
code:现在的 agent 模式或者是 builder 模式,AI 帮你搞定一切。

那么先使用「ask」(询问)模式测试下。可以看到下面马上就添加了任务。

等待它处理任务。

可以看到已经在疯狂的思考,并且阅读代码,按照我们提的要求来看有待改造的地方。

整个任务 4 分钟完成了,哈哈哈,我去喝了杯水,回来还刷了视频,看这个智能体帮我完成,我就可以开始是嘎嘎点击看要哪些了。

ask(询问)模式就是 AI 帮你挑出需要修改的地方,然后看你需要修改哪些地方,点击code(验证码)就是真正的执行任务,开始修改代码了。

我们点击第二个:Clean up debug logging
我之前在 Cursor 里面通过提示词尝试使用过这个功能,结果可想而知,项目直接废了,人直接崩溃。

开始工作

可以看到注释掉了 4 个代码文件的 console.log 代码

下面我就可以点击右上角的推送,把代码推送到 Github 仓库中。

接下来的步骤跟前面的第八步和第九步一样了。
另外回到 Codex 的首页,可以看到合并代码的任务也会显示"已合并",你可以看到哪些任务是已经处理完的,这个小细节还不错。

场景:新增功能特性
这里我们让他帮我写一个新功能看看什么样的。
markdown
给整个页面加入顶部的导航栏,要求如下:
1. 使用 antd 的组件
2. 导航路由保留现在的"Home","Dashboard","About"。
3. 左上角加入 logo,如果工程里没有合适的,请帮我根据整体代码情况帮我创建一个。
把上面的提示词输入下面

我们点击 ask(询问)模式。下面就会看到添加的的新任务,点击进去查看任务执行过程的详细。

这次提的要求估计流程会长很多,意想不到,3 分钟也帮我完成了。

这里我再贴下「日志」一栏有些截图,看下 Codex 是如何工作的。
就拿 logo 这个需求点来说,Codex 的工作还是很细致的,先找找看工程中是否能有符合要求的,并且还看是否合适,最后发现没有合适的,就创建了新的 logo 文件。
本来想粘贴「日志」的全部截图,但是太长了,试了各种办法还是没有弄好,只好放弃了。
「日志」我认为才是 Codex 的精华,它就告诉你他是如何工作的,比如之前提到的它是贴近人类的习惯去写代码,不会加入一些乱七八糟的代码,从这写日志里面就可以看到,还是做的比较好的。
我大概看代码,是帮我完成了我想要的功能。
- 可是这里我有个问题,就是不能调试?只能提交代码后,然后我再本地拉取代码,本地调试看到页面效果。
- 还有一个点就是:如果改的代码并不合适,我只能通过 git 回滚代码,然后重新让 Codex 帮我解决问题,然后再重复这个过程,这样子看起来时间有点长呀。
- 补充第三点:这个是针对前端代码需要可视化的,因为它提供了 Testing 测试用例的输出,比如像后端 Java 代码还有其他代码,通过跑通测试用例基本就可以完成功能。这个看来很依赖测试用例,但是我欲言又止,有想聊的可以单独再找我。
先留个 TODO ,等我再找找看是不是有其他办法,或者 OpenAI 后续会解决这个痛点。
突然注意到右上角「推送」有个「Github 草案」,这个工程不是直接提交 PR 请求,而是一个 draft 提交。
提交后看到如下,提价的是 Draft 的,还可以看到代码是提交到 codex/logo 的分支。

而我就可以在本地切换到 codex/logo 分支。可以看到本地修改的代码已经在这个分支上了。

那我就切换到 codex/logo 分支,启动本地的服务,看到顶部的菜单栏已经给我们修改好了。

高手阶段总结
1、直接使用提示词来跟 Codex 对话,提出你想要的修改点,就可以改动成功
2、由于是通过对测试用例的运行来判断是否解决代码,云端没有服务可以验证,如果对前端这种调试可能不太方便,还是需要本地调试代码。
3、有 ask(询问) 和 code (验证码)两种模式。
- ask(询问):适合做项目重构,或者是新特性这种改动比较大的,让 Codex 给出方案,你自己再决定是否需要真正的落地执行;并且还适合问一些代码问题,你想了解代码的架构等。
- code (验证码):比如要修复一些安全漏洞或者是修复一些问题,或者是添加一些测试用例,这些 Codex 能够很明确的改动的就可以直接使用 code 模式。
== 顶峰相见 ==
这一部分尝试一些高级的玩意,比如直接让 Codex 从零到有创建一个项目,也尝试下大一点的项目,另外也是最终的就是介绍 AGENGTS.md 文件。
场景:空项目
目的
直接通过提示词写一个全新的项目。
第一步:创建项目
在Github上创建一个项目

第二步:创建新的环境
这次由于是新的工程,我们就需要创建新的环境了,点击右上角的「环境」,再点击 「创建环境」。
选择我们刚刚创建的项目,直接「创建环境」即可。

第三步:创建任务
markdown
此项目目前是一个空项目,现在需要让你创建一个俄罗斯方块游戏,要求如下:
1. 此游戏最好直接有启动程序,可以在 mac 和 Windows 上运行;
2. 语言建议使用 python 或者js;
3. 执行环境最好也在项目里配置好,避免用户还需要配置本地环境;
4. 设置关卡,每个关卡通关后可以获取相应分数;
5. 有重新开始按钮
由于是空项目,我就直接点击 code(验证码)运行了。

已经开始思考:

第四步:启动任务
这儿时候我们我们就可以去摸鱼了,没想到,1 分半就搞好了?

我们下载到本地验证下看看。
看到使用的是前端语言来实现的,那么本地环境就不需要,直接浏览器打开 index.html,看一下效果。
使用说明都写在了 README.md 文档里。

看起来还比较像模像样,分数也有,操作也可以。
第五步:完善
发现 README.md 是英文,我想改成中文试试

不到一分钟就完成了。

这里主要是什么吗?可以同时添加很多任务,多个任务之间都是在隔离的容器环境里执行,这个时候你可以去干别的事情,等任务都完成后,你就可以直接验收结果就可以了。
总结
直接看结果可能比较简单,但是我仔细看了下「日志」,这一番下来是做了很多工作。
这一部分足以见得很智能,在使用 Cursor 等编程工具的时候,就是会一直报错,并且它改了代码后,又有新的错误,就一直在修改错误的过程中往复。目前在 Codex 看来还是比较智能。
- 比如写完代码后会发现问题,Codex 会一直自动修复

- 并且最后会整体做测试,保证整个程序是可运行的。

- 并且很贴心完善了 README.md 信息,

场景:Java项目
目的
这里我 fork 了项目中使用的调度系统 DolphinScheduler,来看看在针对大部分后台项目
DolphinScheduler 项目的 Java 代码大概在 25w 航左右,前端的 ts 代码也在 5w 行左右。
第一步:fork 项目
fork 项目后,就可以在自己的空间中看到自己的项目了。

第二步:创建新的环境
按照之前的步骤创建新的环境,选择「dolphinscheduler」项目。

第三步:项目整体情况
任务一:项目整体情况
我们还是先看看对这样的大型项目,Codex 对它的初步研究需要多久,之前新手村的例子是话费了 1 分钟的时间。

任务二:给我们添加 AGENTS.md 文件
并且我继续添加任务。

可以看到下面有两个任务都在处理中。

任务一结果
阅读速度很快,差不多 1 分半就完成了。看了下准确率还是比较准的,每个目录的功能,还有核心架构都指出来了具体的文档。

任务二结果
差不多 3 分钟后,AGENTS.md 文件帮我们生成了。总结开发过程中的一些点,包括编译和测试,还举出了代码样式,最后还列觉了提交 git 记录的格式。
打开日志看到信息很多,我大概看了下,Codex 在这个里面步骤还是很多的,基本 README.md 文件,还有 docs 文件,还有 contribuing.md 文档都有去阅读到。

第三步:修复 issue
这次尝试下直接从官方仓库的 Issued 里面挑一个问题让 Codex 帮我们解决看看。

任务大概在 3 分半完成,有完整的日志过程,你可以看到 Codex 在这个里面完整的过程。

如果没啥问题,我们就点击 code 开始正式的任务。相当于前面的过程是生成提示词的过程,也相当于生成任务的任务,帮我们把最后需要修复的代码再生成一个任务,这个任务就是每个步骤确定需要修改哪些地方。

不过这里也注意到,因为运行的过程中是没有网络的,所以关于网络的问题就会被中断

大概 3 分钟之后完成任务,可见这里这里是使用测试用例来验证是否正确,如果按照本地调试的方式就不是很方便,还需要 clone 代码到本地再调试是否修改正确。

并且这里在 Testing 的阶段编译的时候,不能联网,也就是这个时候如果需要联网是不太行的。
总结
其实到这里我们能够验证的就基本验证完成了,基于 ChatGPT 的认知,现在 Codex 在编程语言层面问题应该不大,并且现在 Codex 融合了很多步骤,也不会大改代码,都是基于现有工程环境或者文档里的步骤来进行修改代码,有一个完整的开发、验证、修改、确认修改、测试用例的步骤。
不过有一个点比较别扭的就是要有完整的测试用例,国内目前实际业务相关的代码测试用例是比较缺少的,一般都是放在实际的流程中验证,或者是在测试环境里面进行黑盒测试。那么 Codex 现在的流程写完代码后就无法验证到底是否正确,还需要额外的操作来验证。
并且在大型项目中的速度和准确度还是比较快的,后面有机会可以再尝试下百万级的项目看看。
AGENTS.md 文件
介绍
类似 Cursor 的.rules 文件,给大模型提供上下文信息。
AGENTS.md是一个标准的 Markdown 文件,所以里面的格式也是 md 格式。Codex 会读取里面的内容,我们在前面的步骤也可以看到,每次启动新的任务的时候就会去找 AGENTS.md 文件,然后读取。
并且 AGENTS.md 是嵌套的,这个 Codex 也会读取到,这个多用在项目里是多 modules,或者是前后端项目在一个项目里。
使用
方法一:Codex 生成
比如前面 Java 项目里的时候,直接就让 Codex 升成,合适的话,我们再修改这个文件也可以。
方法二:直接创建生成
比如在代码根目录直接创建 AGENTS.md 文件,然后手写文件。这块也可以参考官网给出的格式。
vbnet
# Contributor Guide
## Dev Environment Tips
- Use pnpm dlx turbo run where <project_name> to jump to a package instead of scanning with ls.
- Run pnpm install --filter <project_name> to add the package to your workspace so Vite, ESLint, and TypeScript can see it.
- Use pnpm create vite@latest <project_name> -- --template react-ts to spin up a new React + Vite package with TypeScript checks ready.
- Check the name field inside each package's package.json to confirm the right name---skip the top-level one.
## Testing Instructions
- Find the CI plan in the .github/workflows folder.
- Run pnpm turbo run test --filter <project_name> to run every check defined for that package.
- From the package root you can just call pnpm test. The commit should pass all tests before you merge.
- To focus on one step, add the Vitest pattern: pnpm vitest run -t "<test name>".
- Fix any test or type errors until the whole suite is green.
- After moving files or changing imports, run pnpm lint --filter <project_name> to be sure ESLint and TypeScript rules still pass.
- Add or update tests for the code you change, even if nobody asked.
## PR instructions
Title format: [<project_name>] <Title>
可以看到这个步骤的划分跟 Codex 自动生成的基本一样,你需要做的就是把里面的参数换成自己的。
这块后续跟 Cursor 的 rules 文件一样,也是需要持续精进学习的,我理解这就是大模型的指导方向,因为在大模型上下文的限制的情况下,特别是大型项目的情况下。
零散知识点
环境
右上角有「环境」可以点进去看看。

可以看到当前仓库的环境信息。

点进去可以看到详细的环境信息。

这个时候如果你需要修改,就可以点击右上角的编辑。
刚一进来是基本信息,这个看起来用的比较少。

重要的是下面的「高级」信息。

下面详细来说这里的设置
容器镜像
目前来看只有"universal"一个选项,看提示语后面应该是可以自定义的,期待。

设置包版本
这个很容易了解,就是你需要的语言的版本,可以调整你想要的,如果你的工程对版本有要求。

环境变量
比如我设置如下,那么我就可以在代码里获取"JAVA_VERSION"的值。

密钥

设置脚本
这里应该是重要的地方,特别是那句"仅在设置期间启动 Internet",那么以为有些包的下载,设计到网络下载的,或者是一些初始化的脚本,比如连接数据库初始化,等应该都可以在这个里面操作。

交互式终端
这里有个功能比较重要的就是「连接交互式终端」

看运行结果,就是帮你运行一下你左边的配置是否能运行正常。

手机消息
在跑任务的时候,我看到手机上的消息也弹出来 Codex 的任务进度,很惊喜,虽然手机上的 GPT 的 Codex 还没放开,但是消息现在已经可以看到进度,有种感觉就是后面可以在地铁上直接通过手机改 bug 了,真的是无时无地可以开发工作。(太卷了吧)。

Codex CLI
介绍
官方地址:github.com/openai/code...
使用
需要本地先有 node 的基本环境,且版本至少是 22 版本及以上。
第一步:验证基本环境
- 操作系统:mac 12+,windows 11(WSL2)
- Node 环境:版本 22 及以上
- Git:2.23 及以上
第二步:安装
一步搞定
css
npm i -g @openai/codex
第三步:配置
ini
export OPENAI_API_KEY="your-api-key-here"
第三步:运行
方法一:直接运行
命令行里直接运行 codex 命令

方法二:和参数一起

尴尬呀,咋回事。
继续
用 codex --model 试一下看看,因为上面的日志提到了,就试一下呗

好不容易模型选对了,但是咋又给我提示好像是钞能力不够了?我都是 pro 会员了。

好吧,我打开了 billing 页面,原来api也是要收费的,而我余额为 0 .

再继续
在 FAQ 里面看到模型的选择,突然想到可能是有些模型需要 api 的钞能力支持。

我把模型选择到 04-mini,换个模型继续搞,看到已经开始工作了。

命令列表
使用 / 就可以弹出命令列表。

CodexCLI 总结
可以看到这就是一个本地终端的交互工具,通过终端交互。
这个里面可以思考到什么了,如果他将来支持本地模型,比如 ollma 这些,那有些不好在网上的代码就可以在本地运行了,或者是私有化模型的。
并且这种模式对上层应用是非常灵活的,兼容到现有流程,特别是公司级,比如 CI/CD 流程里面,检测代码风格,或者是发版前检测潜在的问题,及时阻挡问题在线上的出现。
写在最后
原理
This content is only supported in a Feishu Docs
简单的一个图画了下 Codex 的原理。
1、首先不需要本地的任何操作,只需要一个浏览器,打开 Codex 页面(chatgpt.com/codex )
2、任务都基于一个基础的镜像(github.com/openai/code... Docker 容器,然后根据配置的代码分支,把代码 clone 下来,设置 workdir,就开始工作
3、然后容器里面的 CLI 就开始工作,执行终端命令,编写代码,开始测试各种异常看是否需要解决,并阅读AGENTS.md文档。
4、最后当任务完成的时候,就可以选择提交 PR 或者是重新提交提示词开始任务。
总结
下面这里就来个大总结吧。
Cursor/Trae/Windsurf 现在的编程还是相当于半自动,还是需要人工参与很多事情,就比如是一个实习生,你还需要教它很多东西,它才能帮你干活。
但是 Codex 就相当于是外包员工,你就跟它说给我完成啥任务,它就嘎嘎一顿在那里给你操作,并且主要的就是一次性操作,如果你觉得不好,那就让它再来一次,怎么越来越感觉像是在玩 AI图片/AI 视频,各种抽卡,抽到满意就继续(手动狗头)。
现在 Codex 的局限性还是有很多的,比如只能 Github 上的工程,这个对于公司级项目就比较尴尬,并且每个任务都是单独的容器环境隔离,没有一份初始化的上下文环境,只能靠 AGENTS.md 文件来保持一致。
优势
-
智能小能手:完全云上运行,不需要准备环境,直接提示词开干
-
新手友好:入门新项目友好
-
提高效率:如果后续手机端加入,那么效率是很高的,一般的小问题还有文档性操作完全交给 Codex 完成。并且多任务都是可以并行运行的,也完全隔离,互相不影响。
-
代码修改最小化,功能最大化:修改的地方尽可能跟本项目的风格贴近,不会随意瞎改代码。
劣势
-
只能对接 Github 上的项目,这个我相信 OpenAI 肯定会对接更多的平台
-
调试代码,针对国内的测试用例缺失,调试代码可能没有本地 Cursor 这种工具本地修改来的方便
-
单独任务的上下文环境信息共享信息缺失,每次都需要下载代码、阅读AGENTS.md文档,可能每次任务的初始化信息的时间都需要考虑
-
运行任务过程中不能连接互联网:虽然安全,但是如果运环境不支持的功能,而需要互联网解决的就束手无策了。
总得来说,现在的 AI 工具发展很快,从去年的 Cursor 崛起,到今年的 Manus 火爆,再到现在的 Codex,后续 AI 编程的世界也会越来越精彩