从 豆包 到 Codex CLI:一名普通开发者的 AI 工具进化路线

一、前言

作为一名普通开发人员,我对 AI 工具的上手其实算比较晚。今年五月以前,基本还只是把 AI 当作聊天机器人使用。有时听同事提到一些关键词都听不懂,甚至不知道该如何提问,心里多少有些惭愧。直到最近因为一个契机,沉下心认真摸索了一段时间,才真正感受到 AI 工具的魅力和强大,也切身体会到它对生产效率的提升。刚好趁端午假期,把最近的使用心得简单整理一下。

本来想让 AI 直接输出,尝试了几版都太"AI 化"了,所以文字和截图都是纯手工,希望这篇博文更实用、更有温度。

二、使用演进路线

目前使用过的工具列举:

  • 豆包/元宝/千问/Kimi/DeepSeek/ChatGPT/Gemini
  • Cherry Studio
  • VS Code 插件(OAI Compatible Provider for Copilot)
  • Cursor/Windsurf/Warp
  • Codex 和 Codex CLI

⑴ 豆包

豆包应该是最大众化的一款 AI 工具了,从网页端、浏览器插件、手机App多端体验一致,综合体验下来,它的信息同步能力也是我用过的工具里比较好的,尤其是网页端,即使对话很长也不容易卡顿。

有段时间想体验一下不同的模型,自己写了一个iframe,把多个网页嵌进去(两个、三个、四个),可以在一个页面同时问问题看答案,所以很长一段时间我都是这么用 AI 的,看下图:

两个

三个

四个

豆包浏览器插件

⑵ Cherry Studio

后来发现 Cherry Studio 也可以同时接入多个模型,甚至可以通过代理服务的 token 加载不同模型,整体能力很强。

主界面

切换模型

自定义

⑶ VS Code 插件(OAI Compatible Provider for Copilot)

再后来,集成到Visual Studio Code的IDE中,可以基于开发环境来辅助编程:

插件

配置Base Url

配置Key

直到这个时候,才算开始将 AI 工具和开发工作紧密连接,之前都是遇到不懂的问题,拿着问题问 AI 机器人,再把答案手工贴到IDE中去验证,但这种用法已经可以让 AI 工具直接阅读代码并进行修改。

⑷ Cursor/Windsurf/Warp

再再后来,这些 AI 编程工具横空出世,个个都说能带来革新,各大资讯都在吹捧,也尝试安装了这些工具,但说实话,我是一脸懵的,无从下手。

Cursor

Windsurf

Warp

⑸ Codex

再再再后来,安装了Codex,基于微软应用商店安装的,说实话也没有完全用起来,但其实已经接近今天的重点了。

三、重点讲一下 Codex CLI

直到遇见了 Codex CLI------命令行形式的 AI 工具,目前的感觉是在计算机操作方面"无所不能"、"叹为观止",来着重讲讲"她"。

⑴ 先看最终形态(Windows Terminal + PowerShell + Codex CLI)

很平平无奇对不对?😀,莫慌!一步步来......

⑵ 如何安装

① 安装 Node.js

官网下载:https://nodejs.org/zh-cn/download

安装后验证:

node -v

npm -v

npx -v

② 安装winget、Terminal、PowerShell 7

这几个工具都属于锦上添花,丰俭由人,可以跳过。

当然,这个也可以让 AI 帮你做

③ 安装 Codex CLI

执行命令:

npm install -g @openai/codex

提示安装完成,新打开命令行窗口,输入codex,可以加载即代表安装完成,首次使用会提示登录、绑定信息等。

④ 配置 Codex CLI

路径:C:\Users\Administrator.codex\config.toml

下图是我的配置文件截图和说明:

⑤ 版本说明

Codex CLI 自v0.80以后,逐步取消了chat模式,目前最新的版本是v0.140,所以如果配置国内模型如DeepSeek、Mimo这些,可能要弄个代理。

当然,这个也可以让 AI 帮你做

我嫌麻烦,所以保留v0.80版本,也方便随时切换模型使用,如下图:

⑶ 如何使用

AGENTS.md

Codex CLI 以命令行方式运行,不像桌面软件那样通过图形界面管理项目和文件夹。它更多是基于当前目录和文件上下文来工作,因此要让它更懂你的代码、文档和使用习惯,就需要提前写好提示词规则。

首先是个人习惯 AGENTS.md,基于启动目录告诉她你的习惯:

我的配置,仅供参考

然后是基于每个项目工程写一个AGENTS.md

当然,这个也可以让 AI 帮你做

而且提示词是可以嵌套的,在子文件夹也可以新建这个文件,AI 会自动读取,这样当 AI 加载到对应目录时,会优先读取这些说明,从而更'懂你'。

② Skill

AI 的 Skill 可以理解为:给 AI 预装的一套专业工作流程、规则和工具说明。它不是模型本身,而是让 AI 在特定任务上"按专家方法办事"的能力包。

在github上有很多实用skill,根据star挑选安装即可。

https://github.com/davila7/claude-code-templates

当然,这个也可以让 AI 帮你做

随便试试:

③ MCP

MCP,全称 Model Context Protocol,可以理解为"AI 应用连接外部工具、数据和系统的统一协议"。让大模型不只是聊天,而是可以安全、标准化地访问文件、数据库、业务系统、浏览器、GitHub、Confluence等外部能力。

相关的AccessToken从各个网站的个人配置中去拿

我配置的MCP,wiki、jira、gitlab

这样的话,AI 就可以直接操作wiki、jira、gitlab,随便试试:

④ WebHook

AI 的 Webhooks 可以理解为:当某个外部事件发生时,系统主动通知 AI 或 AI 应用,让 AI 自动处理后续任务。

比如在代码仓库中接入 AI Code Review 流程,每次提交代码后,AI 都可以自动走读代码,再结合企业微信机器人,把本次提交的分析结果和评分推送到群里。

⑤ AI 技能

  • 操作计算机:监测运行状况、批量操作文件、清理临时目录、修复进程如电池图标、配置环境变量、改注册表

  • 安装软件,使用npm、npx

  • 适配所有IDE

    这是我的程序快捷方式,前面提过基于Visual Studio Code的插件,AI 可以读代码,改代码,编译,但都仅限于 VS Code 工具内。而实际上按照使用习惯来说,不同的开发语言用不同的IDE体验还是很大的。比如C#开发用Visual Studio,Java用IDEA,Vue用 VS Code,Python用Pycharm......

现在是这样的:

Visual Studio

IDEA

Visual Studio Code

  • 使用frontend-developer做前端开发

  • 使用webapp-testing读取网页内容

  • 使用webapp-testing进行自动化测试

  • 使用code-reviewer审代码

  • 使用superpowers

  • 生成接口文档

  • 配置MCP,连数据库,结合sql脚本对照数据库

  • 配置MCP,连wiki,搜索文档、总结文档

  • 配置MCP,连jira,搜索问题,总结问题

  • 配置MCP,连gitlab

  • 控制Ubuntu虚拟机,修复OpenClaw配置

  • 操作服务器,安装组件,部署服务等

没有一一截图,基本上对于文件的操作、程序的操作都能胜任,还有更多技能待发掘尝试......

四、Codex CLI + OpenClaw

再来讲讲今年正当红的小龙虾🦞,不敢把所有权限都开放给OpenClaw,所以弄了台虚拟机测试,先安装了Ubuntu,再在里面安装了OpenClaw,安装步骤就不说了,要么根据官网指导,要么让 Codex CLI 直接安装,讲讲如何使用的吧。

⑴ 安装好后长这样

⑵ 绑定微信(名字和头像都可以自定义)

⑶ 微信发指令,带来和电脑一样的操作

① 操作wiki

② 统计管理平台数据

③ 从仓库拉取代码

④ 给计算机安装组件

⑤ 写程序定时推送新闻

五、持续学习ing

  • goal模式全自动化
  • Obsidian学习使用,整理个人知识库
  • RAG学习
  • 局域网Ollama部署,做私有化 AI 应用
  • ......

六、使用心得

先从熟悉领域开始,把念头变成行动。

使用 AI,最好的起点不是追逐最新工具,而是先在自己最熟悉的领域用好它。

比如自己非常熟悉的代码、业务、系统框架、日常流程。因为这些领域自己有判断力,知道 AI 说得对不对,也知道结果是否有价值。

先让 AI 读懂已有代码、优化重复逻辑、生成辅助文档、解释业务流程、检查潜在问题。等它逐渐适应自己的习惯后,就可以把自己从大量重复性工作中解放出来。

带来的思考

持续思考几个问题:

  • 自己操作电脑的一切,哪些可以交给 AI?这些事情现在如何实现?
  • 哪些事情暂时不能交给 AI,但未来出现某类工具后可以交给 AI?还有哪些事情,是 AI 永远无法完全替代自己完成的?
  • 每天可以问自己:今天有哪些事情可以让 AI 帮我做?
  • 进一步还可以问:除了现在已经想到的事情,还有哪些我没想到的事情,也可以让 AI 试试看?
  • 所谓"金钱永不眠",那么自己的 AI 是否也可以"永不眠"?当自己休息的时候,AI 是否仍然可以帮自己整理资料、分析日志、生成报告、扫描代码、监控系统、总结业务、准备明天的工作?

尾声

使用 AI 最大的变化,是它可以把过去脑袋里的一个念头,迅速变成可见的行动和结果。

以前一个想法可能只是想想,因为要学习、查资料、搭环境、写代码、设计页面、调试部署,成本太高,所以很快就放弃了。

现在可以直接让 AI 帮自己做一个初版,马上看到效果,再决定要不要继续深入。

这种感觉就像刚买车一样,不是世界变小了,而是自己的"脚"突然变长了。自己可以到达更远的地方,尝试更多的事情,把更多原本停留在脑子里的念头,真正付诸行动。

相关推荐
岳小哥AI2 小时前
Siri要接入AI了,苹果手机上一句话让GPT写文案、DeepSeek写代码的时刻来了
ai·ai基础
Artech2 小时前
[MAF预定义的AIContextProvider-03]ChatHistoryMemoryProvider——赋予Agent从经验中学习的能力
ai·c#·agent·memory·maf
哥布林学者18 小时前
深度学习进阶(三十一)FlashAttention:IO 感知的精确注意力
机器学习·ai
岳小哥AI1 天前
AI大模型"幻觉"从何而来?解密GPT-4、DeepSeek一本正经胡说八道的真相
ai·ai基础
JaguarJack2 天前
Openai Codex 重大更新 已支持接入任意开源大模型
ai·openai·codex
Artech2 天前
[MAF预定义的AIContextProvider-02]AgentSkillsProvider——将Agent Skills引入MAF
ai·c#·agent·agent skills·maf
岳小哥AI2 天前
读懂计算机视觉CV、语言感知(ASR/TTS)、多模态,就能理解AI是如何“看到”与“听到”世界的
ai·ai基础
大树883 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
施小赞3 天前
普通 RAG vs GraphRAG 核心对比
人工智能·ai