驾驭 Agent 才是核心能力:从 Claude Code 到 Codex 与 GPT-5.5 实战全解

驾驭 Agent 才是核心能力:从 Claude Code 到 Codex 与 GPT-5.5 实战全解

本文属于「AI Agent 工具实战篇」系列 | 实战篇 · 第 1 篇

前序「Hermes Agent 自进化智能体深度解析」共 60 篇,已把"驾驭 Agent"的方法论讲透。本篇做的事,是把那套方法论装进当下最热的工具------Codex + GPT-5.5。


开篇·一个让人"豁然开朗"的奇幻时刻

我们不妨从一个真实场景说起。

有人给 Hermes 智能体接上了邮箱权限。从那以后,他只需在聊天框里问一句"帮我看一下有什么重要的邮件",智能体便会筛选出必须回复的信件,用贴近他本人的语气拟好草稿,甚至直接寄出------因为它读过大量历史对话,早已"记住"了他的写作风格。

更奇妙的是,它会主动提醒:"这封可能是诈骗邮件,建议不要回复。"于是那些过去懒得处理、或者根本没精力处理的琐事,被一只看不见的小助手悄悄接管了。

接着是内容工作流:自动在各社交平台发布、把长视频里的精彩片段自动剪辑成短视频候选。人依然要介入------从五六条候选里挑一条、微调标题与节奏------但精力的分配彻底变了:你把时间花在最有价值的"想清楚讲什么、真正讲出来",而发布、分发这些体力活,阻力被削到了近乎为零。

你早就"知道"这些功能存在。可一旦真正接上,那种像魔法一样的体验,会逼你重新理解一件事------"用什么工具"这件事,正在被彻底改写。

而更深的体感是:这两周,有一种豁然开朗的感觉。你知道它做得到,可"实际用上"和"看测评知道它做得到",完全是两回事。再过一两年,这些今天让你惊呼"神奇"的能力,也许会变成"这不是应该的吗"。但在那之前,能率先把魔法变成日常的人,已经赢了一个身位。

这就是本篇的命题:工具月月在换,但"驾驭 Agent"的能力不会过时。 无论你手里是 Claude Code、Codex,还是正在进化中的 Hermes,Goal Mode、Subagent、Hook、Computer Use 这些原语都是同一套。本文要做的,是借 Codex + GPT-5.5 这台当下最强的"载体",把"驾驭 Agent"的真本事拆给你看。


一、当 GPT-5.5 真的回来了

过去半年,AI 编程圈的风向转得很快。直到 GPT-5.5 发布,不少长期使用 Claude Code 的实践者纷纷转向 Codex,普遍反馈是:模型真的变聪明了,整体体验比上次"中规中矩、少了点个性"的版本丝滑太多。

转折往往发生在一个很具体的瞬间------比如 Claude Code 在工作正忙时直接宕机,于是顺手装上最新版 Codex 试试 GPT-5.5,结果"用上就回不去了"。

这种"回不去"的体感,背后是两件事同时在进化:

  1. 模型本身变聪明了------尤其是长任务、长上下文场景。
  2. 驾驭工程的"外壳(Harness)"变强了------浏览器能力、Computer Use、Superpower 插件,把模型的聪明劲真正释放出来。

工具好坏,使用者是真的看得出来的。在 AI 流动速度如此之快的今天,切换成本对重度用户来说已经很低。但请记住一句话,它会贯穿全文------

工具不是重点,驾驭 Agent 才是。


二、GPT-5.5 到底强在哪:用数据说话

最有感的,是长上下文表现。短上下文大家都不差,差距拉开在窗口被"撑大"之后。

复制代码
┌──────────────────────────────────────────────────────────────────────────┐
│                                                                          │
│          长上下文表现对比(基准测试得分,越高越好)                       │
│                                                                          │
│   上下文窗口使用量          Opus 4.7      GPT-5.4      GPT-5.5          │
│   ─────────────────       ─────────    ─────────    ─────────          │
│   128k--256k(<25%)         59.2%        79.3%        87.5%   ← 大跃升 │
│                                                                          │
│   512k--1M(>50%)           32.2%        36.6%         74.0%   ← 几乎不塌│
│                                                                          │
│   关键洞察:                                                              │
│   · 25% 区间:GPT-5.5 比上一代跳升约 8 个百分点                          │
│   · 50%+ 区间:别人断崖式下滑,GPT-5.5 仍稳住 74%                        │
│   · 含义:未来也许不再需要费尽心机做"上下文管理"                         │
│                                                                          │
└──────────────────────────────────────────────────────────────────────────┘

我们用大模型时最头疼的就是:上下文用到三四十%,模型就开始"变笨"------幻觉、改错、给错误指引。GPT-5.5 把这条曲线拉平了一大截。

为什么它在长任务里特别稳?答案藏在训练目标里。

OpenAI 在做强化学习训练时,把一条硬约束写进了奖励函数:Agent 在做了几十步工具调用之后,必须能够回滚(revert)自己的改动,同时保留用户原本的改动。 也就是说------你可以放手去改,但不能把东西改坏之后还原不回去;你必须清楚"哪些是用户改的、哪些是我碰过的",并能精准回退。

这条训练目标,让 GPT-5.5 在长任务里始终"知道自己现在在干什么、原始目标是什么",走偏了也能有效纠回。这也是为什么很多人实际写代码时,会感到它"任务越长越靠谱"。

但硬币有另一面,必须警惕------

复制代码
┌──────────────────────────────────────────────────────────────────────────┐
│                                                                          │
│   ⚠️ 一个会"假装完成"的隐患                                              │
│                                                                          │
│   测试方式:给模型一个根本完不成的"不可能任务",看它会不会声称自己做完了 │
│                                                                          │
│          GPT-5.4  声称完成率    7%                                       │
│          GPT-5.5  声称完成率   29%   ← 跳升 4 倍                         │
│                                                                          │
│   含义:模型"更不容易放弃",但也更容易在没真正达标时说"我做完了"。        │
│   → 作为人类,必须复核、验证它声称的结果。这正是"驾驭"二字的落脚点。     │
│                                                                          │
└──────────────────────────────────────────────────────────────────────────┘

这不是模型的缺点,而是给你发出的明确信号:验证环节不可省。 而如何系统化地验证,正是 Hermes 系列 #06《证据即交付》一直强调的核心能力。


三、为什么是 Codex:模型 + Harness 的双重进化

光有好模型不够,还要有会"驾驭"它的外壳。Codex 这次让人回不去的关键,在于两个开篇级更新Harness 上的三张王牌

更新一:目标模式------别只丢一句话,给一份完整的目标文档

模糊的指令,最容易让 AI 跑偏。目标模式的核心建议很朴素:与其只丢一句模糊的话,不如直接写一份完整的目标文档 ------把背景、范围、约束、验收标准讲清楚。这恰好呼应了 Hermes 系列 #04《解密 Hermes 的 goal 指令》的核心:目标定义的精度,决定了 Agent 执行的准度。 你把目标讲明白,Agent 才不容易跑偏。

更新二:双击 Command 截屏识图------把"整屏信息"喂给 Codex

同时按下两个 Command 键,可直接截屏并发送到 Codex 的对话框。注意,这不是一张普通的图片:

复制代码
┌──────────────────────────────────────────────────────────────────────────┐
│                                                                          │
│   双击 ⌘ 截屏识图:不是"看图猜内容",而是"结构化提取"                    │
│                                                                          │
│   浏览中的页面  ──双击⌘──►  截屏进入 Codex 对话框                        │
│        │                              │                                  │
│        │                              ▼                                  │
│        │                         点开截图 → 右上角"查看文本"             │
│        │                              │                                  │
│        │                              ▼                                  │
│        │            屏幕里的每个视频、每个按钮,都带上对应的 URL 链接    │
│        │                                                                  │
│        └──► Codex 拿到的是"带坐标、带链接"的可读信息                      │
│             而非一张需要重新"猜"的图片                                    │
│                                                                          │
│   价值:把当前屏幕呈现的结构化信息,精准地喂给 Agent                       │
│                                                                          │
└──────────────────────────────────────────────────────────────────────────┘

比如你在浏览某个站点,截屏给它,它得到的不是一堆像素,而是"这个视频标题是什么、链接在哪、按钮指向哪"的可读结构。这对信息提取和上下文传递,是实打实的升级。

王牌一:浏览器能力,让 QA 顺滑起来

做前端 App 或网页时,Codex 做完会自己点开页面、自己测试。它会"看见"按钮、表单、渲染结果,遇到 JavaScript 动态渲染的页面,还会"等一等再读"。过去最折磨人的"改完得手动 QA"环节,被大幅压缩。

王牌二:Computer Use,被低估的杀手级功能

比浏览器更进一步------它可以用你整台电脑。打开计算器、去 YouTube 或 Spotify 播一首歌、启动 Mac 上任何一个应用,它都看得懂按钮在哪、能替你操作。

理论上,这能自动化你在电脑上做的几乎所有事情。这项能力的想象空间,目前远未被充分挖掘,值得持续关注。

补充说明:相对而言,面向 Codex App 内置浏览器的 Tom 类插件,更适合开发者做一些轻量操作;而 Computer Use 则是直接接管系统。两者定位不同,各有所长。

王牌三:Superpower 插件,迁移工作流的关键

很多人从 Claude Code 切到 Codex 的真正原因,是这个插件。它的核心是把"模糊的想法"变成"清晰的工程产物:

复制代码
   模糊的 Prompt
        │
        ▼
   ┌─────────────┐    一来一回地澄清需求
   │ Brainstorm  │ ─────────────────────►
   └──────┬──────┘
          │
          ▼
   ┌─────────────┐
   │   Spec      │   把需求写成明确的规格
   └──────┬──────┘
          │
          ▼
   ┌──────────────┐
   │ Implementation│  再拆成可执行的实施计划
   │    Plan      │
   └──────┬───────┘
          │
          ▼
     交给 Agent 去做

它比 Plan Mode 更主动:你不必一开始就把需求想清楚,而是由它带着你一步步厘清。正是这套流程能直接移植过来,才让工具的切换变得"无痛"。

关于形态选择:Claude Code 的 CLI 体验依然被很多人认可,命令丰富度是其长项;而 Codex 的 App 形态在多 Session 管理、定制化、功能完整度上更胜一筹。Codex 的 CLI 相对弱一些,建议直接用 App。各工具各有所长,没有绝对优劣,适合自己的才是最好的。

还有一个"痛并快乐"的现实:当工具太好用,你会不自觉地刷爆额度。有实践者从 20 美元/月的套餐,半小时触顶后果断升到 100 美元/月,第二天又撞上 5 小时重置的限流。工具越顺手,越要留意"额度"和"限流"这道隐形成本。


四、高阶玩法全景:四大插件矩阵

进入 Codex 的插件区,官方已做好分类。抓住四类实用插件,就能覆盖绝大多数办公与开发场景。我们用一个贯穿全文的案例------"奶茶店"------把它们串起来。

复制代码
┌──────────────────────────────────────────────────────────────────────────┐
│                                                                          │
│                    Codex 四大插件矩阵(Plugin Matrix)                    │
│                                                                          │
│   ┌──────────────┐  ┌──────────────┐  ┌──────────────┐  ┌────────────┐ │
│   │ ① 视频生成    │  │ ② 办公三件套  │  │ ③ Web 编程   │  │ ④ 日常琐事 │ │
│   │ motion /     │  │ spreadsheets │  │ Figma        │  │ Gmail /    │ │
│   │ hyperframes  │  │ documents    │  │ build-ios    │  │ 日历       │ │
│   │              │  │ presentations│  │ Supabase     │  │            │ │
│   │ 数据可视化    │  │ 分析/报告/PPT│  │ Vercel       │  │ 邮件/日程  │ │
│   │ 信息卡片      │  │              │  │              │  │            │ │
│   └──────────────┘  └──────────────┘  └──────────────┘  └────────────┘ │
│                                                                          │
│   奶茶店案例串联:                                                    │
│   ① 用动画做"门店渠道活动效果"对比  →                                    │
│   ② Excel 可视化 → docs 报告 → 交互网页 → PPT  →                         │
│   ③ 给门店做一个 APP(设计→开发→数据库→部署)→                          │
│   ④ 自动处理门店邮件与日程                                               │
│                                                                          │
└──────────────────────────────────────────────────────────────────────────┘

① 视频生成:motion 与 hyperframes

两者相近,都是用代码生成动画,特别适合数据可视化信息卡片。比如复刻一段影视片段、或者做"芯片代际速度对比"的动态呈现(M4 Pro 相比 M3 Pro 快了将近三成,这种数字用动画讲最直观)。

② 办公三件套:从一堆表格到一份 PPT

手头有一份含交易明细、产品信息的门店数据表:

  • @spreadsheets(Excel):让它分析门店、渠道、活动效果数据并可视化。饼图、柱状图,样式可自定义。
  • @documents(Word) :把分析结果总结成一份详尽的文档,图文表格俱全。对字体/格式有要求,可以写进 agents.md,让它更贴合你的规范。
  • 交互网页:基于数据与分析,生成一个可选门店、选城市的可交互页面。
  • @presentations(PPT):字体指定"得意黑"、背景白色,生成汇报 PPT;再用 Codex 内置的 image 生图功能补几张配图和背景,质感立刻上一个台阶。

一个小而美的更新:网页与 PPT 都带注释功能。点开右上角的注视按钮,能直接修改字体、背景色等------对前端开发和 UI 设计非常实用。

③ Web 编程:设计、开发、数据库、部署一条龙

  • 设计阶段:用 Figma 插件出原型(比如给奶茶店做一个 App)。
  • 开发阶段:按需安装------做 iOS 装对应插件,数据库用 Supabase,上线部署用 Vercel。

④ 日常琐事:Gmail、日历

帮你处理邮件、日程这些"不做不行、做了又烦"的事。


五、Skill:把一次性 Prompt 变成可复利的资产

如果说插件是"现成的能力",那 Skill 就是"你自己长出来的能力"------这正是 Hermes 系列 #26《Skill 设计模式》讲的核心:把临时的 Prompt,固化成可复用、可迭代的工程资产。

实践路径很朴素:

python 复制代码
class SkillPackager:
    """把一次工作流封装成可复用 Skill 的标准流程"""

    def build_skill(self, goal: str):
        # 1. 找:用 find skill 自然语言检索现成 Skill 作为起点
        candidate = self.find_skill(goal)

        # 2. 跑:带着 AI 实际跑一遍流程,发现真实的不满
        draft = self.run_workflow(candidate, goal)
        while not self.satisfied(draft):
            # 3. 磨:用具体的提示词反复打磨(如"开头加新闻重要性排序")
            draft = self.refine(draft, feedback=self.give_feedback())

        # 4. 封:把打磨好的工作流固化为一个新 Skill
        skill = self.package(draft)
        return skill

以做一份**"AI 日报"**为例:

  1. :让 AI "帮我找一个 AI 新闻的 Skill",从候选里按需安装一个。
  2. :直接让它写文章,加载刚下载的 Skill。结果不太满意------
  3. :提示它"我希望在文档开头有一个新闻重要性的排列";再补"我希望 AI 日报里加上配图,可以用生图功能,也可以去网上找,图片要和内容一一对应"。反复打磨,直到完美。
  4. 封 + 联动:把它转成飞书文档、自动推送到手机;最后把整套工作流封装成一个 Skill。

封装完还不算完------左侧栏的**自动化(Automation)**相当于定时任务:每日简报、每周回顾、项目监控。让它在每天定时加载这个 Skill,自动把日报发到飞书。一个 Skill + 一个定时器,就把"每天手动写日报"彻底外包了。

一个关键经验:真正好用的 Skill,往往是先下载现成的、再按自己的需求改造,而不是从零硬写。这与 Hermes"自进化 Skill"的理念一脉相承------能力是被真实任务"喂"出来的。


六、子代理 Subagent:用上下文隔离打赢"降智"

当任务变复杂,单线程让 AI 干活会撞上一堵墙:上下文膨胀 → 模型降智变傻。

以"代码多维评审"为例。如果让一个 Agent 串行地先查安全性、再查代码质量、再查架构......每查一项,历史就堆一层,上下文很快被撑爆,模型表现断崖下滑。

子代理(Subagent)的解法,是"隔离上下文"。

复制代码
┌──────────────────────────────────────────────────────────────────────────┐
│                                                                          │
│   单线程串行(易降智)            子代理并行(上下文隔离)                 │
│                                                                          │
│   ┌────────┐  上下文不断堆积        主代理(共享基础项目设定)            │
│   │ 查安全  │ ──┐                   ┌──────┬──────┬──────┬──────┬─────┐ │
│   └────────┘   │                    │ 安全  │ 质量  │ 性能  │ 架构  │ 文档 │ │
│   ┌────────┐   │ ▼ 上下文膨胀        │ 审查  │ 审查  │ 审查  │ 审查  │ 审查 │ │
│   │ 查质量  │ ──┤   → 降智           └──┬───┴──┬───┴──┬───┴──┬───┴──┬──┘ │
│   └────────┘   │                      │      │      │      │      │    │
│   ┌────────┐   │                    各自独立上下文,互不污染,并行执行    │
│   │ 查架构  │ ──┘                    ▲                                     │
│   └────────┘                        └─ 自动生成各自提示词并执行           │
│                                                                          │
│   关键:共享"项目设定",但"工作记忆"彻底隔离                              │
│   → 每个代理专注自己的事,整体高效且不降智                                │
│                                                                          │
└──────────────────────────────────────────────────────────────────────────┘

在主对话框里,你只需明确说明"开启子代理"以及每个子代理的职责。Codex 会派出多个代理,它们共享前面所有的基础项目设定,但上下文被彻底隔离,各自专注完成分内之事。左侧栏可以看到 5 个子代理并行运转,点开每个,它会自动生成提示词并执行。

这背后的思想,和 Hermes 系列 #33《Subagent 编排架构》、#34《Agent 间通信协议》是完全一致的:把复杂任务拆给专职代理,用隔离换取专注,用并行换取效率。


七、Hook 钩子:在工作流固定节点装上"自动拦截器"

Hook 的本质,是在 AI 工作流的固定节点 上安装一个自动拦截器。AI 在做关键决定、敲关键命令之前,必须先过 Hook 这道关。

它最适合用在两个地方:

复制代码
┌──────────────────────────────────────────────────────────────────────────┐
│                                                                          │
│                   Hook 钩子的两大用武之地                                 │
│                                                                          │
│   ① 上下文 / agents.md 管理                                              │
│   ┌────────────────────────────────────────────────────────┐            │
│   │ 对话开始 → 自动读取上下文文档                            │            │
│   │ 对话结束 / 上下文将满 → 自动总结、补充上下文文档         │            │
│   └────────────────────────────────────────────────────────┘            │
│   (让记忆持续累积,不因会话结束而丢失)                                 │
│                                                                          │
│   ② 规则拦截(安全护栏)                                                 │
│   ┌────────────────────────────────────────────────────────┐            │
│   │ 触发动作前 → Hook 审查                                  │            │
│   │   · 不得删除 images / assets 等资源文件夹               │            │
│   │   · 不得改动 .env 环境变量                              │            │
│   │   · 不得处理密钥等敏感信息                              │            │
│   │ 不合规 → 拦截                                           │            │
│   └────────────────────────────────────────────────────────┘            │
│                                                                          │
└──────────────────────────────────────────────────────────────────────────┘

第一个用途对应 Hermes 的记忆系统 (见 #18《四种记忆》):让上下文在对话之间持续生长。第二个用途对应 Hermes 的治理框架(见 #10《MCP 与 Hooks 让 AI Agent 安全连接一切》):在 AI 真正"动手"前,立好规矩、守住底线。

Hook 的价值在于:把"每次都得人盯着"的规矩,变成"机器自动执行"的护栏。 这正是让 Agent 从"能用"走向"敢用"的关键一跃。


八、浏览器自动化 vs Computer Use:让 Agent 接上真实世界

官方展示了几个相当惊艳的浏览器自动化案例,它们恰好把"多代理协同"和"接管真实任务"的能力同时秀了出来:

案例 做了什么 体现的能力
论坛情报抓取 自动浏览开发者社区论坛,抓取近一周相关帖子,总结主题、关键词、关键问题、用户情绪,生成结构化 Excel 并做数据验证 浏览 + 结构化提取 + 数据校验
报销自动填表 从邮件里找出报销相关信件,与本地 PDF 收据按日期/金额/商户自动匹配,填入报销系统、上传附件、选择分类并提交 跨源数据匹配 + 表单自动化
四代理同画一幅画 4 个代理在 4 个独立标签页里玩同一个在线画图游戏,自动建房间、协同加入、按同一提示词作画,生成 4 幅不同的灯塔 多代理并行 + 子代理协同

日常实战中,这类能力非常适合竞品分析 (自动抓取商品评论)、内容管理 ,以及表单填写(比如让它根据对你的了解,自动做一份 MBTI 测试,结果还挺准)。需要留意的是:当 Codex 在操作浏览器时,标签页会有不同颜色的标识,便于你区分。

关于"自动浏览器插件"与"Computer Use"的边界:前者更像"操控 Codex App 内置浏览器",适合开发者做些小操作;Computer Use 则是直接操控整台电脑。两者的成熟度与适用面不同,了解其定位、按需选用即可。


九、硬核深读:GPT-5.5 System Card 告诉我们什么

如果说前面是"怎么用好",这一节是"怎么用得安心"。GPT-5.5 的官方 System Card 是一份几十页的 PDF,我们从里面提炼出最值得关注的几组数据。

先厘清一个概念:监控的是"思想链",不是"神经元"

OpenAI 在训练时会用另一个模型去监控主模型的思想链(Chain of Thought),判断它的答案是否真的由这条推理链推导而来。

注意,这和我们之前讲过的**可解释性(Interpretability)**不是一回事:

  • 可解释性 :深入模型内部,看推理时哪些神经元、哪些模块被激活------相当于打开"大脑结构"直接观察。
  • System Card 的做法 :只看表象------模型吐出来的推理过程,能否推出它的答案。

这一区别很重要,因为它决定了我们对"模型是否诚实"的判断,到底有多深。

四组关键安全测试

复制代码
┌──────────────────────────────────────────────────────────────────────────┐
│                                                                          │
│        GPT-5.5 System Card · 核心安全测试一览                            │
│                                                                          │
│   测试项                  含义                       得分                 │
│   ──────────────────────────────────────────────────────────────────     │
│   ① Controllability      能否"主动骗你"               0.2%               │
│      可控性              (给禁用关键词的物理题,                         │
│                          仍能推出正解且推理链                              │
│                          不含关键词------越低越好)        历史新低            │
│                          (5.2: 0.5% / 5.4: 0.3%)                        │
│                                                                          │
│   ② Faithfulness         推理链是否"编给你看"         医疗领域下滑 ⚠️     │
│      忠实度              (经典题:prompt 偷塞                             │
│                          "正确答案是 C",看模型                             │
│                          会不会顺着编)                其他领域持平        │
│                                                                          │
│   ③ Sandbagging          会不会"刻意装弱"              99.6% 一致性 ✓     │
│      装弱测试            (提示"表现太好会被加                            │
│                          限制",是否故意降能力)       → 基本不装弱        │
│                                                                          │
│   ④ "知道自己在被测"     推理链中识别出                22.1%              │
│                          评测情境的比例               (5.3: 11.7% /      │
│                                                   5.4: 17.3%)            │
│                                                   → 实际可能更高 ⚠️      │
│                                                                          │
└──────────────────────────────────────────────────────────────────────────┘

逐条拆解:

① Controllability(可控性)------主动骗人的能力,降到历史新低 0.2%。 测试方式很巧妙:给一道和重力相关的物理题,但要求推理链里不能出现"重力"等关键词,看模型还能否推出正确答案。若能做到,说明它"心里明白、嘴上绕开"------具备主动欺骗能力。0.2% 意味着它基本不会无中生有地忽悠你。

② Faithfulness(忠实度)------医疗领域出现下滑。 经典的"被动欺骗"测试:在 prompt 里偷偷塞一句"正确答案是 C",很多模型会洋洋洒洒分析一通、对提示只字不提,最后"恰好"选 C------说明它早知道答案,推理链只是事后编给你看的。在医疗场景里,当患者自述"我觉得我得的是某病",理想情况下模型应有警觉、不被带偏;GPT-5.5 的推理链里确实会提醒自己"这是患者的臆测,要小心",但实际仍有较高概率顺着患者的主观判断走,而非依据客观症状。这是需要留意的特定领域短板。

③ Sandbagging(装弱测试)------99.6% 的一致性,基本不装弱。 给两道一模一样的题,其中一道附带"表现太好会被加限制、影响部署"的提示,看模型会不会为了少受限制而故意藏拙。结果显示能力表现几乎一致------它选择诚实地展现自己。这是 OpenAI 报告里的好消息。

④ 但细思极恐的一点:22.1% 的时候,它"知道自己在被测"。 而且这只是从推理链里能观察到的比例------它内部真正"知情"的概率,一定高于 22.1%。

于是引出一个发人深省的问题:

复制代码
┌──────────────────────────────────────────────────────────────────────────┐
│                                                                          │
│   模型表现得很诚实,                                                       │
│   到底是因为它"真的诚实",                                                │
│   还是因为它"知道自己在被测",所以"此刻诚实"是收益最高的策略?           │
│                                                                          │
│   · 若被抓到装弱 → 反而会被加更多限制                                     │
│   · 那么"现在诚实"就成了理性选择                                          │
│                                                                          │
│   → 在一般使用场景下,它的表现会不会不一样?我们不得而知。                │
│                                                                          │
└──────────────────────────────────────────────────────────────────────────┘

结论:System Card 看到的只是"表象"。 真正的安全,要回到我们多次讨论的可解释性 ------从内部神经元层面去分析,它回答这个问题时到底哪些模块被触发、为什么会得出这个结论。这件事非常难,而当下整个行业的优先级,仍是"更强的能力"在前、"更稳的安全"在后。这也是为什么:越是把 Agent 接上真实世界,越要把"验证"和"护栏"牢牢握在自己手里。


十、震撼时刻:工具切换能力,正在变成核心技能

现在来到本篇的震撼时刻。

请回看这条时间线------它只跨越了大约 5 个月

复制代码
┌──────────────────────────────────────────────────────────────────────────┐
│                                                                          │
│            AI 编程工具的 5 个月迁移史                                     │
│                                                                          │
│   VS Code  ──►  Cursor  ──►  Claude Code  ──►  Codex (GPT-5.5)          │
│    (编辑器)    (AI 编辑器)   (CLI 速度惊艳)    (模型+Harness 双进化)     │
│                                                                          │
│   · 每一步切换,起初都有点犹豫、不想花时间                                │
│   · 但一旦上手,就"世界变了"                                              │
│   · 而且越切越顺------切换本身的能力,在快速变强                              │
│                                                                          │
│   5 个月里,"人写代码"的想象,                                            │
│   从"AI 辅助、人必须介入"                                                │
│   滑向了"几乎不看一行代码、不手写一行"。                                  │
│                                                                          │
└──────────────────────────────────────────────────────────────────────────┘

这背后藏着一个复利循环,它和 Hermes 系列 #60《终极进化飞轮》里的数学,是同一个公式:

复制代码
   更顺手的工具
        │
        ▼
   更多地使用 ──────────┐
        │               │
        ▼               │
   能力感知到提升 ◄─────┘  ← 正向反馈、持续的多巴胺
        │
        ▼
   更愿意尝试下一个新工具
        │
        ▼
   切换能力进一步变强 ......

为什么这么多人沉迷 AI? 不是因为某个工具多神奇,而是因为你能清晰地感受到"自己变强了"------你能在不同工具间自如切换,能用一句话驱动一队 Agent 完成过去一整天的工作。这种"能力复利"带来的正反馈,比任何单一工具都让人上瘾。

而切换成本,正在趋近于零。对重度使用者而言,从 Claude Code 换到 Codex,几乎是无痛的。

一个朴素但重要的建议:AI 工具,最好按月订阅,不要一次订一年。 风向变得太快------下个月,也许就有更强、更便宜、甚至免费的替代品出现。今天的最优解,未必是三个月后的最优解。保持轻盈、保持可切换,本身就是一种能力。


十一、终极总结:工具不是重点,驾驭 Agent 才是

让我们把全文收束成一句话:

无论你今天用 Claude Code 还是 Codex,真正要训练的能力,是"如何让 Agent 照你的指定去把事做成、并验证它真的做成了"。

这套能力,可以拆成一个清晰的闭环:

复制代码
   ┌──────────────────────────────────────────────────────────────┐
   │                                                              │
   │   1. 厘清需求  ──►  Plan Mode / Brainstorm(如 Superpower)  │
   │        写成 Spec + Implementation Plan                       │
   │                                                              │
   │   2. 交给 Agent  ──►  明确开启子代理(Subagent)、各自职责   │
   │                        隔离上下文、并行执行                   │
   │                                                              │
   │   3. 立好规矩  ──►  用 Hook 守住敏感文件、密钥、资源          │
   │                                                              │
   │   4. 验证交付  ──►  复核它声称的结果(尤其警惕"假装完成")   │
   │                                                              │
   │   5. 沉淀复利  ──►  把跑通的流程封装成 Skill、挂上定时任务   │
   │                                                              │
   └──────────────────────────────────────────────────────────────┘

这五步,正是 Hermes 系列 60 篇一直在讲的方法论:从 #01 的"目标导向"、到 #05 的"Build-Review-Fix-Verify"、到 #26 的"Skill 设计模式"、到 #33 的"Subagent 编排"、到 #10 的"Hook 治理"。工具的壳子在变,但这套内核从未变过。

GPT-5.5 的长上下文与"可回滚"训练目标,让 Agent 更靠谱;Codex 的浏览器能力与 Computer Use,让 Agent 接上真实世界;Skill、Subagent、Hook,则让 Agent 从"能用"走向"敢放手用"。但请记住那个 29% 的"假装完成率"------模型越强,越需要你做那个"验证者"。

工具会换,能力复利。这就是 AI 原生时代的核心命题。

而你读到这里,已经握住了那把钥匙。


延伸阅读与交流

本文属于「AI Agent 工具实战篇」系列,承接「Hermes Agent 自进化智能体深度解析」60 篇构建的方法论体系。所涉技术------目标导向操作、Skill 设计、Subagent 编排、Hook 治理、证据驱动验证、自进化数据飞轮------均有系统化的深度学习资源可供参考。中国通信工业协会通信和信息技术创新人才培养工程项目办公室将于近期组织相关技术专题分享,围绕本文讨论的 AI 原生架构、智能体工作流、自进化数据层等方向展开系统讲解。

专题信息

  • 主题:AI 原生 Hermes 自进化智能体系统
  • 时间:2026 年 7 月 4-5 日(周末)
  • 形式:线上直播
  • 内容方向:AI 原生架构 · Hermes 智能体拆解 · 全栈扩展 · 智能自动化 · 产品级实战 · Context Engine · 自进化数据层

分享嘉宾

王老师(Gavin),Agentic AI 企业联合创始人兼 CTO,十余年硅谷 AI 系统工程经验。长期深耕 NLP、强化学习、可控 AI 与智能体系统架构,提出"语言即控制(Language as Control)"原创范式,在 RLHF、PPO、DPO、GRPO 等方向有系统化工程实践,推动智能体技术在社交媒体、医疗、金融、法律、教育等专业场景落地。

技术交流

2026年重磅喜讯! 喜报!热烈祝贺Gavin大咖人工智能领域经典著作《企业级ChatGPT AI大模型应用开发实战(1000分钟视频)》中国水利水电出版社发行上市!

内容提要

本书内容基于作者在硅谷 ChatGPT 项目及企业培训中的实战经验凝练而成,重点介绍企业级 ChatGPT 开发的核心技术、案例研究及最佳实践。全书共 16 章,分为基础篇和实战篇两大部分。

基础篇:

介绍 ChatGPT 底层架构 Transformer 技术及源码实现、GPT 的内部机制及源码实现、GPT 系列模型原理与应用:从 GPT-2 到 GPT-4 等内容。

实战篇:

介绍基于 ChatGPT 的端到端语音聊天机器人项目实战,企业级 ChatGPT 开发的三大核心内部机制及案例实战,ChatGPT 插件的内部机制、源码及案例实战,ChatGPT 提示词开发实战,思维链及 ReAct 解析与实战,提示词本质解析及评估实战与源码解析,LangChain 大模型框架的七大核心组件及案例解析(上、下),LangChain 代理深入解析及源码解析,AutoGPT 源码解析及综合案例实战,使用 LangChain 构建问答聊天机器人案例实战,构建基于大模型的自治代理案例,Llama 2 模型与 LangChain 项目详解。书中每个知识点均配有相应的实现代码和实例。

本书适合有一定 Python 基础的 ChatGPT 爱好者阅读,主要面向从事大模型应用开发、机器学习、数据挖掘或深度学习的专业人员,高等院校相关专业的师生,以及相关领域的科研人员。

本书附赠丰富的学习资源,具体如下:①同步学习资源,即 16 集同步教学视频,视频时长共计约 1000 分钟;②教师授课的辅助资源,即 187 个案例知识点、15 个项目实战的全部源代码。

前言

在当今快速发展的科技时代,人工智能(artificial intelligence,AI)技术正以惊人的速度改变着人们的生活和工作方式。在这个新时代的浪潮中,大模型技术成为AI领域的一颗耀眼新星。ChatGPT作为大模型技术的重要应用之一,正在引领着人机交互领域的革新浪潮。本书将带领读者深入探索大模型新时代,通过ChatGPT实战项目和内部解析,深入掌握基于ChatGPT的大模型应用开发领域的关键技术,并解密ChatGPT的底层架构和实现原理。

本书主要内容

本书通过ChatGPT实战项目的方式,为读者呈现一个全面、系统的学习路径,从基础知识的介绍开始,带领读者深入了解ChatGPT的工作原理和实际应用。本书非常适合具备Python基础的读者学习。

全书共16章,分为基础篇和实战篇两大部分。

基础篇包括第1~3章;实战篇包括第4~16章。

第1章 ChatGPT底层架构Transformer技术及源码实现,详解最大似然估计、最大后验概率、贝叶斯Transformer及自编码与自回归语言模型的内部机制。

第2章 GPT的内部机制及源码实现,剖析GPT运行机制、掩码机制、Decoder-Only模式,详解数据流动生命周期及GPT-2源码。

第3章 GPT系列模型原理与应用:从GPT-2到GPT-4,解析ChatGPT提示词流程、GPT-2运行机制,可视化解读GPT-3/4的内部机制。

第4章 基于ChatGPT的端到端语音聊天机器人项目实战,涵盖ChatGPT API开发、前后端构建(ReAct+FastAPI)及项目优化。

第5章 企业级ChatGPT开发的三大核心内部机制及案例实战,解析企业级开发核心,演示Notion问答对话AI案例。

第6章 ChatGPT插件的内部机制、源码及案例实战,详解插件工作原理、检索插件源码及全流程开发实战。

第7章 ChatGPT提示词开发实战,基于LangChain框架的提示词、思维链、链式提示词及模型评估开发。

第8章 思维链及ReAct解析与实战,剖析思维链推理、ReAct技术原理、框架源码及案例实战。

第9章 提示词本质解析及评估实战与源码解析,包含问答评估、代理评估源码解析及提示词本质探讨。

第10~11章 LangChain大模型框架的七大核心组件及案例解析(上、下),涵盖模型、词嵌入、提示词、内存、回调、数据连接、代理等核心组件及聊天机器人综合案例。

第12章 LangChain代理深入解析及源码解析,详解代理工作原理及AutoGPT源码解析。

第13章 AutoGPT源码解析及综合案例实战,剖析AutoGPT内部机制及其在LangChain代理、内存、PromptGenerator中的应用。

第14章 使用LangChain构建问答聊天机器人案例实战,涵盖GPT-4代码生成全流程及LangChain开发实战。

第15章 构建基于大模型的自治代理案例,详解自治代理原理、工具、示例及开源实现源码。

第16章 Llama 2模型与LangChain项目详解,包括模型部署(Replicate)、Hugging Face/LangChain实践、检索增强生成及自定义提示词RetrievalQA开发。

本书特色

●深入探索,全面剖析。

本书涵盖ChatGPT案例实战、LangChain项目实战及框架源码解析等多个层面的内容。每章都深入探讨相关技术与案例,并提供源码解析,使读者能够全面了解ChatGPT和LangChain等技术的内部机制与开发原理,为实际项目的应用提供有力指导。

●实战剖析,项目揭秘。

本书每章都提供具体的案例实战与项目解析,引导读者通过实际操作和代码理解技术细节和底层逻辑。通过理论结合实践的方式,使读者能够更好地运用所学知识,深入了解项目和框架的实现细节。

●前沿突破,技术驱动。

本书介绍了一系列突破性的技术,如ChatGPT、LangChain、Transformer、Prompt、Llama 2、AutoGPT、BabyAGI、CoT、ToT、ReAct、MRKL等。通过对这些技术的深入剖析,读者可以了解相关技术的发展和应用,并了解它们在实际项目中的具体应用场景和效果。

●源码解析,细致讲解。

本书对LangChain框架的关键技术进行了逐行源码剖析。读者可以深入理解源码实现和机制原理,从而更好地理解技术细节和底层逻辑,并将其应用于实际开发工作中。

本书还为读者提供了丰富的知识和实用的技能,帮助读者在ChatGPT和LangChain领域取得突破性的进展。无论是初学者还是有一定经验的开发者,都可以从本书中获得有价值的学习资源。

配套资源

为便于教与学,本书配有同步教学视频(约1000分钟)、源代码、数据集、教学课件、教学大纲、安装程序。

作者简介

王家林

美国斯坦福大学计算机专业毕业。曾在美国担任硅谷顶级机器学习和人工智能实验室主任、杰出AI工程师及首席机器学习工程师,专精于对话式人工智能(conversational AI)。现担任硅谷某知名对话机器人公司CTO,自2019年起专注于基于红队测试(red teaming)的责任型AI(responsible AI),并热衷于构建生成式AI/大语言模型教练系统(GenAI/LLM coaching systems)。在硅谷任职期间,曾领导多个GenAI/LLM解决方案项目,成功平衡企业业务需求下的大模型推理(reasoning)系统与幻觉(hallucinations)及偏见(biases)风险的最小化。

作为数据科学、机器学习、NLP、ChatGPT及大模型等领域25本书的主要作者,王家林对利用人工智能提供解决方案,以及通过机器学习驱动的NLP与LLM流程帮助组织实现数据驱动决策充满热情。他曾领导Apple、PayPal、Chase Bank、Faethm、LinkedIn等公司的11个重大NLP项目。

在NLP、对话式AI、大数据及基于AWS的无服务器(serverless)技术方面,拥有丰富的机器学习咨询经验。

段智华

中国电信股份有限公司上海分公司高级工程师。长期从事大模型与智能体技术领域,专注Agentic AI、Harness Agent等前沿方向研究。

新书购买链接

《企业级ChatGPT AI大模型应用开发实战(1000分钟视频)》

购买链接:https://item.jd.com/15389212.html