【AI Agent通识九课】01 · Agent 和 ChatGPT 到底差在哪？

AI Agent 通识课 · 第 1 篇 / 共 9 篇

一句话记住：会说话的 AI ≠ 会干活的 AI

最近被问得最多的一句话是------

"ChatGPT 我会用，Cursor 我也用过，那 Claude Code、Warp、Devin 到底和它们有啥不一样？"

我一开始也懵。

直到有天我把办公桌前的 5 个 AI 工具摊开对比，才发现真相只有一句话：

它们根本不是同一个物种。

这篇就是要把这件事讲透。读完你再看任何 AI 产品，都能 3 秒判断它是哪个物种------不被价格带偏、不被营销忽悠。

01 · 都是 AI，为啥分这么多名字？

你用 ChatGPT 写周报，顺手。

你用 Copilot 补代码，顺手。

你用 Cursor 改 bug，顺手。

你用 Claude Code / Warp / Devin 让它"自己搞定"，有点晕了。

长得都差不多：输入框 + 对话流。

价格从免费到 $500/月。

差别在哪？

只在一个核心问题：

这个 AI 能不能自己动手干活？

学会区分这件事，你下次选 AI 工具不会被营销话术带偏。

02 · 点外卖 vs 请私人管家

你要办一场周末生日聚会

用外卖 App（这是 ChatBot）：

你：推荐几家北京有生日主题包间的餐厅？

App：推荐三家------海底捞/大董/俏江南。

App 给完答案，事就结束了。

订餐厅、买蛋糕、发邀请、处理朋友的改时间请求------全是你自己来。

请私人管家（这是 Agent）：

你：管家，帮我安排下周六的生日聚会，10 个人。

管家：好的。

------ 20 分钟后 ------

管家：订了大董王府井店 18:00 包间；通讯录 10 个朋友已发邀请；3 人改时间到 19:00，餐厅已同意延后；蛋糕定了 85 度 C，6 点送到；预算 3800 元已登记。

差别清楚了吗？

ChatBot：给答案，你动手
Agent：它动手，给结果

背后用的 AI 模型可能完全一样（都是 GPT-4）。

差的不是聪明程度，差的是"能不能连续做事"。

03 · 一张图看清五个物种

把市面主流 AI 产品按"替你干活程度"排个序：

复制代码

  替你干活程度
    ↑
    │  🤖 AI Agent         ← 替你完成整个任务
    │                         像私人管家：一句话→全部搞定
    │                         代表：Claude Code · Warp · Devin · Cursor Composer
    │
    │  🧑‍💻 AI Copilot      ← 你指挥，它动手
    │                         像私人助理：你说"订这家"它去订
    │                         代表：Cursor Chat · Copilot Chat
    │
    │  ✍️  AI Copilot Lite ← 它写，你审
    │                         像代笔实习生：写好稿子你逐字过目
    │                         代表：老版 Copilot · Tabnine
    │
    │  💬 ChatBot          ← 只给答案
    │                         像外卖 App：问啥答啥，事还是你办
    │                         代表：ChatGPT 基础版 · 豆包 · 文心一言
    │
    │  📝 文本补全         ← 只补文字
    │                         像智能输入法：你打一半它猜后面
    │                         代表：GPT-3 API 时代
    └──────────────────────────────→ 时间演进

上面一级包含下面所有能力。

Agent 是目前的顶部。

关键分界线在"谁动手"：

线下面：AI 给答案/建议，你动手
线上面：AI 动手，你验收

04 · 同一任务，五种反应

以"帮我办周末生日聚会"为例。

形态	反应	你还要做什么
📝 文本补全	你打"生日聚会要准备 __"，它补上"蛋糕、礼物、餐厅"	所有事全做
💬 ChatBot	"推荐三家包间餐厅：A、B、C"	订餐厅、买蛋糕、发邀请、处理问题
✍️ Copilot Lite	给你写好邀请函草稿	订餐厅、发邀请、其他
🧑‍💻 Copilot	你说"订 A 餐厅 18:00"，它调 OpenTable 下单	每一步你来指挥
🤖 Agent	"好的"------20 分钟后给你完整汇报	验收

这个差别在开发场景也完全一样。

让 AI "修一下登录报错"：

ChatBot：告诉你"可能是 token 过期"（你还得自己查代码）
Copilot：你说"改这个函数"，它改，你 Accept
Agent ：搜代码 → 定位问题 → 改 5 个文件 → 跑测试 → 提 PR

05 · Agent 的 4 大组件（必须记住）

不管你让 Agent 办生日会，还是让它修 bug，拆开看都是这 4 块：

复制代码

       ┌──────────────────────────────────────┐
       │           🤖 AI Agent                │
       │                                      │
       │   ┌──────┐        ┌─────────────┐   │
       │   │ 大脑 │ ◄────► │   记忆      │   │
       │   │ LLM  │        │ (上下文)    │   │
       │   └──┬───┘        └─────────────┘   │
       │      │                              │
       │      │ 决策                         │
       │      ▼                              │
       │   ┌──────┐        ┌─────────────┐   │
       │   │ 循环 │ ◄────► │  工具箱     │   │
       │   │Loop  │ 执行   │ (Tools)     │   │
       │   └──────┘        └─────────────┘   │
       │                                      │
       └──────────────────────────────────────┘

翻译成管家的类比

大脑（LLM）：管家的脑子------GPT-4 / Claude / Gemini
工具箱（Tools）：管家的手脚------打电话、发邮件、订餐、下单
记忆（Context）：管家的小本子------主人的偏好、之前说过啥
循环（Loop） ：管家的工作方式------"打电话→收到回复→调整方案→再打电话"的反复

Agent 和 ChatBot 最大的区别就在第 4 点。

ChatBot：一轮问答结束（像外卖 App 给你推荐完就没事了）
Agent：一次任务可以循环 20 次（像管家要打 10 通电话才能搞定一个饭局）

06 · "循环"到底是啥？一个具体例子

场景：你对 Agent 说"帮我安排周末带娃去游乐园"

ChatBot 的做法（一轮结束）

"北京适合 5 岁小孩的游乐园有：欢乐谷、石景山游乐园、嘉年华......"

给完建议，完事。

你还得查天气、查人流、订票、安排午餐、查路线。

Agent 的做法（多轮循环）

复制代码

Round 1:
  脑子：先查周末天气
  做：搜索("北京周末天气")
  看到：周六晴，周日大雨

Round 2:
  脑子：那就周六去。看哪家游乐园合适
  做：搜索("北京适合5岁小孩的游乐园")
  看到：欢乐谷、石景山、嘉年华

Round 3:
  脑子：周六人多吗？查一下客流
  做：搜索("欢乐谷周六客流")
  看到：建议上午去，下午排队超长

Round 4:
  脑子：定方案，告诉主人
  做：输出初版方案
  看到：主人回复"加上午餐安排"

Round 5:
  脑子：找附近亲子餐厅
  做：搜索("欢乐谷附近亲子餐厅")
  看到：3 家可选

Round 6:
  脑子：整理最终方案
  做：输出完整行程（出门时间/路线/门票/餐厅/回家时间）

6 轮循环，每轮都在做"思考→行动→观察→再思考"。

这就是 Agent 的灵魂。

📌 对应到开发场景：让 Agent "修登录报错"，它会循环"搜索错误 → 定位文件 → 读代码 → 改代码 → 跑测试 → 修到通过"------模式一模一样。

这个思考模式有个学名叫 ReAct（Reason + Act），下一篇细讲。

07 · 主流 Agent 产品地图

这张表帮你建立"Agent 产品地图"：

产品	定位	适合谁	价位
Claude Code	编程 Agent	开发者	$20-200/月
Warp	终端 Agent	开发者、运维	免费-$40/月
Cursor	IDE Agent	开发者	$20/月
Devin	软件工程 Agent	企业团队	$500/月
AutoGPT	通用 Agent（祖师爷）	研究者	开源
Dify / Coze	低代码 Agent 平台	产品、运营	免费-付费
智谱清言 / Kimi 智能体	国内通用 Agent	大众用户	免费-付费

我自己的用法

我最近半年每天都在用这几个，踩坑总结出一个朴素指南：

写代码 → Cursor / Claude Code / Warp 三选一看偏好。我自己 70% 时间在 Claude Code，30% 在 Warp（终端重度依赖）
日常帮办事（订票、查资料、写报告）→ Claude / ChatGPT / 国内各家通用智能体
不懂代码做 Agent → Dify / Coze（国内首选，拖拽搭建）
企业级复杂任务 → Devin（贵但能扛事，500/月不是给个人的）

踩过的坑：

早期我以为"Agent 越贵越牛"，花 200 刀一个月开 Claude Max，结果发现 80% 的事 20 刀的版本就能干。

Agent 的价值不在模型，在"适配你场景的工作流"。

08 · 为啥所有产品都在卷 Agent？

2023 年大家还在做 ChatBot。

2024 年头部产品全在卷 Agent。

为啥？

商业价值天差地别。

形态	用户做的事	愿意付的价	定价锚
ChatBot	"查资料、写文案"	$20/月	SaaS 工具（几十块/月）
Copilot	"辅助我做事"	$20/月	SaaS 工具（几十块/月）
Agent	"替我完成整个任务"	$200-500/月	人力成本（月薪几万）

能自主干活的 AI，承接的是人力，不是"工具"。

这解释了为什么 Devin 敢收 $500/月------它对标的是初级工程师。

回到生日聚会的例子：

ChatBot 给你推荐餐厅------值月付 50 块（一个 App 会员的价）
Agent 替你全程办完聚会------值月付 2000 块（一个兼职助理的价）

差 40 倍，就差在"谁动手"。

09 · 你能带走什么

读完这篇，你应该能回答的 3 个问题

✅ Agent vs ChatGPT 的核心差异：谁动手（AI 还是你）

✅ Agent 的 4 大组件 ：大脑 + 工具箱 + 记忆 + 循环（关键）

✅ 为什么 Agent 是商业趋势：承接的是人力，不是工具

下次评估 AI 产品时，问自己 3 个问题

它能自主调用工具吗？（不是只给建议）
它能在一次任务中循环多轮吗？（不是一问一答）
它的定价锚是"人力"还是"工具"？

下次被问"我们要不要做 Agent 功能"时

用外卖/助理/管家的比喻问回去：

场景是"给答案"（问答、推荐、科普）→ 做 ChatBot 够了，别过度设计
场景是"你给建议，他动手"（营销文案初稿、代码补全）→ 做 Copilot
场景是"替他干完整件事"（自动化运维、自主完成报告、办理流程）→ 做 Agent

需求不匹配形态，做得再好也没价值。

给问"北京天气"的用户一个管家，大材小用。

给问"办生日会"的用户一个外卖 App，用户会骂街。

10 · 下一篇预告

02 · Agent 的"思考回路"长啥样？

所有 Agent 产品共用的大脑------ReAct 循环。

你说"帮我规划周末带娃"，AI 内心到底转了几圈？

像装修师傅现场施工------边看边量边调。

对比 ReAct / Plan-and-Execute / Tree of Thoughts 三种主流思考模式，告诉你各自的适用场景。

一句话记忆锚点

🎯 会说话的 AI ≠ 会干活的 AI。就像外卖 App 不等于私人管家，差别不在聪明程度，在"谁动手"。