
AI Agent 通识课 · 第 1 篇 / 共 9 篇
一句话记住:会说话的 AI ≠ 会干活的 AI
最近被问得最多的一句话是------
"ChatGPT 我会用,Cursor 我也用过,那 Claude Code、Warp、Devin 到底和它们有啥不一样?"
我一开始也懵。
直到有天我把办公桌前的 5 个 AI 工具摊开对比,才发现真相只有一句话:
它们根本不是同一个物种。
这篇就是要把这件事讲透。读完你再看任何 AI 产品,都能 3 秒判断它是哪个物种------不被价格带偏、不被营销忽悠。
01 · 都是 AI,为啥分这么多名字?
你用 ChatGPT 写周报,顺手。
你用 Copilot 补代码,顺手。
你用 Cursor 改 bug,顺手。
你用 Claude Code / Warp / Devin 让它"自己搞定",有点晕了。
长得都差不多:输入框 + 对话流。
价格从免费到 $500/月。
差别在哪?
只在一个核心问题:
这个 AI 能不能自己动手干活?
学会区分这件事,你下次选 AI 工具不会被营销话术带偏。
02 · 点外卖 vs 请私人管家
你要办一场周末生日聚会
用外卖 App(这是 ChatBot):
你:推荐几家北京有生日主题包间的餐厅?
App:推荐三家------海底捞/大董/俏江南。
App 给完答案,事就结束了。
订餐厅、买蛋糕、发邀请、处理朋友的改时间请求------全是你自己来。
请私人管家(这是 Agent):
你:管家,帮我安排下周六的生日聚会,10 个人。
管家:好的。
------ 20 分钟后 ------
管家:订了大董王府井店 18:00 包间;通讯录 10 个朋友已发邀请;3 人改时间到 19:00,餐厅已同意延后;蛋糕定了 85 度 C,6 点送到;预算 3800 元已登记。
差别清楚了吗?
- ChatBot:给答案,你动手
- Agent:它动手,给结果
背后用的 AI 模型可能完全一样(都是 GPT-4)。
差的不是聪明程度,差的是"能不能连续做事"。
03 · 一张图看清五个物种
把市面主流 AI 产品按"替你干活程度"排个序:
替你干活程度
↑
│ 🤖 AI Agent ← 替你完成整个任务
│ 像私人管家:一句话→全部搞定
│ 代表:Claude Code · Warp · Devin · Cursor Composer
│
│ 🧑💻 AI Copilot ← 你指挥,它动手
│ 像私人助理:你说"订这家"它去订
│ 代表:Cursor Chat · Copilot Chat
│
│ ✍️ AI Copilot Lite ← 它写,你审
│ 像代笔实习生:写好稿子你逐字过目
│ 代表:老版 Copilot · Tabnine
│
│ 💬 ChatBot ← 只给答案
│ 像外卖 App:问啥答啥,事还是你办
│ 代表:ChatGPT 基础版 · 豆包 · 文心一言
│
│ 📝 文本补全 ← 只补文字
│ 像智能输入法:你打一半它猜后面
│ 代表:GPT-3 API 时代
└──────────────────────────────→ 时间演进
上面一级包含下面所有能力。
Agent 是目前的顶部。
关键分界线在"谁动手":
- 线下面:AI 给答案/建议,你动手
- 线上面:AI 动手,你验收
04 · 同一任务,五种反应
以"帮我办周末生日聚会"为例。
| 形态 | 反应 | 你还要做什么 |
|---|---|---|
| 📝 文本补全 | 你打"生日聚会要准备 __",它补上"蛋糕、礼物、餐厅" | 所有事全做 |
| 💬 ChatBot | "推荐三家包间餐厅:A、B、C" | 订餐厅、买蛋糕、发邀请、处理问题 |
| ✍️ Copilot Lite | 给你写好邀请函草稿 | 订餐厅、发邀请、其他 |
| 🧑💻 Copilot | 你说"订 A 餐厅 18:00",它调 OpenTable 下单 | 每一步你来指挥 |
| 🤖 Agent | "好的"------20 分钟后给你完整汇报 | 验收 |
这个差别在开发场景也完全一样。
让 AI "修一下登录报错":
- ChatBot:告诉你"可能是 token 过期"(你还得自己查代码)
- Copilot:你说"改这个函数",它改,你 Accept
- Agent :搜代码 → 定位问题 → 改 5 个文件 → 跑测试 → 提 PR
05 · Agent 的 4 大组件(必须记住)
不管你让 Agent 办生日会,还是让它修 bug,拆开看都是这 4 块:
┌──────────────────────────────────────┐
│ 🤖 AI Agent │
│ │
│ ┌──────┐ ┌─────────────┐ │
│ │ 大脑 │ ◄────► │ 记忆 │ │
│ │ LLM │ │ (上下文) │ │
│ └──┬───┘ └─────────────┘ │
│ │ │
│ │ 决策 │
│ ▼ │
│ ┌──────┐ ┌─────────────┐ │
│ │ 循环 │ ◄────► │ 工具箱 │ │
│ │Loop │ 执行 │ (Tools) │ │
│ └──────┘ └─────────────┘ │
│ │
└──────────────────────────────────────┘
翻译成管家的类比
- 大脑(LLM):管家的脑子------GPT-4 / Claude / Gemini
- 工具箱(Tools):管家的手脚------打电话、发邮件、订餐、下单
- 记忆(Context):管家的小本子------主人的偏好、之前说过啥
- 循环(Loop) :管家的工作方式------"打电话→收到回复→调整方案→再打电话"的反复
Agent 和 ChatBot 最大的区别就在第 4 点。
- ChatBot:一轮问答结束(像外卖 App 给你推荐完就没事了)
- Agent:一次任务可以循环 20 次(像管家要打 10 通电话才能搞定一个饭局)
06 · "循环"到底是啥?一个具体例子
场景:你对 Agent 说"帮我安排周末带娃去游乐园"
ChatBot 的做法(一轮结束)
"北京适合 5 岁小孩的游乐园有:欢乐谷、石景山游乐园、嘉年华......"
给完建议,完事。
你还得查天气、查人流、订票、安排午餐、查路线。
Agent 的做法(多轮循环)
Round 1:
脑子:先查周末天气
做:搜索("北京周末天气")
看到:周六晴,周日大雨
Round 2:
脑子:那就周六去。看哪家游乐园合适
做:搜索("北京适合5岁小孩的游乐园")
看到:欢乐谷、石景山、嘉年华
Round 3:
脑子:周六人多吗?查一下客流
做:搜索("欢乐谷周六客流")
看到:建议上午去,下午排队超长
Round 4:
脑子:定方案,告诉主人
做:输出初版方案
看到:主人回复"加上午餐安排"
Round 5:
脑子:找附近亲子餐厅
做:搜索("欢乐谷附近亲子餐厅")
看到:3 家可选
Round 6:
脑子:整理最终方案
做:输出完整行程(出门时间/路线/门票/餐厅/回家时间)
6 轮循环,每轮都在做"思考→行动→观察→再思考"。
这就是 Agent 的灵魂。
📌 对应到开发场景:让 Agent "修登录报错",它会循环"搜索错误 → 定位文件 → 读代码 → 改代码 → 跑测试 → 修到通过"------模式一模一样。
这个思考模式有个学名叫 ReAct(Reason + Act),下一篇细讲。
07 · 主流 Agent 产品地图
这张表帮你建立"Agent 产品地图":
| 产品 | 定位 | 适合谁 | 价位 |
|---|---|---|---|
| Claude Code | 编程 Agent | 开发者 | $20-200/月 |
| Warp | 终端 Agent | 开发者、运维 | 免费-$40/月 |
| Cursor | IDE Agent | 开发者 | $20/月 |
| Devin | 软件工程 Agent | 企业团队 | $500/月 |
| AutoGPT | 通用 Agent(祖师爷) | 研究者 | 开源 |
| Dify / Coze | 低代码 Agent 平台 | 产品、运营 | 免费-付费 |
| 智谱清言 / Kimi 智能体 | 国内通用 Agent | 大众用户 | 免费-付费 |
我自己的用法
我最近半年每天都在用这几个,踩坑总结出一个朴素指南:
- 写代码 → Cursor / Claude Code / Warp 三选一看偏好。我自己 70% 时间在 Claude Code,30% 在 Warp(终端重度依赖)
- 日常帮办事(订票、查资料、写报告)→ Claude / ChatGPT / 国内各家通用智能体
- 不懂代码做 Agent → Dify / Coze(国内首选,拖拽搭建)
- 企业级复杂任务 → Devin(贵但能扛事,500/月不是给个人的)
踩过的坑:
早期我以为"Agent 越贵越牛",花 200 刀一个月开 Claude Max,结果发现 80% 的事 20 刀的版本就能干。
Agent 的价值不在模型,在"适配你场景的工作流"。
08 · 为啥所有产品都在卷 Agent?
2023 年大家还在做 ChatBot。
2024 年头部产品全在卷 Agent。
为啥?
商业价值天差地别。
| 形态 | 用户做的事 | 愿意付的价 | 定价锚 |
|---|---|---|---|
| ChatBot | "查资料、写文案" | $20/月 | SaaS 工具(几十块/月) |
| Copilot | "辅助我做事" | $20/月 | SaaS 工具(几十块/月) |
| Agent | "替我完成整个任务" | $200-500/月 | 人力成本(月薪几万) |
能自主干活的 AI,承接的是人力,不是"工具"。
这解释了为什么 Devin 敢收 $500/月------它对标的是初级工程师。
回到生日聚会的例子:
- ChatBot 给你推荐餐厅------值月付 50 块(一个 App 会员的价)
- Agent 替你全程办完聚会------值月付 2000 块(一个兼职助理的价)
差 40 倍,就差在"谁动手"。
09 · 你能带走什么
读完这篇,你应该能回答的 3 个问题
✅ Agent vs ChatGPT 的核心差异:谁动手(AI 还是你)
✅ Agent 的 4 大组件 :大脑 + 工具箱 + 记忆 + 循环(关键)
✅ 为什么 Agent 是商业趋势:承接的是人力,不是工具
下次评估 AI 产品时,问自己 3 个问题
- 它能自主调用工具吗?(不是只给建议)
- 它能在一次任务中循环多轮吗?(不是一问一答)
- 它的定价锚是"人力"还是"工具"?
下次被问"我们要不要做 Agent 功能"时
用外卖/助理/管家的比喻问回去:
- 场景是"给答案"(问答、推荐、科普)→ 做 ChatBot 够了,别过度设计
- 场景是"你给建议,他动手"(营销文案初稿、代码补全)→ 做 Copilot
- 场景是"替他干完整件事"(自动化运维、自主完成报告、办理流程)→ 做 Agent
需求不匹配形态,做得再好也没价值。
给问"北京天气"的用户一个管家,大材小用。
给问"办生日会"的用户一个外卖 App,用户会骂街。
10 · 下一篇预告
02 · Agent 的"思考回路"长啥样?
所有 Agent 产品共用的大脑------ReAct 循环。
你说"帮我规划周末带娃",AI 内心到底转了几圈?
像装修师傅现场施工------边看边量边调。
对比 ReAct / Plan-and-Execute / Tree of Thoughts 三种主流思考模式,告诉你各自的适用场景。
一句话记忆锚点
🎯 会说话的 AI ≠ 会干活的 AI。就像外卖 App 不等于私人管家,差别不在聪明程度,在"谁动手"。
路易乔布斯 © 2026 | AI Agent 通识课 · 第 1 篇 / 共 9 篇